文章
技术

如何在“直观”上的数学期望是0甚至是负的时候赚钱

inferior 北大未名

答案是你的选择对后续收益有影响,而且你有选择随时中止的权利。

很久以前看过一个视频,是耶鲁的公开课,因为时间过久找不到当时的视频了,如果有别人看过可以帮忙贴上来。

思考一个问题:现在有一副牌,52张,一半红一半黑。从中抽牌,且不放回。抽到红的赢一块钱,黑的输一块钱,你可以选择随时停止这一局游戏,将所有牌洗牌重新开始。请问采用最佳策略你期望每局平均赢多少钱?

答案是

2.6元。

具体计算就不写了,这里说一下思路。
思考几个简单的情况。
现在牌堆里只剩N张黑的,在这种情况下你的期望是什么?当然不是输N块钱,因为你可以直接不玩了睡大觉。是0.
现在牌堆里只剩1张黑的1张红的,在这种情况下你的期望是什么?当然不是0,因为你有1/2的几率抽到红的,然后牌堆只剩黑的,不玩了睡大觉。1/2几率抽到黑的,这时候因为只剩红的所以一定抽完。于是,1张黑的1张红的期望实际是1/2*1+1/2*0=1/2。
以此类推,在某种情况下的期望,实际上是:抽到红的概率乘以(这张红的收益(+1)加上牌堆移去一张红牌后的期望),加上抽到黑的概率乘以(这张黑的收益(-1)加上牌堆移去一张黑牌后的期望)
递归下去,我们最后总会落到边界条件,即全红或者全黑,这种情况下的收益是显然的。
于是我们可以计算出牌堆中有任意数目的红牌和黑牌的情况下真正的数学期望。
菜单
  1. 邹韬奋 外逃贪官CA
    邹韬奋   虽然韬光养晦,亦当奋起而争(拜登永不为奴:h.2047.one)

    正是赌21点的技巧。牌对庄家有利的时候你就不玩了睡大觉。

  2. 爱狗却养猫 饭丝
    爱狗却养猫  

    非常感谢提供思路。用R写了一个公式(我不太会python不过R语言应该和python有点像;代码废写的公式很难看,见谅……),可以计算特定红黑牌数下的收益。

    ExpBen = function(redn,blackn){
      v = matrix(NA,redn+1,blackn+1)
      rownames(v) = c(0:redn)
      colnames(v) = c(0:blackn)
      for (r in 0:redn){
        if (r == 0) {
          v[r+1,] = 0
        } else {
          for (b in 0:blackn){
            if (b == 0) {
              v[r+1,b+1] = r
            } else {
              p = (r/(r+b)*(1+v[r,b+1]) + b/(r+b)*(-1+v[r+1,b]))
              if (p > 0){
                v[r+1,b+1] = p
              } else {
                for (b2 in b:blackn){
                  v[r+1,b2+1] = 0
                }
                break
              }
            }
          }
        }
      }
      return(list("prob"=v[redn+1,blackn+1], "mat"=v))
    }
    

    可以看到最终收益和收益矩阵,例如红牌6张黑牌9张的情况最终收益为0(应该弃牌);矩阵中每行0之前为STOP的临界值,如当红牌4张时黑牌6张以上则应STOP。

    ExpBen(6,9)
    $prob
    [1] 0
    
    $mat
      0        1         2        3         4         5          6         7         8 9
    0 0 0.000000 0.0000000 0.000000 0.0000000 0.0000000 0.00000000 0.0000000 0.0000000 0
    1 1 0.500000 0.0000000 0.000000 0.0000000 0.0000000 0.00000000 0.0000000 0.0000000 0
    2 2 1.333333 0.6666667 0.200000 0.0000000 0.0000000 0.00000000 0.0000000 0.0000000 0
    3 3 2.250000 1.5000000 0.850000 0.3428571 0.0000000 0.00000000 0.0000000 0.0000000 0
    4 4 3.200000 2.4000000 1.657143 1.0000000 0.4444444 0.06666667 0.0000000 0.0000000 0
    5 5 4.166667 3.3333333 2.535714 1.7936508 1.1190476 0.54978355 0.1540404 0.0000000 0
    6 6 5.142857 4.2857143 3.452381 2.6571429 1.9090909 1.22943723 0.6561772 0.2321012 0
    

    各26张的情况

    ExpBen(26,26)$prob
    2.624476
    
  3. Neko 守序善良
    Neko   人类社会永远在变化。

    好问题,而且很有趣。

    像我这种不经常思考的俗人,会去想期望上是0,所以应该赚不到这种事。然鹅事实就是摆在这里,假如有不对称信息和选择权,人就是能从零和博弈中赚到钱。这个角度上,“经济是一种负熵”的后现代经济学观点有了一个简洁有力的例证。

  4. libgen 图书馆革命
    libgen   天堂应该是图书馆的模样。一个阅读诗歌的人要比不读诗歌的人更难被战胜。创造是一种拯救。创造拯救了创造者本身。

    我感到很伤心,希望你能回来。

    还记得你说特意买了树莓派用来键政的,如今却决绝地离开。还看到昨天你依然在出题,为这个小破站贡献了不少心血和热忱。还想起你特意提醒我题目上的疏漏,在此表一声感谢。

    时间永在流逝,那些美好的记忆既难得,又是难忘的,尤其是在这么一个黑暗时代,在这么一个小破站上。

    希望你能不计前嫌,大家都热切地盼望着你回来。

  5. 邹韬奋 外逃贪官CA
    邹韬奋   虽然韬光养晦,亦当奋起而争(拜登永不为奴:h.2047.one)

    "特意买了树莓派用来键政"

    好专业

  6. 在之中  

    @libgen #131829

    一晃数年,不好好搜集你的盗版书。

    老忍不住和站长用户搅在一块。

    什么电子青年网刊怪物酒馆小破站。

    喜欢的一个也回不来,讨厌的一个也不愿走。

    有点音信,也是官派删贴。

    书上总是白多于黑,生活总是明少于暗。

    对你这种,我只能说:请受我一揖~

  7. 爱狗却养猫 饭丝
    爱狗却养猫  

    盗版书也好,站长用户也好,都在用爱发电。

    只不过每个人爱的人或者东西,未必相同,未必相通。

    喜欢的,讨厌的,白的,黑的,明的,暗的。

    无意之语,因其隐晦,有时也能伤心。

    我不了解别人的感情,我只能说我自己。

  8. libgen 图书馆革命
    libgen   天堂应该是图书馆的模样。一个阅读诗歌的人要比不读诗歌的人更难被战胜。创造是一种拯救。创造拯救了创造者本身。
  9. 邹韬奋 外逃贪官CA
    邹韬奋   虽然韬光养晦,亦当奋起而争(拜登永不为奴:h.2047.one)
  10. 在之中