按照“概率×收益”的公式进行理性博弈(一)

    斗地主时经常遇到这样一种人,好牌、烂牌都要叫,出牌先捡大的跑,他们还经常以身试法,有炸就炸,结果浑身被炸得遍体鳞伤,本已负债累累,再度债台高筑。此类人多见于“包身工”中,他们在受尽小地主、大地主们的重重压迫后,不堪重负,弥留之际,留下警世之言:冲动是魔鬼。    还有一种人,拿着一手好牌,蹑手蹑脚地轻轻按下2分,看到别人叫满后又因后悔刚才未

  • 真金棋牌游戏: 真金斗地主

    


斗地主时经常遇到这样一种人,好牌、烂牌都要叫,出牌先捡大的跑,他们还经常以身试法,有炸就炸,结果浑身被炸得遍体鳞伤,本已负债累累,再度债台高筑。此类人多见于“包身工”中,他们在受尽小地主、大地主们的重重压迫后,不堪重负,弥留之际,留下警世之言:冲动是魔鬼。

    还有一种人,拿着一手好牌,蹑手蹑脚地轻轻按下2分,看到别人叫满后又因后悔刚才未叫而扼腕叹息。不过,最后还是会为自己赚得的3分欣喜不已。他们常常还有这样的经历,在别人出完后仰天长叹道:哎,原来他没有炸,或刚才要是炸就好了。此类人由于打牌精细,又精于算计,然因小富即安思想严重,使之常受屡战屡胜的大地主们的盘剥。



    第一种人,在经济学中被冠冕堂皇地称为风险喜好者,第二种人则被称为风险规避者。



    斗地主中,这两种类型的人都很难将自己的智慧发挥到极致。因为打上段时间后,对手可以判断出你的风险类型,从而根据你的类型做出相应的决策斗


如一次多走,手中少留牌,待地主按捺不住,狂轰滥炸后,为自己盟家创造机地


会;针对风险规避者,可以把单牌打光,最后留下长连一起甩出,而对手却因为外面没有见到一张6,就固执认为有6666的炸弹。其实,你正是输在了你的习惯上。

    



根据博弈理论,我们首先假定:每个玩家都是理性的,可根据牌的形式分断


析出自己的期望收益,但不能完全掌握对方手中的牌,仅知道某些关键牌可能与的分布概率。这样每局牌的收益(效用)可由得失分数表示。期望收益等于各信


收益与其出现概率的成绩的和。如有两种可能S1、S2,其出现概率为P1、P2,P1+P2=1,则期望收益=S1×P1+S2×P2。

    【例1】

    


甲、乙、丙三人玩斗地主,甲在乙(地主)的下家,乙在丙的下家,乙叫满(3分)。乙先出牌,甲管住,此后一直出牌,其他两人均无上手机会(丙很可能不愿上手),直到甲剩下两张牌,小王和K。此时,甲通过已出过的牌和自己的牌得知外面没有炸,现在面临的决策是:先出K还是先出小王。

    现在我们把甲的收益矩阵写下来。

    


假设:地主有大王的可能性(概率)为2/3,地主无大王的概率为1/3。一般


情况下,地主的牌较好,所以拿大王的概率要大些。

    先出小王,地主有大王时,设取胜的概率为2/3(留一张K还是比较保险的,而且朋友也有机会),期望收益为:

    2


/3×3+(-


1/3)×3=1



    先出小王,地主无大王时,直接取胜,收益为6。外面无炸,盟家出大王搅局不符合理性假定(斗地主规则:地主在第一次出牌后,再未出牌,则分数翻倍)。

    


我们可以得到先出小王的期望收益为:

    1×2/3+6×1/3=


8/


3

    


先出K,地主有大王时,如果地主此时不出大王,则直接取胜;若地主出大王,一旦有机会走单牌,则还会取胜。这说明赢面很大。设取胜的概率为5/6,则期望收益为:

    


5/6


×3+1/6×(-3)=2

    


先出K,地主无大王时,直接取胜,丙因不知道小王在谁手里,且担心压住甲的牌而不会用2来顶,收益为3。

    先出K的期望收益为:



    


2×2/3+3×1/3=7/3。

    


为了迷惑对手,应以8/15的概率选择先出小王,以7/15的概率选择先出K。

    计算过程:3/8÷(8/3+7/3)=


8/15;

                   7/3÷(8/3+7/3)=


7/15;

    


在此类局面多次出现的情况下,如果一直坚持先出小王,或先出K,那很容易让对手掌握你的风险类型。如果你一味地先出小王,则属于风险喜好型,因为它可能得到的收益更大,但风险也大;如果一直先出K,则属于风险规避型,它的期望收益小,但是承担的风险也要小。

    如果你以大于8/15的概率选择小王,则牌局一多,对手可以认为你是风险喜好型,可以找到对付你的办法,因此不能构成均衡。所以最佳的先出小王的概率应该就是8/15,以7/15的概率先出K,是你的最优决策,对手不能判断出你的风险类型,也就无法从你的决策中得利。


100-000-0000

工作时间: 周一9:00~周五18:00

在线留言