猜謎博弈
我們來玩一個這樣的遊戲,在一張白紙上寫上一個字,這個字可以寫的是“黑”,也可以寫的是“白”,我寫好後,你來猜這個字。如果我寫“黑”被你猜對了,我給你15元。如果我寫“白”被你猜對了,我給你5元。如果我寫“黑”你猜“白”或我寫“白”你猜“黑”(總之隻要是你猜錯了),你都給我10元(見表16.1)。你覺得你猜對的可能性是大於50%、等於50%還是小於50%?我想,你的答案一般會是等於50%。但正確答案卻是你猜對的可能性大於50%。這是為什麽呢?原因後續揭曉。
表16.1 猜謎遊戲
既然你猜對的可能性會大於50%,那麽這個遊戲對你我來說公平嗎?所謂的公平遊戲,就是指雙方在博弈中各自的期望收益都是0。也就是說,我們一起玩了100次或1000次以後,理論上兩個人應該是不輸不贏的。如果你覺得這是一個公平的遊戲,或者是對你更有利的遊戲(因為你猜對的概率大於50%)。那麽,我現在就告訴你,這個遊戲對你是不公平的,你會吃虧,並且玩的次數越多,你會虧得越多。此時的你,內心是不是充滿了疑惑?那就讓我們來揭示猜謎博弈背後的玄機。
純策略和混合策略
首先介紹兩個非常重要的概念:純策略和混合策略。
如果一個策略規定參與者在每一個給定信息情況下隻選擇一種特定的行動,我們稱該策略為“純策略”。
如果一個策略規定參與者在給定信息情況下,以某種概率分布隨機地選擇不同的行動,我們稱該策略為“混合策略”。
比如“人不犯我,我不犯人;人若犯我,我必犯人”是一個純策略。“人不犯我,我80%的可能性不犯人;人若犯我,我90%的可能性會犯人”就是一個混合策略。
當然,每個純策略其實都是一個“退化”的混合策略,某一特定純策略的概率為1,其他的則為0。完全的混合策略對每個純策略都分配了一個不為零的概率。