不知道各位看過《美麗心靈》這部電影沒?這部電影主角的原型就是納什均衡的發現者 約翰·福布斯·納什 。電影裡有這樣一個橋段:
幾個年輕的學者在酒吧找樂子,百無聊賴之際,一絕世美女突然降臨,身邊還有4位女性夥伴。 學者們的荷爾蒙被迅速燃起,於是他們都躍躍欲試,紛紛準備去找美女搭訕。
其中一位學者叫納什,突然說道:你們想過沒有,如果大家都去搭訕,一定會吊高那美女的胃口,她可能誰都不搭理。你們又不甘心,總不能沒有伴吧,於是走向美女的同伴,可美女的同伴會接受你們嗎?她們會說:“走開!人家看不上你,你才來找老娘的!”所以,這種結果就是:大家都沒有伴,我們的 收益總和最小 。
可是,我們換一種策略,都不去追求那個最美的,而是分別找她的同伴,那樣我們成功的概率會大很多,我們 幾個人的收益總和也最大 。
納什說完,自己都把自己給驚到了,他意識到自己發現了一個偉大的理論,馬上回到宿舍用數學公式證明了這個理論。這個理論的名字就是 “納什均衡” ,納什也因此獲得了諾貝爾經濟學獎。
納什均衡思維模型
納什均衡就是指在一個非合作博弈裡,找出一群組原則,取得對立雙方認同,讓一方的最適反應恰好是另一方的最適反應,這時,即使雙方立場對立,也還是能找出交集,實現均衡。
如上面電影裡的策略就是, 都不去 追求那個最美的,而是分別找她的同伴, 繼而每個人都有女伴,博弈雙方獲得均衡,總收益實現最大化。
因此,納什均衡最為關鍵的一點在於,基於什麼樣的原則去尋找到那樣一群組原則?有以下兩點原則:
一是對自己最有利,即從自身的利益出發。 就如心理學家卡爾·羅傑斯所說:越是個人的東西越普遍;即當我們從自身利益出發時,這個利益其實也是其他人想追求的利益,所以基於自身利益選擇出的策略,在很大程度上能取得博弈雙方的認同,如電影裡,每個人都想獲得女伴。
二是要相信一定有這樣一個組合,即相信博弈的雙方為了獲得自身利益,都會遵守或者選擇這個策略。如,電影中博弈雙方都相信對方不會去找那位漂亮的女孩,如此才能實現均衡。
案 例
一、智豬博弈
智豬博弈 是一個著名的納什均衡案例:
假設豬圈裡有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有一定單位的豬食進槽,兩頭隔得很遠。
假設兩頭豬都是理性的豬,也就是說,它們都有著 認識和實現自身利益 的豬。再假設豬每次按動按鈕都會有10個單位的飼料進入豬槽,但是並不是白白得到飼料的,豬在按按鈕以及跑到食槽要付出的勞動會消耗相當於2個單位飼料的能量。
還有就是當一頭豬按了按鈕之後再跑回食槽的時候吃到的東西比另一頭豬要少。也就是說,按按鈕的豬不但要消耗2單位飼料的能量,還比等待的那個豬吃得少。
再來看具體的情況:
1. 如果 大豬去按按鈕,小豬等待,大豬能吃到6份飼料,小豬4份,那麼大豬消耗掉2份,最後大豬和小豬的收益為4∶4;
2. 如果 小豬去按按鈕,大豬等待,大豬能吃到9份飼料,小豬1份,那麼小豬消耗掉2份,最後大豬和小豬的收益為9∶-1;
3. 若 兩頭豬同時跑向按鈕,那麼大豬可以吃到7份飼料,而小豬可以吃到3份飼料,最後大豬和小豬的收益為5∶1;
4. 最後 一種情況就是兩頭豬都不動,那他們當然都吃不到東西,兩頭豬的收益就為0。
我們可以看到,當採用大豬按按鈕,小豬等待的策略時,這個時候,大豬和小豬的淨收益都是4個單位的飼料。
而且我們還可以看到的一個奇怪現象就是,如果小豬主動勞動,那麼小豬的收益居然是-1,對於小豬來說,這比都躺在那兒還要吃虧,當然小豬是不會幹的。
那麼就是說, 如果是小豬按動按鈕,則大豬會在小豬到達食槽前把食物全部吃光,如果是大豬按動按鈕,則大豬到達食槽時只能和小豬搶食剩下的一些殘羹冷炙。
既然小豬勞動不得食,則小豬不會主動按鈕,而大豬為了生存,盡 管只能吃到一部分,還是會選擇勞動(按鈕)。 那麼,在兩頭豬都有智慧的前提下,最終結果是 小豬選擇等待,只要搭順風車就可以了。
對於大豬來說,小豬有了這個選擇,那麼大豬就只有兩種結果了,要麼也不動,那麼兩頭豬就等死了,要是自己去按按鈕的話還有4份飼料可以吃。 所以,對大豬來說,等待是一種劣勢的策略。
我們已經說過了,假設了大豬和小豬都是理性的智豬,那麼當大豬知道小豬不會主動去按按鈕的時候,它親自去動手總比不動要強,因此 他會為了自己的利益而主動地奔走於踏板和食槽之間。
不管大豬採取什麼樣的策略,對於小豬來說,勞動都是一個劣勢策略,因此最開始就可以除掉這種可能。在剔除了小豬的按按鈕這種方案以後,大豬就只有兩種方案可供選擇。在這兩種策略裡面,等待是一種絕對的劣勢策略,所以也被剔除掉。
所以在剩下的策略裡面就只剩下小豬等待、大豬按按鈕這個可以供選擇的策略了,這就是智豬博弈的最後均衡。
結論就是: 對於小豬來說,如果不仔細思考就開始勞動的話,會得不到任何好處。所以,有時候慢一點反倒是好的。
二、囚徒困境
囚徒困境說的是兩個嫌疑犯甲和乙私入民宅聯手作案,被警方逮住但未獲證據。 警方於是將兩個嫌疑犯分開審訊。
警官分別告訴兩個人犯:
1. 如果你招供,而對方不招供,則你將被判刑3個月,對方將被判刑10年;
2. 若兩人都不招供則因未獲證據但私入民宅將各拘留1年;
3. 如果兩人均招供,每人將被判刑5年。
於是,兩個人同時陷入招供還是不招供的兩難處境。
結果是, 儘管甲不知乙是否招供,但他認 為自己選擇“招供”最好, 因而甲會選擇“招供”,同樣乙也會選擇“招供”, 兩人各判5年。
在上述囚徒困境例子中,兩個囚犯 符合自己利益的選擇是坦白招供 ,但是其實這不是真正的納什均衡,因為兩個囚徒的本質需求是判刑最小,如果兩個人都是 理性的 ,堅持其本質需求 “判刑最小” ,且相信最終這個 “判刑最小” 的結果能實現,他們就會選擇: 都 不招供,最後實現各拘留1年的結果,即實現真正的納什均衡。
啟 發
以上,我們知道 納什均衡思維模型 是一個提醒人要保持理性、 做對自己最有利的且相信其能實現的決策的思維模型。那麼,我們該如何更好地運用該模型呢?以下談談我的幾點啟發。
一、堅持理性
就如前面的案例,理性是納什均衡的關鍵。即要理性分析各種可能,並計算出各種可能對自己的和對方的利益值。所以,遇事慢一點,給理性思考預留時間,堅持理性。
二、從自身利益出發
記住 卡爾·羅傑斯和馬斯洛所說的話:越是個人的東西越普遍,對一個人深層本性的認識,同時也是對普遍人類本性的認識。從自身利益出發,記住自己最想要的一般也是對方最想要的。如此我們便能基於此找出最優的決策。
三、相信“相信”的力量
囚徒困境為什麼沒有實現真正的納什均衡呢?那是因為他們不相信這個“判刑最小的結果”能實現。其實,納什均衡 具有預測的自我實現的特徵, 即如果博弈雙方都認為這個結果會出現,那這個結果就會真的出現。所以,我們要相信我們的“相信”,就如泰戈爾曾說的: 有時候,不是因為看到了才相信,而是因為相信才看見。
總 結
納什均衡思維模型, 一個非合作博弈下,即對立雙方沒有任何合作意願時,實現均衡的思維模型。堅持理性、從自身利益出發、相信“相信”的力量 ,可以幫助我們更好的運用該模型。
留言列表