求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

嚴格優勢策略檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋

來自 搜狐網 的圖片

嚴格優勢策略是一個專有名詞。

中國文字是歷史上最古老的文字之一[1]。也是至今通行的世界上最古老的文字。世界上還沒有任何一種文字像漢字這樣經久不衰。 從甲骨文發展到今天的漢字,已經有數千年的歷史。文字的發展經過了甲骨文、金文、大篆、小篆、隸書[2]、草書、楷書、行書等書體演變。

名詞解釋

全面的嚴格的優勢策略簡稱嚴格優勢策略(strictly dominant strategy)

什麼是嚴格優勢策略

所謂嚴格優勢策略是指不論對方採取什麼策略,我採取的這個策略總比採取其他任何策略都好的策略。

所謂的嚴格劣勢策略是指被全面的嚴格優勢策略壓住的那個策略,也就是說不是嚴格優勢策略以外的策略。

所謂的雙方優勢策略則是指雙方利益總和最大的策略。

嚴格優勢策略舉例分析

一、經典的囚徒困境

1950年,由就職於蘭德公司的梅里爾·弗拉德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問阿爾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢舉對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

用表格概述如下:

甲沉默(合作) 甲認罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年

乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年

如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。

囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:

若對方沉默、背叛會讓我獲釋,所以會選擇背叛。

若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。 二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑2年。

這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判決均比合作為高,總體利益較合作為低。這就是「困境」所在。例子漂亮地證明了:非零和博弈中,帕累托最優和納什均衡是相衝突的。

在這幾種結果對比中,甲選擇坦白是他的嚴格最優策略,因為入獄2年比入獄10年要好,釋放比入獄2年也要好。所以不論乙採取什麼樣的策略,甲都會選擇坦白,用中國的古話說叫首先處於「不敗之地」。同樣,乙也會作如此推斷。最終的結果,雙方都會選擇坦白,選擇坦白是雙方的嚴格優勢策略,沉默則是雙方的嚴格劣勢策略,每個囚徒都不會採取對自己明顯不利的嚴格劣勢策略。

二、智豬博弈理論

智豬博弈理論為非合作博弈論創始人、諾貝爾經濟學獎得主納什提出的經典博弈案例,適用於在經濟領域中大企業和小企業之間的關係處理。

該理論的前提是一個假設。假設豬圈裡有兩頭豬,一頭大豬,一頭小豬。

豬圈很長,一頭有一踏板,另一頭是飼料的出口和食槽。豬每踩一下踏板,另一邊就會有相當於10份的豬食進槽,但是踩踏板以後跑到食槽所需要付出的「勞動」,加起來要消耗相當於2份的豬食。

問題是踏板和食槽分置籠子的兩端,如果有一隻豬去踩踏板,另一隻豬就有機會搶先吃到另一邊落下的食物。踩踏板的豬付出勞動跑到食槽的時候,坐享其成的另一頭豬早已吃了不少。

「籠中豬」博弈的具體情況如下:如果兩隻豬同時踩踏板,同時跑向食槽,大豬吃進7份,得益5份,小豬吃進3份,實得1份;如果大豬踩踏板後跑向食槽,這時小豬搶先,吃進4份,實得4份,大豬吃進6份,付出2份,得益4份;如果大豬等待,小豬踩踏板,大豬先吃,吃進9份,得益9份,小豬吃進1份,但是付出了2份,實得-1份;如果雙方都懶得動,所得都是0。

利益分配格局決定兩頭豬的理性選擇:小豬踩踏板只能吃到一份,不踩踏板反而能吃上4份。對小豬而言,無論大豬是否踩動踏板,小豬將選擇「搭便車」策略,也就是舒舒服服地等在食槽邊,這是最好的選擇。

現在來看大豬。由於小豬有「等待」這個優勢策略,大豬只剩下了兩個選擇:等待一份不得;踩踏板得到4份。所以「等待」就變成了大豬的劣勢策略,當大豬知道小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,只好為一點殘羹不知疲倦地奔忙於踏板和食槽之間。

三、關於企業價格策略

我們來看兩個企業關於價格策略的例子。假定兩個企業都採取低價,可以各得30億元利潤;如果都採取高價,各得50億元的利潤;如果一家採取低價而另一家採取高價,那麼價格高者利潤為10億元(市場份額損失較大),而另一家因為多銷將利潤上升到60億元。究竟兩家企業會採取什麼價格策略呢?

這個博弈的格局與「囚徒困境」博弈的格局是一樣的,按照上述分析,雙方的優勢策略是雙方都實行高價,結果雙方都能獲得各50億元的利潤,這是得到總和最大的策略。雙方的嚴格優勢策略是都實行低價,而雙方的嚴格劣勢策略則是都實行高價。對於兩個企業來說,高價都是嚴格劣勢策略,而採取低價策略都是嚴格優勢策略,每個企業都以對方為敵手,只關心自己的利益,在兩家企業中,一方降價的結果,必然導致另一方也降價跟隨,最終形成價格大戰。如果雙方通過合作起來,爭取雙方的優勢策略,避開都採取各自的嚴格優勢策略形成價格大戰,這對兩個企業都有意義,這我們稱之為「雙贏對局」。

參考文獻