博弈論
賽局理論(英語:game theory),又譯為對策論,或者博弈論,經濟學的一個分支,1944年馮·諾伊曼與奧斯卡·摩根斯特恩 合著《博弈論與經濟行為》,標誌著現代系統博弈理論的的初步形成,因此他被稱為「博弈論之父」。博弈論被認為是20世紀經濟學最偉大的成果之一。目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈)間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。
目錄
概述
博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以它們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境。
具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中鬥爭各方是否存在着最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。
生物學家使用博弈理論來理解和預測演化(論)的某些結果。例如,John Maynard Smith和George R. Price在1973年發表於《自然》雜誌上的論文中提出的「evolutionarily stable strategy」的這個概念就是使用了博弈理論。還可以參見演化博弈理論和行為生態學(behavioral ecology)。
數學定義
對於「博弈」(game)有不少可以互換的定義。這裡給出簡短的介紹和相互關係的說明。
範式博弈(Normal form game)
範式博弈又被譯為正則形式的博弈、策略型賽局或標準型賽局。
設定<math> \mathrm{N} </math>是一個「參與者」(players)的集合。對於每一個「參與者」<math> i \in \mathrm{N} </math>都有一個給定的「策略」集合<math> \Sigma\ ^i </math>博弈(遊戲)是一個函數,定義為:
- <math> \pi\ : \prod_{i\in \mathrm{N}} \Sigma\ ^i \to \mathbb{R}^\mathrm{N}</math>也就是說,如果我們知道了參與者的策略集合是什麼,那麼就可以有一個實數值與之對應。我們可以把上面的方程拆成兩個方程來進一步把它一般化。一個方程是正則形式(Normal form game)的參與者方程,描述策略規定結果的方式。另外一個方程描寫參與者對於結果(outcome)集合的偏好(preference)。也就是:
- <math> \pi\ : \prod_{i \in \mathrm{N}} \Sigma\ ^i \to \Gamma\ </math>
這裡<math> \Gamma\ </math>是遊戲(博弈)的結果集合(outcome set)。對於每一個參與者<math> i\in \mathrm{N} </math>都有一個偏好函數(preference function)
- <math> \nu\ ^i : \Gamma\ \to \mathbb{R} </math>.
展開形式的博弈(Extensive form game)
展開形式的博弈又可譯為擴展形式的博弈、擴展式賽局或擴展型賽局。
正則形式的定義為數學家們提供了「均衡」(equilibria)問題的研究一個容易使用的表達式。因為它避免了怎麼計算「策略」的問題,也就是說遊戲是怎麼進行的問題。
若要考慮遊戲是如何進行的,展開形式的博弈是一個比較方便的表達式。這個形式與組合博弈論關係密切。這個定義通過一個樹的形式給定。在樹的每一個節點(vertex),不同的參與者選擇一個邊(edge)。
博弈論簡史
對於博弈論的研究開始於恩斯特·策梅洛(1913)、埃米爾·博雷爾(1921)及馮·諾伊曼(1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(1944,1947)首次將其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(1950,1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。
約翰·福布斯·納什、約翰·C·海薩尼及萊因哈德·澤爾騰因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎。羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯及阿里爾·魯賓斯坦對於博弈論也做出重大貢獻。
博弈分類
博弈的分類根據不同的基準也有不同的分類。一般認為,博弈主要可以分為合作博弈和非合作博弈。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。
從行為的時間序列性,博弈論進一步分為兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:「囚徒困境」就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈。
按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的準確信息,在這種情況下進行的博弈就是不完全信息博弈。
目前經濟學家們現在所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論複雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四種博弈相對應的均衡概念為:納什均衡、子博弈精煉納什均衡、貝葉斯納什均衡、精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。
博弈論還有很多分類,比如:以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;以表現形式也可以分為一般型(戰略型)或者展開型,等等。
博弈論相關概念
參考書目
- Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0-691-01193-1
- Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
- Osborne, M. and A. Rubinstein,1994,A Course in Game Theory, Cambridge and London: The MIT Press.
- 岡田章,1996,『ゲーム理論』東京:有斐閣 ISBN 4-641-06794-5
- 金子守 『ゲーム理論と蒟蒻問答』 日本評論社、2003年4月。ISBN 4-535-55288-6
- 川西諭 『ゲーム理論の思考法』 中経出版、2009年9月。ISBN 978-4-8061-3470-1
- Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0-465-02121-2
- Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0-691-01567-8
- Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0-393-97421-9
- Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3-492-02151-4
- Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0-415-25095-1
- Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0-521-81462-6
- Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3-528-03214-6
外部鏈接
- 聯盟博弈論在通信系統中的應用(英文)- Tutorial written by Prof. Debbah, head of the Alcatel-Lucent Chair on flexible radio
- Economics and Language, by Ariel Rubinstein
- Bargaining and Markets, by Osborne, M. and A. Rubinstein