维基：利己利人的帕累托最优与纳什均衡 --- 人类社会活动的终极科学指南

发表时间：2016-12-24 22:08

维基百科，自由的百科全书

https://zh.wikipedia.org/wiki/%E5%B8%95%E7%B4%AF%E6%89%98%E6%9C%80%E4%BC%98

本条目没有列出任何参考或来源。（2015年5月4日）
維基百科所有的內容都應該可供查證。请协助添加来自可靠来源的引用以改善这篇条目。无法查证的内容可能被提出异议而移除。

Example of Pareto frontier, given that lower values are preferred to higher values. Point C is not on the Pareto Frontier because it is dominated by both point A and point B.

帕雷托最优（英语：Pareto optimality），或帕雷托最适，也称为帕雷托效率（英语：Pareto efficiency），是经济学中的重要概念，并且在博弈论、工程学和社会科学中有着广泛的应用。與其密切相關的另一個概念是帕雷托改善。

帕雷托最优是指资源分配的一种理想状态。給定固有的一群人和可分配的资源，如果从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕雷托改善。帕雷托最优的狀態就是不可能再有更多的帕雷托改善的狀態；换句话说，不可能再改善某些人的境況，而不使任何其他人受損。

需要指出的是，帕雷托最優只是各種理想態標準中的“最低標準”。也就是說，一種狀態如果尚未達到帕雷托最優，那么它一定是不理想的，因為還存在改進的余地，可以在不損害任何人的前提下使某一些人的福利得到提高。但是一種達到了帕雷托最優的狀態并不一定真的很“理想”。比如說，假設一個社會裡只有一個百萬富翁和一個快餓死的乞丐，如果這個百萬富翁拿出自己財富的萬分之一，就可以使后者免于死亡。但是因為這樣無償的財富轉移損害了富翁的福利（假設這個乞丐沒有什么可以用于回報富翁的資源或服務），所以進行這種財富轉移并不是帕雷托改進，而這個只有一個百萬富翁和一個餓死乞丐的社會可以被認為是帕雷托最優的。（這裡可以與古典功利主義的標準做一比較。按功利主義的標準，理想的狀態是使人們的福利的總和最大化的狀態。如果一個富翁損失很少的福利，卻能夠極大地增加乞丐的福利，使其免于死亡，那么社會的福利總和就增加了，所以從功利主義的角度看，這樣的財富轉移是一種改善，而最初的極端不平等狀態則是不理想的，因為它的福利總和較低。可以看到，帕雷托改進要求在提高某些人福利的時候不能減少任何一個人的福利，而功利主義則允許為了提高福利總和而減少一些人的福利。）

經濟學理論認為，如果市場是完備的和充分競爭的，市場交換的結果一定是帕雷托最优的，并且会同时满足以下3个条件：

交换最优：即使再交易，个人也不能从中得到更大的利益。此时对任意两个消费者，任意两种商品的边际替代率是相同的，且两个消费者的效用同时得到最大化。
生产最优：这个经济体必须在自己的生产可能性边界上。此时对任意两个生产不同产品的生产者，需要投入的两种生产要素的边际技术替代率（MRTS）是相同的，且两个生产者的产量同时得到最大化。
产品混合最优：经济体产出产品的组合必须反映消费者的偏好。此时任意两种商品之间的边际替代率必须与任何生产者在这两种商品之间的边际产品转换率（MRT）相同。

如果一个经济体不是帕雷托最优，则存在一些人可以在不使其他人的境况变坏的情况下使自己的境况变好的情形。普遍认为这样低效的产出的情况是需要避免的，因此帕雷托最优是评价一个经济体和政治方针的非常重要的标准。

但是，如同上面指出的，一個帕雷托最優的經濟系統只是在“最低”的意義上是“理想”的，并不能保證其中沒有貧困或嚴重的貧富差距。

帕雷托最优是以提出这个概念的意大利经济学家帕雷托的名字命名的，帕雷托在他关于经济效率和收入分配的研究中使用了这个概念。

另外，著名的帕雷托法则，则是由约瑟夫?朱兰根据维弗雷多?帕雷托本人当年对意大利20%的人口拥有80%的财产的观察而得推论出来的。

参考文献[编辑]

参见[编辑]

[隐藏] 查论编博弈论专题

定义	正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好

均衡概念	纳什均衡 · 子博弈完美 · 贝叶斯-纳什 · 贝叶斯完美 · 颤抖手完美 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优

策略	优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 串谋

博弈类型	对称博弈 · 完美信息 · 完全信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全球博弈

博弈列表	囚徒困境 · 旅行者困境 · 协调博弈 · 膽小鬼博弈 · 志愿者困境 · 搭便車問題 · 拍卖美元 · 性别战 · 獵鹿賽局 · 賭便士 · 最後通牒賽局 · 少数派博弈 · 石头、剪子、布 · 海盗博弈 · Dictator game · Public goods game · Nash bargaining game · 上校賽局 · 摩擦战 · El Farol Bar problem · 公平分配博弈 · 古諾競爭（Cournot competition） · 死結(Deadlock) · 用餐者困境 · 猜均值的2/3 · 库恩扑克游戏 · Screening game · Signaling game · Trust game · Princess and monster game

定理	极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理

规范控制	GND: 4173334-4

納什均衡點[编辑]

维基百科，自由的百科全书

https://zh.wikipedia.org/wiki/%E7%B4%8D%E4%BB%80%E5%9D%87%E8%A1%A1%E9%BB%9E

納什平衡（英语：Nash equilibrium），又稱為非合作賽局平衡，是在非合作賽局（Non-cooperative game）狀況下的一個概念解，在博弈论中有重要地位，以约翰·納什命名。

如果某情況下無一參與者可以通过獨自行動而增加收益，則此策略組合被稱為納什均衡點^[1]。

例子[编辑]

其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑10年；如果两人均招供，将均被判刑2年。如果两人均不招供，将最有利，只被判刑半年。于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。这时个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯的博弈矩阵		囚犯甲
囚犯的博弈矩阵		招供	不招供
囚犯乙	招供	各判刑2年	甲判刑10年，乙立即释放
囚犯乙	不招供	甲立即释放，乙判刑10年	各判刑半年

基于经济学中“理性经济人”的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事實上，这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”（也叫非合作均衡），換言之，在此情況下，無一參與者可以「獨自行動」（即單方面改變決定）而增加收穫。

学术争议和批评[编辑]

本条目中立性有争议。內容、語調可能帶有明顯的個人觀點或地方色彩。（2007年10月23日）
加上此模板的編輯者需在討論頁說明此文中立性有爭議的原因，以便讓各編輯者討論和改善。
在編輯之前請務必察看讨论页。

第一，纳什的关于非合作博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下卻找不到，因此仍不能解决问题。^{[來源請求]}

第二，纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是，博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为，但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论（有人称之为tiny-scale toy case）。^{[來源請求]}

这个假设的不完善处，可能比假设大家都是合作的更严重。因为在经济学里，一个庞大社会里的人极不可能全部都是合作的，非合作的情况通常在庞大对象的情形中更普遍，而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提，却仍然停留在两三个节点的小规模博弈论中，这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文^[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的，找到纳什均衡点是几乎不可能的事。目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作，证明对某些博弈来说，穷全世界所有计算机之力，在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信，计算机找不到，人类也不可能找到。纳什均衡属于NP问题，Daskalakis证明它属于NP问题的一个子集，不是通常认为的NP-完全问题，而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

不過在同一篇論文裡，Daskalakis也指出，在參與者匿名的情況下，則僅需多項式時間即可逼近纳什均衡。

註[编辑]

^ 若 {displaystyle p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]} $p_{i}(s)=max_{{r_{i}}}[p_{i}(s;r_{i})]$ ，，則納什稱 s 為平衡點(Equilibrium point)。----其中 {displaystyle p_{i}} $p_{i}$ 為參與者 i 的收穫(payoff)，{displaystyle s_{i}} $s_{i}$ 代表所有參與者之策略，{displaystyle r_{i}} $r_{i}$ 代表參與者 i 的一種可能策略，{displaystyle (s;r_{i})} $(s;r_{i})$ 指參與者 i 單方面改變策略成 {displaystyle r_{i}} $r_{i}$ 。 --- P.287, Annals of Mathematics 1951
^ Constantinos Daskalakis, The Complexity of Nash Equilibria

參考[编辑]

《Non-Cooperative Games》,约翰 · 纳什 , The Annals of Mathematics 1951

外部链接[编辑]

纳什博弈论的原理与应用北京晚报 (2002年3月21日)

[隐藏] 查论编博弈论专题

定义	正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好

均衡概念	纳什均衡 · 子博弈完美 · 贝叶斯-纳什 · 贝叶斯完美 · 颤抖手完美 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优

策略	优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 串谋

博弈类型	对称博弈 · 完美信息 · 完全信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全球博弈

博弈列表	囚徒困境 · 旅行者困境 · 协调博弈 · 膽小鬼博弈 · 志愿者困境 · 搭便車問題 · 拍卖美元 · 性别战 · 獵鹿賽局 · 賭便士 · 最後通牒賽局 · 少数派博弈 · 石头、剪子、布 · 海盗博弈 · Dictator game · Public goods game · Nash bargaining game · 上校賽局 · 摩擦战 · El Farol Bar problem · 公平分配博弈 · 古諾競爭（Cournot competition） · 死結(Deadlock) · 用餐者困境 · 猜均值的2/3 · 库恩扑克游戏 · Screening game · Signaling game · Trust game · Princess and monster game

定理	极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理

分类：

博弈论