AI的开端:图灵机
殉道者图灵
1950年夏,英国曼彻斯特大学的一间小办公室,艾伦·图灵坐在打字机前。
窗外是战后灰蒙蒙的天空,刚从国家物理实验室调来,负责台“曼彻斯特马克一号”的电脑,大得像间屋子几排机柜占满房间的家伙。成千上万只电子管在闪烁,功耗与热流把机房烘得像头喘气的怪兽。
图灵在写一篇论文,《计算机器与智能》。
开头问:机器能思考吗?
这段时间一直在思考,而无法获得答案。他没等读者陷进哲学泥潭,就转了个弯。
图灵脑洞大开,海阔天空,想象和设计了一个派对游戏。
三个玩家:男(A)、女(B)、询问者(C)。A和B隔在不同房间,C通过打字机问问题,想猜出谁是男谁是女。A会撒谎迷惑C,B会说实话帮忙。
游戏玩得热闹,C却常常猜错。
图灵再问,如果把A换成台机器,会怎样?如果机器能像B一样回答,让C猜不出谁是机器、谁是人,那机器算不算“思考”?
他没叫它“测试”,用了“模仿游戏”(Imitation Game)。
图灵估计,即使再过五十年,到2000年左右,在五分钟的文字对话后,询问者对“谁是机器”的正确识别率,可能也就七成上下。他写这些时,电脑还只会算数字,而且非常非常的慢。
那时候,没人想过它有能力“聊天”,或者有这样一天到来的可能性。但图灵看得更远:如果机器行为和人无法区分,那“思考”还有必要深挖内部吗?
现在看来,游戏本质上,就是个简单的博弈问题。
图灵的论文,浅看是性别识别,深想,已经为后面的“机器能否思考”铺垫了一个可操作的替代问题。如果稍作变形把玩家A换成机器,B保持为人,询问者C的任务是分辨“哪个是人,哪个是机器”。那么,在原版的男女游戏中,已经隐含了对策论的零和博弈结构:
玩家:A(男,伪装者)、B(女,真诚者)、C(询问者)。
目标:C想正确识别A和B的身份;A想通过撒谎让C猜错;B想通过说实话帮助C猜对。
信息:完全非对称信息,C只能通过文字交流获取线索。
策略空间:A的最优策略,是模仿B的回答模式,尽量让自己的回答听起来像女人。B的最优策略,是尽可能展现“典型女性”的回答特征,帮助C区分。C的最优策略,是设计一系列问题,放大A和B在回答风格上的差异,降低被欺骗的概率。
支付(payoff):C猜对得正收益,猜错得负;A诱导猜错得正,B帮助猜对得正。
这正是典型的两人(或多人)零和博弈:A和C的利益完全对立,B的利益与C一致(可以视为C的“盟友”)。A必须在每一次提问-回答的互动中选择最优伪装策略,C则要在有限回合内寻找能最大化区分度的提问序列。
图灵设计的巧妙之处,在于把问题直接迁移到人-机情景:
A → 机器(试图模仿人类回答)
B → 真正的人类
C → 人类询问者
如果机器能在足够多的回合中让C的正确识别率不超过随机猜测(50%),或者接近人类A在原游戏中的欺骗成功率,图灵就认为可以说机器“通过了测试”,从而回避了“机器能否思考”这个形而上学问题,转而用一个可观测、可量化的博弈胜率来替代。
图灵设计的这个模仿游戏不仅是思想实验,更是一个严格定义的博弈论框架:机器与人类询问者进行一场文字版的零和欺骗博弈,机器的目标是最大化被误认为人的概率,询问者的目标则是最小化。测试的均衡结果,机器能否达到人类伪装者的成功率,就成了判断“机器是否能思考”的操作性标准。
图灵本人没有用博弈论术语表述,但这个游戏结构,完全符合现代对策论中“不完全信息动态博弈”的特征,后来也确实被博弈论学者反复分析和形式化。
零和博弈概念最早由约翰·冯·诺伊曼在1928年提出,他在那年发表的论文中证明了两人零和博弈的混合策略均衡和极小极大定理,奠定了该领域的核心数学基础。更早的根源可以追溯到法国数学家埃米尔·博雷尔在1921-1927年间的一些初步想法,但他并未完全形式化。
1944年冯·诺伊曼与奥斯卡·摩根斯坦合著的《博弈论与经济行为》一书出版,将博弈论系统化并应用于经济学和战略决策领域,该概念的流行,在二战后迅速传播到军事、经济学和决策科学中。
到1950年代,博弈论已较为成熟,并在约翰·纳什的贡献下扩展到非零和博弈,但零和博弈的核心框架早在1944年前就已确立。
零和博弈的提出和流行均在图灵1950年论文之前,其本人很可能并没有直接受当时已存在的博弈论文献影响。他的想法更像是独立发展出、从计算与智能哲学角度切入的一种巧妙的操作化方案。
虽然这些思想的发源地都在普林斯顿大学,两者之间似乎是平行演进,由后人发现的深刻联系关系。没有证据表明,是图灵主动借鉴博弈论的结果。
图灵写论文时,38岁。
二战时,他负责团队破译德国的恩尼格玛密码机,救了无数人的性命。由于成果属于绝密,他一直当着无名英雄,不为世界所知,也没有得到表彰。
他深知“模仿”的威力。纳粹宣传靠简单重复操控人心。
他也看到了人类的脆弱,常常被表象欺骗。
对于他,模仿游戏本质上不只是技术问题,还有人性弱点。
如果机器能骗我们,那我们该怎么看自己?
论文发表在期刊上。当时没几个人在意,自然不可能引起轰动。学术圈甚至有人公开嘲笑他异想天开:机器会思考?荒唐!
纵是无风起浪,亦有源头可循。那枚被他随手抛入岁月池塘的小石子,在沉寂多年后,终于荡开了迟到的涟漪。
十六年后ELIZA出现,像是对图灵游戏的回声。
二十二年后,PARRY模拟精神病患者开始和ELIZA“对话”。
后来再后来,就是七十年后的现在,Siri、Alexa、ChatGPT,所有的各种各样稀奇古怪的聊天机器人,都在玩同一个游戏:模仿人类。
可惜,图灵没活到亲眼看到这些的到来。
1936年,24岁的图灵在剑桥大学期间,构思、写作并完成了那篇后来成为经典的论文,《论可计算数及其在判定问题上的应用》,不久后他前往普林斯顿读博,随后论文发表。
论文不仅解决了当时数学界著名的“希尔伯特判定问题”,更重要是它提出了抽象的计算模型,图灵机,奠定了现代计算机科学的理论基础。
图灵机是纯理论、文字描述的抽象模型。图灵在论文中用文字精确定义了这个模型的每一个组成部分和运行规则:一条无限长的纸带,一个读写头,有限的状态集合,一张状态转移表(相当于程序)。
他用数学语言完整描述了它的行为方式。图灵机存在的唯一形式,就是这篇论文里的文字定义和一些简单的示意图(纸带、头、状态表)。只是设计,对他而言,建造成实体不可能也没有价值。纸带是无限长的,读写头永不磨损、移动无限精确、状态切换瞬时完成,这些在物理世界都不可能。即使只计算一个简单的加法,也需要成千上万步,实际运行毫无意义。
图灵创造这个模型的唯一目的,是为了给“什么是可计算的”下一个严格的数学定义,而不是要建造一台实用计算机。图灵机就像数学里的“点”、“直线”、“平面”一样,是种理想化的抽象对象,只存在于定义和证明之中。却能精确刻画现实世界中一类重要现象(算法计算)。
正因为是纯文字描述的抽象模型,后人才能用严格的数学方法证明,所有图灵机等价的计算模型(λ演算、递归函数、Post机等)计算能力相同。某些问题(如停机问题)在任何图灵机上都不可解。
图灵机是计算理论的基石。
一台永远停留在纸上、由纯粹思想构建的机器,却定义了整个数字时代的边界。
复杂度理论、计算理论、可计算性理论都建立在图灵机模型之上。
它为实际计算机的设计提供了有价值的指导,连冯·诺依曼体系结构(存储程序计算机)的核心思想,程序和数据统一存储在内存中,都是直接受图灵机的启发。
它还定义了计算的极限,停机问题、莱斯定理等证明了,某些问题本质上无法用计算机解决,无论硬件多强大。它还启发了现代编程,所有现代编程语言都是“图灵完备”的,即理论上能模拟任何图灵机。
这篇36页的论文,永久改变了人类对“计算”概念的理解。
它证明,一台足够简单的抽象机器,就能拥有与最复杂计算机相同的计算能力。从此之后,计算机科学诞生,成为一门独立、严谨学科。现代每一台计算机,在理论层面上都是台图灵机。
如果说AI有真正的开端,那它就应该是1950年那个下午,当图灵在打字机前,轻轻敲下那行字的一刻:让我们玩一个游戏吧。
【节选自:《AI霸权:纪元启示录》(汪翔著,即将出版)】
