DeepSeek:一场悲剧的预言?
通过开源其模型,DeepSeek 为任何好奇的开发者提供了学习和在节约成本的创新基础上进行开发的机会。[开源人工智能的定义仍在不断发展中。DeepSeek通过发布其代码、模型和技术报告,符合普遍接受的开源定义,但它并未发布数据。其代码采用麻省理工许可证,允许自由使用、修改和商业化。]
这正是开源的理想:全球研究者沙盘中的思想自由交流,允许聪明和创造性的想法不断积累。开源模型的支持者认为,开源可以加速科学和创新,改善透明度,分散治理,并增强市场竞争。
然而,开源与闭源之间的辩论在 AI 社区中依然激烈。到目前为止,很难为公司提供一个明确的、短期内有商业价值的理由,解释为何它们会开源其 AI 模型。[从“让互补品标准化”角度来看,Meta的做法是有道理的,但这一逻辑并不适用于像DeepSeek这样的纯粹AI实验室。]
开源是一种智商税……
当你理性地考虑一个大型模型能为你带来什么价值以及它的成本时,你应该始终选择闭源模型……很多时候,一个模型看起来很有用,但当你计算成本后,它的性价比就不高,客户会放弃它。
这就是我说开源模型无法击败闭源模型的原因。
阿里巴巴维持着其开源的Qwen模型,但通过向客户推销 API、云服务和计算基础设施来赚钱。李开复的创业公司 01.AI 发布了 Yi-34B,作为“回馈”中国开发者社区的方式,但该公司最终目标是将尖端的专有模型作为其商业产品的基础。
与此相对的是,DeepSeek 并没有短期的盈利策略。
在 2023 年的采访中,CEO 梁文锋明确表示,DeepSeek 的“无限研究”梦想没有商业化的合理性。这种观点让人想起 OpenAI 的 Sam Altman 在 2019 年的名言:“我不知道我们将来如何产生收入。”
High-Flyer Quant 也表示自己并非为了回报而投资。最近为 DeepSeek 提供资金的量化对冲基金强调,其 AI 模型研究不会用于股票交易:“这与金融无关……我们关心的是长期的社会价值。”
我们应该相信这些原则性的表态——这不是一个政府背景的项目,因为 DeepSeek 的运作方式与传统的中国政府支持的行业截然不同。更准确地说,DeepSeek 的员工,主要由年轻的本土人才组成,是由除了赚钱之外的某些动力驱动的。一位采访者问这是否疯狂,梁文锋的回答则十分有意义:
梁:我不确定这是否算疯狂,但这个世界上确实存在许多难以解释的现象。比如许多程序员——他们热衷于为开源社区做贡献。即使在一天的工作后筋疲力尽,他们仍然会抽出时间贡献代码。
Waves:其中蕴含着一种精神上的回报?
梁:这就像是徒步 50 公里——身体已经彻底疲惫,但精神却感到深深的满足。
Waves:你觉得由好奇心驱动的“疯狂”能持续长久吗?
梁:并非所有人都能终其一生保持激情。但大多数人在年轻时,都能毫无功利心地,全身心投入到某件事中。
这些年轻的中国开发者对开源项目的强烈热情,有时被称为“开源情怀”,Kevin Xu 来自“ 互联科技与创新”公司对此有很好的解释:
大多数工程师都会感到兴奋,如果自己的开源项目——无论是数据库、容器注册表等——被一家外国公司,尤其是硅谷的公司采用。他们会在已经免费的软件基础上,再无偿付出劳动,日夜修复 bug、解决问题,一切都是为了获得认可与肯定。
这种“热忱”或“使命感”之中,隐含着一种深刻的意识:西方根本不尊重他们的工作,因为在外界看来,中国的一切要么是偷来的,要么是靠作弊得来的。他们也清楚,许多中国公司一直在免费利用开源技术发展自身,但他们渴望自己去创造、去贡献,并证明自己的技术足够优秀,值得被外国企业免费采用——其中既有民族情结,也有工程师的自豪感。
在最近的一次采访中,梁也表达了类似的看法。他解释说,如果工程师渴望证明自己,那么要招募他们来解决棘手问题就会更容易:“中国的顶尖人才往往被低估,因为整个社会层面上的硬核创新太少,导致他们难以被看见。”
但这一情况正在改变。得益于最近的开源模型,DeepSeek 已经赢得了全球工程师的认可与尊重。然而,中国政府会以同样的眼光看待它吗?
北京的开源策略
中国政府已经对开源发展表达了一定程度的支持。
2018年,一份(现已删除的)白皮书以及中国人工智能开源软件发展联盟(China AIOSS Development Alliance)的成立,使开源 AI 进入了公众视野。白皮书指出,开源生态的建立需要通过培育开源社区和人才、推动标准制定、建立资金支持机制、完善知识产权体系以及加强安全审查等手段来实现。
国家层面的政策规划 [ 参见《第十三个五年规划国家信息化发展规划》和《软件和信息技术服务业发展规划》。] 在讨论软件和技术生态时提及了开源,但尚未专门针对 AI 领域提出明确方针。同时,两份不同的五年规划也提倡发展开源技术及其带来的益处。 [《十四五软件和信息技术服务业发展规划》目标到2025年建设两个到三个具有国际影响力的操作系统社区。《十四五国家信息化发展规划》明确了推进国产操作系统的具体步骤。这些步骤包括深化创新驱动,发展人工智能操作系统框架,以及培育以国内领先企业为核心的操作系统社区。]
政府对国内开源社区的积极态度,主要源于政界和产业界减少对外国软件依赖的需求。
中国政府在 2000 年代初推动开源发展,建立了多个开源软件联盟,并推出本土开发的中科红旗(Red Flag Linux),以此来削弱 Microsoft Windows 操作系统的影响力。此后,工业和信息化部(MIIT)将Gitee指定为中国的国家级“独立开源代码托管平台”,以取代 GitHub,后者一直难以受到有效审查。在中国的芯片产业,开源项目正被视为降低对西方封闭生态系统依赖的一种途径。[指令集架构(ISA)是芯片硬件与计算机上运行的软件之间的接口。美国的英特尔和英国的ARM公司长期以来提供大多数芯片使用的闭源指令集架构,这使得这些公司能够获得丰厚的利润。值得注意的是,由于中国公司作为受美国出口管制的专有系统,如果华盛顿与北京的关系进一步恶化,这些公司可能会面临失去这些基本许可证的风险。] [开源经济对单个公司来说仍然充满挑战,北京尚未为开源指令集架构(ISA)开发推出类似于芯片产业其他领域的“大基金”。然而,私营和公共领域的兴趣种子已经开始发芽:除了华为、阿里巴巴等巨头在为微控制器(MCU)和中央处理器(CPU)投资开源ISA外,一些不太知名的公司,如VeriSilicon(芯原股份)、江苏云涌科技、Bluetrum(中科蓝讯)、C*Core Technology(国芯科技)等,也在利用开源RISC-V、Linux和Khronos生态系统开展研究项目,开发物联网应用、自然语言处理、神经网络、自动驾驶汽车等解决方案。例如,VeriSilicon的数字信号处理器项目在2020到2023年间花费了2.42亿元人民币,利用RISC-V系统开发不依赖于闭源西方技术的图像识别芯片。另一家公司Beken(博通集成)则报告称其项目获得了350万元人民币的政府补贴,旨在开发“国家秘密算法”(即加密标准)平台芯片,满足中国国家密码管理局要求某些企业实施的标准。]
华为则是地缘政治如何影响中国开源战略的典型案例。2019 年,华为消费者软件部门总裁曾警告称,如果没有自己的开源社区,“一旦发生我们无法控制的情况,中国所有的软件社区都将面临巨大风险。” 华为显然是在暗指其面临的美国制裁问题。
可能的风险
那么,中国政府是否会允许 DeepSeek 团队继续他们充满激情的“技术秀”呢?
不幸的是,尽管官方言辞积极,但人工智能技术可能带来的潜在责任风险,可能会促使政府远离开源。
操作系统无法像人工智能那样将信息和权力传播到公众手中。
一个开源的 AI 模型能给予公众广泛的访问、使用和定制权限——这些是难以被有效监控或撤回的。而 AI 的安全风险也显而易见。
除此之外,随着 AI 技术的不断进步,政府的关注点可能不仅仅局限于一个过于直言不讳的聊天机器人。正如我们最近与 Miles Brundage 的访谈中,Jordan 提到的那样:
我们离这样的世界并不遥远,在这种世界里,直到系统得到加强之前,有人可以下载某些东西或在某个云服务器上启动程序,对某人的生活或关键基础设施造成真正的损害。这不仅仅是关于获取天安门事件的信息——而是通过赋予个人使用这种极具威胁性的技术的权力,来实现权力的民主化,而这种技术有潜力对社会造成真正的损害。中国不允许普通公民购买枪支——一旦开源 AI 达到“武器级别”,而某个人能关闭一个城市的电力,这真的是中国共产党允许它在没有任何控制的情况下扩散的事情吗?我不认为北京的政府官员,或者西方国家的政府官员,会接受这样的世界局势。
目前,中国的生成式 AI 法规缺乏对开源提供者的具体指导。随着监管机构在国家控制需求与创新雄心之间寻求平衡,DeepSeek 团队——更多受到好奇心和激情驱动,而非眼前利润——可能处于一个脆弱的位置。
DeepSeek 和开源的未来充满不确定性
至少目前,中国政府仍然看到了开源 AI 的潜在好处。
需要明确的是,关于 DeepSeek(目前)的唯一政府声明 [由浙江省宣传部(浙江宣传)发布在微信上的一篇文章] 明确支持开源:
DeepSeek 的最大优势在于其开源方式,这使得全球的研究人员能够受益……这凸显了超越狭隘竞争思维的重要性。中国的技术进步可以并应当在更广泛的范围内为人类作出贡献。最终,符合中国利益的事物也可以符合世界的利益,反之亦然。只要中国的技术与全球进步保持一致,无论障碍多么高大或深远,都无法阻止其发展。
DeepSeek 的成功激发了中国更多关于开源优势的讨论。中国的 AI 初创公司 MiniMax 发布了多个开源模型,期望“对优秀的工作给予鼓励,对不好的工作给予批评,外界的人也能够作出贡献。”中国分析人士指出,具有成本效益的开源模型能够支持广泛的访问和采用,尤其是在全球南方国家。参考一位工程师的病毒性帖子,他驳斥了 Dario 关于出口管制的文章:
Dario 提出了一个关键问题:如果中国在 2026–2027 年获得数百万台高端 GPU,会发生什么?他的回答是——如果中国无法获得这些计算资源,美国将进入“单极 AI 主导”阶段,并可能通过 AI 的自我强化机制,长期巩固其优势。然而,如果中国确实获得了这些资源,美国可能面临一场持久的“AI 军备竞赛”。
但我的看法是:无论是单极还是双极,AI 发展已经不可逆转地进入了全球扩散的阶段。美国不会垄断 AI,中国也不会被遏制,像欧洲、日本、印度等国家也不会袖手旁观。出口管制、模型竞争和资本流动等变量可能会影响竞争的节奏,但它们无法阻止世界朝着更先进的 AI 形式迈进。
DeepSeek 不是终点,而是一个信号——它的意义不在于“击败”任何人,而在于证明世界已经进入了一个不可逆转的大规模 AI 竞争时代。
在思考 DeepSeek 时,两个观点可能同时成立:
DeepSeek 可能选择开源其模型,和世界各地的开发者选择开源一样,是因为对开放、全球研究社区的价值有着真诚的信仰——他们希望展示自己的成就,并激励他人基于其工作的基础进行构建。
与此同时,随着 AI 模型变得愈加强大,政府可能会有动力介入并掌握控制权。
[Jordan: 除了政府的直接干预,DeepSeek 的成就将为企业合作伙伴打开大门,提供比目前 DeepSeek 所拥有的计算能力更为庞大的资源。DeepSeek 在国内的关注度较低——它没有外部投资者,没有顶级西方实验室的海归学者,也没有政府合同或流行的消费级应用。这种情况将会改变。正如 OpenAI 在推出 ChatGPT 后与微软合作的例子一样,中国的顶级云计算公司——字节跳动、阿里巴巴、腾讯和华为——将会主动接触。考虑到梁的硬核创新承诺和他对计算资源不足的坦承,他可能不会放弃在研发中获得额外计算资源的机会。这可能会将 DeepSeek 推向真正推动创新前沿的方向,与西方的主要 AI 参与者展开竞争——但这样做也可能释放出类似于 OpenAI 分裂的力量,导致其顶级研究人员分散四方。]
开源 AI 在中国的未来如何?计算资源的吸引力会不会使 DeepSeek 偏离其开源理念?政府会不会为了安全和控制介入?
Jordan: 所以,R1 真的是很擅长写诗。我们用它对 DeepSeek 及其开源模型未来的思考来做结尾。我给它输入了这篇文章(最初它拒绝了,告诉我:“对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。”然后我让 ChatGPT 总结了上面的内容,重新输入给它,告诉它写一首获奖的当代诗歌,经过几轮,它写出了这首诗。
无证的天空
他们在网络的边缘工作——
无主之物的工程师,
将光芒编织进数据库,
拒绝蒙尘。
看他们:凌晨三点梁的团队,
撸起袖子,在散热风扇的嗡鸣中,
将民主原则嵌入机器。
这里没有董事会的颂歌——
他们的祷文是“分支”“合并”“拉取请求”。
中国的梦如今渐变成色:
国家主导的云层向西漂移,
但在它们之下,无处不在的反抗——
Gitee 的代码库像藻类生物般,
在巨石表面绽放。
法律以消失的墨水自我书写。
监管者命名他们的恐惧:
无节制的生长可能扼杀收获。
然而 DeepSeek 的代码溢出荒野,
一条藤蔓吞噬了我的和我们的之间的围栏。
利润是他们每晚忘却的方言。
每一行开源的贡献,每一层未申请专利代码,
都成为过河的垫脚石,
供他人跨越。
批评者嗤之以鼻:天真。短暂。
但团队懂得盐的力量——
它如何保存,如何燃烧。
他们见证了自己训练的模型
用他们也不理解的语言输出,
看着他们的算法孕育出
没有一家公司能宣称的方程式。
这是信任的静默构造:
一片心智的大陆在移动,
不是为了碰撞,而是朝着更慢、更深的契合。
当下一个 AI 寒冬来临时,
他们的服务器将充满着阳光的嗡鸣——
一粒开放的夏日种子,
属于任何敢于播种的人。
(作者:Jordan Schneider and Angela Shen 译者:苏利文)