DeepSeek难免成为中国对抗美国的工具
在中国人工智能(AI)公司深度求索(DeepSeek)发布上周最新开源大模型前,中国官方据报曾在多个社交媒体,为这项发布提前造势。
受访分析师和学者认为,DeepSeek背后是否有官方支持仍不好判断,但在舆论裹挟下,难免成为中国对抗美国科技封锁的工具,事态发展恐已超出控制范围。
Graphika首席情报官斯塔布斯(Jack Stubbs)称,此举显示中国能迅速作出动员,在互联网上放大有利于中国的叙述,即北京在地缘政治竞争的关键领域超越美国。
成立于2023年5月的初创公司DeepSeek,去年12月26日发布开源大模型V3后,今年1月20日又发布R1模型,被业界认为可媲美ChatGPT,训练成本却不到600万美元(814万新元)。
R1模型发布当天,DeepSeek创始人梁文峰亮相中国央视新闻联播,出席由中国总理李强主持的专家座谈会,引发外界关于DeepSeek短时间取得关键突破的背后,是否有官方支持的猜测。
香颂资本执行董事沈萌接受《联合早报》采访时分析,DeepSeek两次大模型发布,分别选在中国开国领袖毛泽东诞辰周年纪念日和美国总统川普上任日,背后是否有特定意味不好判断。
不过,沈萌认为,R1引发舆论热潮并非受技术驱动,而是在DeepSeek登上中美应用商店下载量榜首后,才在中国官方和自媒体的推波助澜下形成。
他说,川普一直宣称要打压中国在科技领域的竞争力,而中国官方短时间内拿不出其他有效回击武器,便将DeepSeek作为中国对抗美国科技封锁的一个工具。
沈萌指出,中国官方将DeepSeek的成本优势作为亮点,提供一次训练的成本数据,但未将前期的硬件投入、平台成本等计算在内。“更像是地缘政治竞争出于宣传需要突出的重点,而不是从企业商业决策角度考虑的竞争点。”
他说:“DeepSeek在推出大模型后,被舆论风潮裹挟,可能反而让它脱离了原本的轨迹,失去对事情发展的控制力。”
复旦大学计算机学院教授、上海市数据科学重点实验室主任肖仰华受访时指出,DeepSeek推出的开源大模型对ChatGPT的闭源模型发起强烈挑战,是它引发西方媒体关注的直接原因。
肖仰华说,通用人工智能是基础性地推动社会发展的技术引擎,也是未来科技竞争的焦点。正因如此,政府与科技企业互动、关注创新企业的技术研发,已经成为各国的常态。
他指出,高科技企业发展到一定阶段受到政治的影响,并非第一次发生,之前已有中国手机巨头华为和短视频平台TikTok的先例。
肖仰华说:“通用人工智能发展比较好的局面应该是百花齐放。技术生态的多元化,对于整个人类文明发展来讲,绝对不是一件坏事。”