DeepSeek掀起AI惊涛海量 恐逼川普下重手

自由财经 2025-02-02 18:27+-

中国新创DeepSeek(深度求索)近期发表AI模型,引发全球关注,DeepSeek的团队声称,相较于美国竞争对手推出的AI助理使用更少的成本和资料,却能达到可以媲美美国竞争对手的性能,这款AI模型的表现令美国投资人和企业高层感到震惊,连带市场出现剧烈波动。

DeepSeek是中国AI新创公司,该公司研发的AI模型R1在今年1月下旬正式发布,DeepSeek声称这款突破性模型的训练成本不到600万美元,且性能比肩OpenAI、Google和Meta等巨头推出的模型,考虑到ChatGPT训练成本超过1亿美元,DeepSeek的成本低的惊人。

DeepSeek的窜起备受瞩目,旗下推出的应用程式1月27日登上苹果(Apple)App Store的排行榜冠军,下载量将近200万,超越ChatGPT,这是Gemini、Claude等其他AI模型所无法达到。

横空出世造成1/27科技股重挫

DeepSeek横空出世吓坏全球市场,由于亚洲主要市场中、台、韩股正逢新年假期休市,日本科技股成为亚股重灾区27日一片惨绿,包括辉达的半导体测试设备供应商爱德万测试(Advantest Corporation)重挫8.61%、软银(Softbank)跌8.32%、东京威力科创(Tokyo Electron)跌4.9%、迪斯科(Disco)跌3.3%。

美国科技股同(27)日也重挫,包括辉达在内的芯片股一路狂泻,当天收盘辉达跌近17%、博通(Broadcom)跌17.4%、台积电ADR收盘跌13.33%、超微(AMD)则跌逾6%。辉达单日市值蒸发5926.58亿美元,改写史上最大跌幅,这一数字是2024年9月股灾时,市值蒸发2790亿美元的两倍多。

不过对于市场担心DeepSeek使用更少的芯片,将影响未来AI芯片的需求,辉达认为,中国AI新创的进步表明,辉达芯片确实有用,未来将需要更多芯片来满足需求;微软(Microsoft)执行长纳德拉(Satya Nadella)则以焦耳斯悖论(Jevons paradox)再度出现为例,强调随著AI工具更有效率且更易取得,需求反会加速膨胀。

中國新創DeepSeek近期發表AI模型,引發全球關注。(路透)

OpenAI的地位及成本遭质疑

DeepSeek表示,旗下的2款AI模型V3和R1性能可以比拟OpenAI和Meta的语言模型,R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型,对于在AI资本支出砸重金的美国企业而言,成了一大打击。

Counterpoint Research的AI分析师孙伟表示,DeepSeek证明,可以透过有限的运算资源来研发尖端AI模型。相较之下,花费1570亿美元的OpenAI,无法证明自己能在在创新过程中保持优势,同时巨额支出并未带来可观的回报。

不过,DeepSeek是否真的花费不到600万美元的成本就研发出AI模型,这一说法的可性度也令人存疑。投资公司Atreides Management合伙人兼资讯长贝克(Gavin Baker)认为,600万美元实际上不包括与架构、运算和资料有关的研究以及消融实验的成本。并称,如果一个实验室已经花费了数亿美元进行研究,并可以使用更大的丛集,那当然可以用600万美元建造出与R1同样品质的模型。

恐利用“蒸馏”技术打造自家模型

不少技术人员也认为,DeepSeek的模型可能“参考”美国AI模型,利用“蒸馏(distillation)”技术打造自家模型,透过使用更成熟、功能强大的AI模型,来评估新模型给出的答案品质,这也代表新模型可以省下构建初始模型所需的大量时间及运算能力,无需承担相关成本。

川普政府的AI沙皇萨克斯(David Sacks)近日接受《福克斯新闻》访问时指出,DeepSeek使用了一种名为“蒸馏”的过程,借由一个新的AI模型向一个现有模型提出数百万个问题,以便学习其知识并模仿其推理过程,有充分的证据表明,DeepSeek所做的就是从OpenAI的模型中获取知识。

随后就有知情人士向《彭博》透露,微软和OpenAI正在调查DeepSeek是否窃取资料,并称,微软的安全研究人员去年秋天就观察到,他们认为DeepSeek的相关组织可能使用 OpenAI 应用程式介面 (API) 窃取了大量资料。

OpenAI则向《金融时报》证实,已掌握DeepSeek盗用模型证据。根据OpenAI的服务条款,用户不得“复制”任何OpenAI的服务,或是“利用输出结果,来开发与OpenAI竞争的模型”。

川普恐全面限制辉达芯片输中

面对DeepSeek带来的威胁,美国总统川普表示,这将敲响美国产业的“警钟”,让产业意识到,美国需要更加专注于竞争并取得胜利。但川普也补充,能够推出更便宜、更快的AI模型是一件好事,这代表产业将不用花这么多的成本,也能得到同样的结果。

华府智库战略与国际研究中心(CSIS)瓦德瓦尼AI和先进技术中心主任艾伦(Gregory Allen)指出,技术创新是真的,但发表的时机点在本质上具有政治性考量。艾伦补充,DeepSeek公布AI模型,试图证明美国的出口管制“徒劳无功”或只会“适得其反”,这才是中国外交政策的真正目标。

各界开始采取行动应对,白宫声明表示,美国国家安全会议(NSC)正在检视该程式对国家安全的影响,也将致力于确保美国在AI领域的主导地位。美国海军则开出第1枪,以“这款模型起源和使用相关潜在安全和道德问题”为由,要求全体人员避免使用该公司出品的任何模型,意大利、美国会也跟上,封杀DeepSeek。

市场则传出,川普政府官员目前正在研究收紧辉达对中销售限制的可能性,可能将管制进一步扩大至辉达专门为中国市场设计的H20芯片。辉达的H20芯片可以用于研发和运行AI软体、服务,是为了满足美国的芯片出口限制,专门为中国设计的特供版芯片,运算能力仅约为H100芯片的5分之1。

  • 最新评论
  • jincao

    中美科技战刚开始,静候看结果。看美国的制裁是否能有效遏制中国包括人工智能的科技发展。

    屏蔽
1