DeepSeek掀起AI惊涛海量恐逼川普下重手

自由财经 2025-02-02 18:27

中国新创DeepSeek（深度求索）近期发表AI模型，引发全球关注，DeepSeek的团队声称，相较于美国竞争对手推出的AI助理使用更少的成本和资料，却能达到可以媲美美国竞争对手的性能，这款AI模型的表现令美国投资人和企业高层感到震惊，连带市场出现剧烈波动。

DeepSeek是中国AI新创公司，该公司研发的AI模型R1在今年1月下旬正式发布，DeepSeek声称这款突破性模型的训练成本不到600万美元，且性能比肩OpenAI、Google和Meta等巨头推出的模型，考虑到ChatGPT训练成本超过1亿美元，DeepSeek的成本低的惊人。

DeepSeek的窜起备受瞩目，旗下推出的应用程式1月27日登上苹果（Apple）App Store的排行榜冠军，下载量将近200万，超越ChatGPT，这是Gemini、Claude等其他AI模型所无法达到。

横空出世造成1/27科技股重挫

DeepSeek横空出世吓坏全球市场，由于亚洲主要市场中、台、韩股正逢新年假期休市，日本科技股成为亚股重灾区27日一片惨绿，包括辉达的半导体测试设备供应商爱德万测试（Advantest Corporation）重挫8.61％、软银（Softbank）跌8.32％、东京威力科创（Tokyo Electron）跌4.9％、迪斯科（Disco）跌3.3％。

美国科技股同（27）日也重挫，包括辉达在内的芯片股一路狂泻，当天收盘辉达跌近17％、博通（Broadcom）跌17.4％、台积电ADR收盘跌13.33％、超微（AMD）则跌逾6％。辉达单日市值蒸发5926.58亿美元，改写史上最大跌幅，这一数字是2024年9月股灾时，市值蒸发2790亿美元的两倍多。

不过对于市场担心DeepSeek使用更少的芯片，将影响未来AI芯片的需求，辉达认为，中国AI新创的进步表明，辉达芯片确实有用，未来将需要更多芯片来满足需求；微软（Microsoft）执行长纳德拉（Satya Nadella）则以焦耳斯悖论（Jevons paradox）再度出现为例，强调随著AI工具更有效率且更易取得，需求反会加速膨胀。

中國新創DeepSeek近期發表AI模型，引發全球關注。（路透）

OpenAI的地位及成本遭质疑

DeepSeek表示，旗下的2款AI模型V3和R1性能可以比拟OpenAI和Meta的语言模型，R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型，对于在AI资本支出砸重金的美国企业而言，成了一大打击。

Counterpoint Research的AI分析师孙伟表示，DeepSeek证明，可以透过有限的运算资源来研发尖端AI模型。相较之下，花费1570亿美元的OpenAI，无法证明自己能在在创新过程中保持优势，同时巨额支出并未带来可观的回报。

不过，DeepSeek是否真的花费不到600万美元的成本就研发出AI模型，这一说法的可性度也令人存疑。投资公司Atreides Management合伙人兼资讯长贝克（Gavin Baker）认为，600万美元实际上不包括与架构、运算和资料有关的研究以及消融实验的成本。并称，如果一个实验室已经花费了数亿美元进行研究，并可以使用更大的丛集，那当然可以用600万美元建造出与R1同样品质的模型。

恐利用“蒸馏”技术打造自家模型

不少技术人员也认为，DeepSeek的模型可能“参考”美国AI模型，利用“蒸馏（distillation）”技术打造自家模型，透过使用更成熟、功能强大的AI模型，来评估新模型给出的答案品质，这也代表新模型可以省下构建初始模型所需的大量时间及运算能力，无需承担相关成本。

川普政府的AI沙皇萨克斯（David Sacks）近日接受《福克斯新闻》访问时指出，DeepSeek使用了一种名为“蒸馏”的过程，借由一个新的AI模型向一个现有模型提出数百万个问题，以便学习其知识并模仿其推理过程，有充分的证据表明，DeepSeek所做的就是从OpenAI的模型中获取知识。

随后就有知情人士向《彭博》透露，微软和OpenAI正在调查DeepSeek是否窃取资料，并称，微软的安全研究人员去年秋天就观察到，他们认为DeepSeek的相关组织可能使用 OpenAI 应用程式介面（API）窃取了大量资料。

OpenAI则向《金融时报》证实，已掌握DeepSeek盗用模型证据。根据OpenAI的服务条款，用户不得“复制”任何OpenAI的服务，或是“利用输出结果，来开发与OpenAI竞争的模型”。

川普恐全面限制辉达芯片输中

面对DeepSeek带来的威胁，美国总统川普表示，这将敲响美国产业的“警钟”，让产业意识到，美国需要更加专注于竞争并取得胜利。但川普也补充，能够推出更便宜、更快的AI模型是一件好事，这代表产业将不用花这么多的成本，也能得到同样的结果。

华府智库战略与国际研究中心（CSIS）瓦德瓦尼AI和先进技术中心主任艾伦（Gregory Allen）指出，技术创新是真的，但发表的时机点在本质上具有政治性考量。艾伦补充，DeepSeek公布AI模型，试图证明美国的出口管制“徒劳无功”或只会“适得其反”，这才是中国外交政策的真正目标。

各界开始采取行动应对，白宫声明表示，美国国家安全会议（NSC）正在检视该程式对国家安全的影响，也将致力于确保美国在AI领域的主导地位。美国海军则开出第1枪，以“这款模型起源和使用相关潜在安全和道德问题”为由，要求全体人员避免使用该公司出品的任何模型，意大利、美国会也跟上，封杀DeepSeek。

市场则传出，川普政府官员目前正在研究收紧辉达对中销售限制的可能性，可能将管制进一步扩大至辉达专门为中国市场设计的H20芯片。辉达的H20芯片可以用于研发和运行AI软体、服务，是为了满足美国的芯片出口限制，专门为中国设计的特供版芯片，运算能力仅约为H100芯片的5分之1。

实用资讯