DeepSeek震荡硅谷和华尔街 白宫坦白了

上报 2025-01-29 07:41+-

中国AI新创公司深度求索(DeepSeek)发布低成本人工智慧(AI)模型,震撼华尔街股市,也对美国AI领先的优势构成威胁。白宫AI沙皇28日坦承,美国领先中国的优势仅3至6个月。

白宫AI与加密货币负责人塞克斯(David Sacks)28日接受福克斯新闻(Fox News)访问坦承,DeepSeek生成式AI可与美国OpenAI开发的聊天机器人ChatGPT相媲美。OpenAI正在发展下一代模型,不过仅领先约3至6个月。塞克斯表示,“中国公司正在快速追上”,但强调“我们并没有失去领先地位”。塞克斯还提到,美国的AI公司之前有些分心,也有点太自满,“他们没有意识到这些中国公司距离他们有多近”。

DeepSeek去年12月26日推出DeepSeek-V3大型语言模型,性能已可与OpenAI和Google等美企旗下优秀的聊天机器人媲美,令各界惊艳。本月27日,DeepSeek推出同名AI助理,在苹果App Store下载超越ChatGPT,成为下载第一名的App。 

《纽约时报》分析,不同于百度(Baidu)和阿里巴巴(Alibaba)等中国科技龙头在追赶矽谷公司在AI领域的成就时,往往会有盛大的发表会,推出新的聊天机器人,DeepSeek采取不同路线,一开始先致力于研究。

DeepSeek并非科技业起家,而是由中国对冲基金“幻方量化”(High-Flyer)创办与经营的新创公司,两者都是由中国企业家梁文锋经营。《纽时》指出,“幻方量化”是透过散户为主的中国股市发迹,但从2021年开始,感受到监管单位打击投机交易的压力,就另寻一条符合北京优先发展项目的生路,就是AI。 

DeepSeek并不是靠著一般消费者使用的AI产品赚钱,直到本月才发表第一个聊天机器人,反而是利用股市赚到的钱来资助研究。《纽时》指出,这个非传统的途径有别于美国的竞争对手,也可避开中国政府对于公众使用的AI产品的严格规范。由于Deepseek一开始把目标放在研究,并把模型销售给企业,所以早期没有受到政府法规的限制。

DeepSeek震荡硅谷和华尔街 白宫坦白了

40岁的梁文锋是浙江大学研究所毕业的硕士工程师。参与DeepSeek模型研究的电脑工程师王子汉(Zihan Wang,音译)向《纽时》表示,梁文锋是有深厚技术背景的经理人,“他绝对是INTP”。INTP是目前在中国流行的MBTI 16型人格测试的其中一种人格类型。

王指出,梁致力于技术研发,而不专注于利润,不太关心专案进度的细节,偶尔会提出一些发人省思的问题。值得一提的是,不同于大多数的中国科技公司,梁以聘用电脑以外的人才闻名,雇用许多出身中国顶尖大学出身的诗人或人文科系的毕业生,训练DeepSeek模型写出中国古典诗词,或是专精回答中国大学入学高考的问题。 

熟悉DeepSeek架构的旧金山公司Baseten软体工程师张以能(Yineng Zhang,音译)表示,DeepSeek的团队大部分都毕业于中国顶尖大学,“他们非常聪明,也非成年轻”。