山货郎

注册日期:2023-01-10
访问总量:468055次

menu网络日志正文menu

不出意料-美国开始找DeepSeek茬儿了


发表时间:+-

现在世界上人工智能界只剩下两大玩家,美国和中国,其他国家都已经出局。 法国不服气,前不久推出一款自己的AI模型,叫做 露茜(Lucie),虽然名字很浪漫,但这位法国美女明显胸比脑大,居然算不出 5 x(2+3)等于多少,还很认真地回答用户的调侃”Cow's egg"是什么东东。结果这款AI模型三天就狼狈下架。 欧洲其他国家和日韩连试一试的勇气都没有,只能仰视擂台上中美这两位泰森级选手互撕。 

美国科技有七巨头,人们把它们叫做 Magnificent 7,. Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉,Mag 7 市值总共17万亿美元, 7个老板的个人财富总值8000亿美元。这几家公司研发的语言大模型(LLM) ,包括Google的Germini, 微软的OpenAi,Meta 的Llama, Anthropic的Cloud Sonnet等代表了最前沿的AI技术,可这些模型都是烧钱的祖宗,烧钱的速度连华尔街大佬都喊“吃不消”, 模型训练费用动辄几亿几十亿,  关键是虽然取得了惊人的发展,但依然停留在AI阶段,无法达到人类真正渴望的AGI的水平。AI和AGI的区别在于前者只能模仿人脑,后者AI能够生成人类不具有的智慧。

DeepSeek的出现彻底改变了AI的发展模式,DeepSeek推出的语言大模型 V3 和 推理大模型 R1的训练成本只占美国大模型训练成本的5%-10%,这就大大地降低了AI的门槛,把原本富国巨贾才玩得起的AI游戏变成了大家都可参与的科技竞赛。即使是华尔街对于DeepSeek的出现也持正面态度, DeepSeek让华尔街大佬有一种被被硅谷大佬戏弄的感觉,成了冤大头。DeepSeek R1刚刚出炉没有两天,有人就披露了一份Meta Llama研发部门的内部邮件,邮件说DeepSeek的整个学习成本和我们团队经理的薪水差不多,而我们团队这样薪水的经理有几十个。大家准备好,“变革”即将来临。傻瓜都知道,所谓的变革就是裁员。

DeepSeek掀起了一阵AI旋风,也激起了硅谷的仇恨。OpenAI公开指责DeepSeek涉嫌“蒸馏”ChatGPT知识,违背了该语言大模型的服务条款, 声称要配合美国司法部解决这个问题。 白宫数字货币和人工智能“沙皇” Sacks 表示:“......over the next few months is our leading AI companies taking steps to try and prevent distillation ... That would definitely slow down some of these copycat models。” Sacks把DeepSeek模型蔑称为“copycat"。福克斯经济节目支持人,极端仇中的Bartiromo在节目里嘲笑道:"DeepSeek所谓的500万学习成本完全是wildly made up.” 各种阴谋论也纷纷出笼,有的披露DeepSeek所属的杭州Quant量化公司其实储备了五万片英伟达最先进的H100芯片, 这些芯片无疑被用在DeepSeek的研发之中,而且成本没有被计算在内,有的说DeepSeek推出的初版即终极版的做法十分反常,国家操纵痕迹明显。。。

OpenAI CEO Sam Altman是个天才,ChatGPT就是由他领导的团队开发的,但他却是极具争议性的人物,有人说他什么都干得出来,他的妹妹指控少年时曾遭受过Altman的猥亵强奸,Altman完全否认这一指控,她正式提告法庭。提告背后的真实动机是什么我们不得而知,很可能是为了钱, 但妹妹指控哥哥性侵是非常严重的指控,即使在美国这样见怪不怪的国家也不常见。他现在带头攻击DeepSeek通过蒸馏技术窃取OpenAI模型知识说明他没有底线,语言大模型靠的就是公域数据,ChatGPT攫取各类文献,科学研究报告,政治经济研究分析数据时,也没有一家家去先征得作者或出版商的同意, ChatGPT反刍出来的AI报告就是这些公域数据的聚集。 现在你altman出来指责DeepSeek窃取了你的知识产权,等于是把公域数据当成自己的知识产权了,这有点儿搞笑。Altman指责DeepSeek后面的动机不言而喻,DeepSeek动了他的奶酪,投资者如果以DeepSeek的成本来衡量OpenAI,非但OpenAI的市值会立刻暴跌,整个AI业的泡沫也立刻被戳破。

所谓的蒸馏技术是指所谓的“学生小模型”通过提问向“老师大模型”汲取思维方式的学习过程,这种方法能够使得学生模型的智能无限地接近老师模型的智能,但却无法超越老师模型的智能,DeepSeek也许会通过对话获得其他大模型的思考模式,启动自己模型神经元的激活函数,但DeepSeek语言模式有其独特性和结构优化性,这才是它的验算和coding方面超越ChatGPT的根本原因,有AI学者表示两个大模型之间的data scrubbing 在技术上既不可行,也不划算。DeepSeek如果想全盘抄袭ChatGPT,就必须scrub ChatGPT的所有公域数据,这明显不是划算的买卖。

DeepSeek是开源模型,它的思考模式和验算过程是公开透明的,它的研究报告公开表明560万是模型训练成本,这可以通过token的使用量来验证,无法作假。至于它拥有的英伟达高阶H100芯片数量是个未证实的猜测,可能有,也可能没有。但这没有改变DeepSeek已经成为世界顶级语言模型的事实,法国没有受到制裁,可以任意使用高阶芯片创建大模型,"露茜小姐"就是英伟达H100芯片做成的,可却笨的出奇。

短短几天,网络上已经出现了几十个通过学习DeepSeek建成的语言模型,DeepSeek没有指责这些模型窃取自己的AI知识,这些学生模型恒可能将来会演变成和ChatGPT或DeepSeek一样的顶级模型,造福于人类,这是好事。通过打压对手来保持自己的优势只有在对手处于劣势之际才有效,如果对手和自己一样强大,打压只能延缓对手的鹊起,不能增强自己的优势。美国前商业部长雷蒙多在临下台之间这种做法称之为“a fool's errand." 雷蒙多本人就是打压中国的打手。

据说美国现任商业部长鲁特尼克正在考虑把对华芯片制裁范围扩大到H-20. H-20芯片的算力只有H-100的五分之一,是H-800 (DeepSeek模型使用的芯片)的四分之一。 如果真的如此,没准儿中国下一代语言模型会在H-20芯片上再创奇迹。


浏览(2096)
thumb_up(8)
评论(16)
  • 当前共有16条评论
  • 无云夜空 回复 无云夜空

    美国在LLM方面的霸权结束了。

    屏蔽 举报回复
  • 无云夜空

    刚才试验了一下,似乎阿里巴巴的Qwen2.5-Max比Deep Seek V3更厉害,阿里巴巴可能是世界领先了。惊人,中国人的赶超能力太惊人了。

    屏蔽 举报回复
  • 玉质

    特朗普1月27日说,DeepSeek模型的发布“应该是对我们的行业敲响了一个警钟,我们需要全神贯注于竞争,以取得胜利”。他认为,这对美国科技巨头来说可能是一个“积极信号”:“与其花费数十亿,或许你可以花更少的钱,并最终获得所期望般的同样解决方案。”.

    特朗普懂.

    屏蔽 举报回复
  • 玉质
    没有制裁, 哪里有 DeepSeek? 弄巧成拙. 懂不懂?
    屏蔽 举报回复
  • 墙内真相

    都不用美国动手,你看看这个网站上一些人的嘴脸。

    屏蔽 举报回复
  • 玉质 回复 漂美飘

    "您是希望美国堵还是不堵?" - 我们草民管不了. 由它去.

    屏蔽 举报回复
  • 水蛇 回复 漂美飘

    【您是希望美国堵还是不堵?】

    根本就堵不住。而且适得其反。中国过去,尤其是高层(企业当然愿意造了):造不如买,买不如租。结果围堵导致了什么?不仅是中国有了自己的制造业,连高层的产业政策都颠覆了。

    【这种“倾举国之力”的投入,机会成本有多高?从综合国情来看是否合理?】

    今天的所谓倾国之力,已经不是老毛造原子弹那种了。中国企业,尤其是民企,他是要根据市场需求的。而且企业之间也未必愿意走你所说的什么举国之力。举国之力主要对国企而言。中国现在民营经济占了半边天。

    有些人一边反对国进民退,一边对民企挑鼻子挑眼,民企死绝了才合他们的意。

    【感觉这跟争奥运会金牌的心态差不多】

    这个心态有什么不好?美国走下坡路,恰恰是缺了这种心态。不然老唐为啥要搞星际门?中国再次,用的是本国资本。美国连国际资本都不放过。

    当然,俺的观点一直是,不走极端。

    屏蔽 举报回复
  • 漂美飘 回复 水蛇

    【堵是堵不住的!中国光刻机,芯片一旦技术成熟,走出去,价格就能干趴一大片。】

    朋友,说句心里话,您是希望美国堵还是不堵?

    中国在光刻机和芯片领域的技术突破只是时间问题,一旦成熟,凭借规模和成本优势,确实有可能在全球市场上占据重要地位。但问题是,这种“倾举国之力”的投入,机会成本有多高?从综合国情来看是否合理?

    感觉这跟争奥运会金牌的心态差不多。您看呢?


    屏蔽 举报回复
  • 水蛇 回复 双不

    短期讲,可能是这样。长期就不好说了。甚至不用长期。

    今年达沃斯会上,荷兰首相提到,光刻机卖与不卖,应该由丹麦自己决定。中国国内一些光刻机制造厂家立即表示抵制。

    为啥?正因为你禁卖,才使得国内不少厂家开始研制胜场。如今你要放开禁卖,那么人家的投资算什么?

    芯片也是如此。一旦西方放开芯片管控,那么最着急的是谁?一定是那些起步研制,以及研制到半途中的中国企业。

    没看国内新闻吗?商业部将抵制芯片倾销。不信的话,俺给你搬来一段:1月17日,商务部发言人在答记者问时证实,美国企业在获得拜登政府巨额补贴后,以低于成本的价格向中国出口成熟制程芯片,这一行为严重扰乱了中国市场的正常秩序,损害了中国芯片企业的合法权益。发言人明确表示,中国政府已收到国内相关产业关于对美国进口芯片进行反倾销反补贴调查的申请,将严格按照中国相关法律法规及世贸组织的规则正式启动调查程序。

    堵是堵不住的!中国光刻机,芯片一旦技术成熟,走出去,价格就能干趴一大片。

    屏蔽 举报回复
  • 双不 回复 水蛇

    芯片管制仍然是目前最有效的方法。中国能把管制的芯片玩的这么高阶,不管制的芯片就可怕了。

    屏蔽 举报回复