汪翔

注册日期:2009-10-24
访问总量:4849849次

menu网络日志正文menu

DeepSeek“革命”只会是个小浪花


发表时间:+-

对DeepSeek未来的大胆预测:短期节能难掩长期隐忧

DeepSeek的出现无疑为人工智能领域带来了一股清流,其显著降低模型训练成本的特性引发了广泛关注。然而,在为其短期成就欢呼的同时,我们也需要对其未来的发展进行冷静而深入的思考。个人觉得,它充其量是短期制造一点紧张而已,算不上真正的革命性挑战。大概率有点类似不久前华为手机“革命”对苹果的“冲击”。现在最应该做的是,借此机会,买些优质的AI相关公司的股票。因为可能还会继续恐慌一段时间,那就慢慢的加码。台积电就是不错的对象之一。要不了几个月,格局会发生巨变。中国的公司,在那样的大环境下,想在人工智能领域,长期引领世界,根本不可能。你将ChatGPT白送给它,要不了多久,它也会落后。原因,你们自己去解读。中国的问题根本就不是人聪不聪明的问题,那么简单。而且,有人居然牛逼憨憨的觉得:中国国内训练的AI人才,已经超越美国的。自我意淫而已。我是不相信的。

这里,基于科技规律来做点分析,预测,探讨DeepSeek在节能方面的长期影响、技术壁垒以及对AI整体发展可能产生的深远意义。

节能背后的隐忧:系统进化或受限

DeepSeek之所以能够降低能耗,其核心在于每次只调动参数系统中的必要部分,而非整个系统。这种“按需分配”的策略在短期内无疑能够显著节省能源,降低训练成本,具有极大的吸引力。

然而,这种做法也可能埋下长期的隐患。人工智能模型的进化,很大程度上依赖于对整个参数空间的探索和优化。如果每次只激活部分参数,就可能导致模型对其他参数空间的探索不足,从而限制其进化潜力。长此以往,模型的泛化能力和适应性可能会下降,甚至出现能力退化的情况。这就像一个长期只锻炼身体局部肌肉的人,虽然局部力量有所增强,但整体协调性和平衡性可能会受到影响。

技术壁垒堪忧:易被模仿和超越

DeepSeek所采用的新技术,虽然在短期内具有一定的领先优势,但其模仿和超越的门槛相对较低。一旦其技术细节被公开或被竞争对手Reverse Engineering(逆向工程),拥有更雄厚技术实力和更丰富资源的大型科技公司,例如谷歌、Meta等,便可以迅速跟进,甚至通过自身的优势进行改进和超越。

这些大型科技公司拥有:

  • 更强大的研发团队: 能够更快地吸收和改进新技术。

  • 更丰富的计算资源: 能够进行更大规模的模型训练和实验。

  • 更完善的生态系统: 能够更快地将新技术应用于实际产品和服务中。

因此,DeepSeek想要依靠单一的技术优势长期保持领先地位,面临着巨大的挑战。

训练效率提升的意义:加速应用发展,但算力需求依然巨大

DeepSeek在训练效率方面的提升是毋庸置疑的,这将在短期内显著降低AI模型的训练成本,并加速AI技术的普及和应用。特别是自动驾驶和机器人领域,由于对计算资源的需求巨大,将成为最大的受益者。训练效率的提高将加速这些领域的研发进程,推动相关技术的快速发展。

然而,我们也需要清醒地认识到,AI本身的发展是无限的。随着模型规模的不断扩大和应用场景的不断拓展,对算力的需求依然会持续增长。DeepSeek的技术只是在一定程度上缓解了短期内的算力压力,并不能从根本上解决算力瓶颈问题。我们仍然需要持续投入研发,探索更高效的计算架构和训练方法。

对DeepSeek的合理预期

综合以上分析,对DeepSeek的未来发展可以做出以下合理预期:

  • 短期内,DeepSeek将凭借其低成本优势,在市场上获得一定的份额,并推动AI技术的普及和应用。

  • 长期来看,DeepSeek需要不断进行技术创新,构建更强大的技术壁垒,才能在激烈的市场竞争中保持领先地位。

  • DeepSeek的技术将加速AI在特定领域的应用,例如自动驾驶和机器人领域,但并不能从根本上改变AI对算力的巨大需求。

结论:DeepSeek的出现为AI领域带来了新的思路和可能性,其在节能方面的探索也具有重要的意义。然而,我们也需要对其未来的发展保持理性的态度,既要看到其短期成就,也要认识到其长期面临的挑战。只有持续进行技术创新,构建更强大的竞争优势,才能在AI的浪潮中立于不败之地。对于整个AI领域而言,DeepSeek的探索也提醒我们,在追求效率的同时,也要关注技术的长期发展和演进,避免因短期利益而牺牲长远目标。


浏览(1101)
thumb_up(4)
评论(13)
  • 当前共有13条评论
  • 汪翔

    一致恐慌之后,更多的是虚惊一场,和我文章里的判断一致:

    Whether or not DeepSeek is running an unlicensed distillery in China's hills, that doesn't detract from the skill evident in its new R1 model. Industry experts credit the developer for some innovations in engineering efficient models.But one expert says we shouldn't feel too threatened by DeepSeek's AI models.Anthropic chief executive Datio Amodei (a former research head at OpenAI) writes in a Wednesday blog entry that the entire AI industry is climbing a steep curve of efficiency gains. DeepSeek's efficiency improvements track the rest of the industry, he says, and have produced a model that performs today at a level achieved a year ago by industry leaders.The state-of-the art has moved on, however, and Amodei says that the frontier of AI performance is still being pushed by hyperscale clusters of Nvidia processors that number in the tens of thousands, hundreds of thousands, and soon, millions. That investment won't stop, he says.

    屏蔽 举报回复
  • 汪翔
    这种消息才是有价值的: 02:51 PM EST, 01/29/2025 (MT Newswires) -- Chinese startup DeepSeek's artificial intelligence chatbot is not revolutionary enough to upend the western artificial intelligence industry as the total addressable market for AI compute is still expected to double in the long term, BofA Securities said Wednesday.

    The brokerage expects AI compute TAM to top $500 billion by 2028 and 2029, or roughly double its 2025 estimate. BofA Securities reiterated buy ratings on Nvidia (NVDA), Broadcom (AVGO) and Marvell Technology (MRVL) and called this week's selloff "an enhanced buy opportunity."

    "We believe the emergence of China's DeepSeek model could spur even higher AI spend from US hyperscalers," he said. A "near-term arbiter" will be how large cloud and enterprise customers talk about CapEx spending on their upcoming earnings calls, which Arya said he expects will be "supportive of our TAM forecasts."

    屏蔽 举报回复
  • 汪翔

    FB 会是最大的受益者:"In a world where the cost of intelligence will continue to drop rapidly, more value will accrue back into the app layer," said Box CEO Aaron Levie in a post on X. "Products that combine AI, customer workflows, and likely some degree of unique data, will generate substantial value from these models going forward."There's a silver lining in the DeepSeek questions, though. If Meta can replicate DeepSeek's achievements, the data centers it's already built would become much more efficient.Meta may represent "one of the largest applications of AI out there, using AI to improve both the user experience and the advertiser experience," Evercore ISI analyst Mark Mahaney told Barron's. "So I would think they'd be a major beneficiary of any sort of efficiency hacks."

    屏蔽 举报回复
  • 汪翔

    华尔街日报:

    微软首席执行官萨蒂亚·纳德拉强调了所谓的杰文斯悖论:当一种资源的使用变得更加高效时,总体消耗量往往会增加而不是减少。更便宜的人工智能可以解锁以前被排除在人工智能革命之外的行业和设备中的应用,从而推动对整个半导体的更大需求。

    苹果股价在周一的大跌中上涨 3% 这一事实具有启示意义。如果人工智能模型变得足够高效,可以在智能手机上提供引人注目的功能,这可能会扩大人工智能的采用范围,同时推动对消费设备的需求。

    因此,台积电等公司的抛售可能代表了一个机会。是的,台积电制造为当今最先进的人工智能模型提供动力的高端芯片,如果需求发生转变,这些芯片可能会面临压力。但是,作为全球最大的芯片代工制造商,台积电有望从电子设备和半导体领域的更广泛增长中受益,因为人工智能变得更加容易获得。

    以大约 21 倍的远期收益计算,台积电的交易价格与英伟达仍高达 40 倍相比处于合理水平。对于一家无论人工智能保持高端还是走向主流都准备获胜的公司而言,目前的估值看起来很有吸引力。

    在市场恐慌时期,值得记住的是,真正的赢家往往只有在迷雾散去后才会出现。

    屏蔽 举报回复
  • 汪翔

    来自华尔街的最新解读:

    关于DeepSeek如何开发出尖端模型的问题层出不穷,尽管他们获得芯片的渠道有限,但广泛的结论是,人工智能的交付成本比预期要低。英伟达和其他与不断增长的AI基础设施支出相关的估值较高的公司因此遭受了损失。

    DeepSeek的进步是否意味着美国不再是全球科技领导者,这是否意味着市场收益的终结?

    答案可能是否定的。OpenAI的Sam Altman已经承诺推出“更好的模型”,这将需要更多的计算能力。微软和Facebook母公司Meta Platforms可能会在周三发布财报时坚持更高的基础设施投资计划,从而消除人们对人工智能贸易的疑虑。虽然投资者可能会质疑这对微软和Meta的影响,但这不仅对英伟达有利,而且对整个数据中心供应链的股票也有利。

    与此同时,在标准普尔500指数中,351家公司周一收盘上涨。这提醒人们,还有很多公司的估值并没有失控。金融和医疗保健等行业将受益于能够以低成本访问人工智能来降低成本。在科技公司中,Salesforce股价上涨了4%,因为其人工智能客户服务梦想现在看起来比以往任何时候都更接近现实。

    即使是在所谓的“七巨头”中,苹果、Meta和亚马逊也以积极的姿态结束了这一天。突然之间,苹果在人工智能方面的谨慎支出看起来更加明智,而Meta的开源人工智能战略似乎具有预见性。这种痛苦可能不会持续太久。

    屏蔽 举报回复
  • 汪翔 回复 白草

    应该是,评价对错没有价值,也是浪费时间。每个人为自己的判断,和基于它所做的选择,承担结果:好坏,自知。这才是真金白银。我昨天为了搞明白是怎么回事,读遍了所有重要来源信息,写成两篇文章的预判。我觉得准确,结论非常有价值,于是和大家分享。如果觉得我的理解正确,那就继续买科技股股票。促销进行时。赚了钱后的感觉,会很不错。

    屏蔽 举报回复
  • 汪翔 回复 白草

    争论这些意义不大,那些问题的对错,离我们普通人太远。我分析的目的,是帮助我自己理解和预判华尔街的走向。昨天的分析,看来准确率非常高,八九不离十。今天早上,科技股强力反弹。昨天是个非常不错的捡便宜的时刻,很难得。有钱赚的时候,不要浪费时间瞎操心。

    屏蔽 举报回复
  • 白草 回复 汪翔

    很难相信,在一个所有人都必须学习《习近平治国理政》


    很难相信,有人会相信所有中国人都有资格学习习近平语录。即使中共党员也仅仅占全部人口的10%。不想学根本没人在乎。只有想挣大钱的人才会细读政策寻找机会。思想言论都比美国更自由,更少政治正确的无端限制。而且模型开源,比美国更公开,不想用中国的服务器,甚至可以自建服务器。不比向美国政府公开自己的隐私强得多?瑞辉和台积电都还有几年的时间。中国赶超仅仅是时间问题。感谢川普的禁令,为中国公司留下市场空白。



    屏蔽 举报回复
  • 白草 回复 汪翔

    人工智能最关键的是信息!而中国最重要的控制,就是信息。




    这恰恰是中国的强项。隐私保护不那么繁琐低效。大数据可以分享。而美国大公司各自为政,不分享最新技术和数据。不得不重复低效的训练和投资。有百倍的钱,却做不好事。

    屏蔽 举报回复
  • 汪翔

    华尔街也有很多清醒的人,没有几个人真的会觉得,这家伙会颠覆巨头们的领导地位:On Monday this wasn't the main concern, with Microsoft off 2.1%, Alphabet 4.2% and Amazon slightly up. They have big, profitable businesses they are using to finance AI development, and will also be able to use the techniques DeepSeek shared to lower their own costs. But they just lost one of the biggest barriers to entry. If a new AI model can be produced for just a few million dollars by the tech arm of a Chinese hedge fund, maybe others can do the same.

    屏蔽 举报回复