汪翔

注册日期:2009-10-24
访问总量:4784385次

menu网络日志正文menu

DeepSeek 带来的恐慌,意味着机遇!


发表时间:+-

首先和最直接的短期效果是:

快速成为苹果应用商店下载第一;在今天让美国几个科技巨头的股价暴跌,投资者失去千亿美元级别的资产。读了这篇文章后,你可以想想,是不是应该借机多买点巨头股票?

那么,更深度和长远的含义呢?我的问题是,它的优劣何在?能否在中国“芯”困境下实现AI弯道超车?美国的科技公司需要因为它的出现,忧虑什么?还是会很快基于自己强大的算力和人才贮备来击败它?毕竟,它的最大优势是低成本。

DeepSeek 的崛起引发了人们对其能否挑战 ChatGPT 等大型模型的广泛讨论。尤其在中国面临高端芯片封锁的背景下,DeepSeek 是否能凭借其独特的技术路线,在高端人工智能模型领域实现“弯道超车”,打破西方在这一领域的垄断,抑或仅仅成为一种低价替代品,成为了一个备受关注的话题。

DeepSeek 之所以被寄予厚望,主要源于其以下几个方面的优势:

  • 强化学习(RL)驱动的推理能力: DeepSeek 摒弃了传统的监督微调(SFT)为主的训练方法,转而以纯强化学习为主,这使其在推理能力上表现出色。通过设计适当的激励机制,模型能够自我推理、逐步优化,更加灵活,也避免了传统 SFT 方法可能带来的数据依赖和脆弱性。这种“多做题”的学习方式,被认为有助于解决大模型中常见的“幻觉”问题。

  • 高性价比和开源策略: DeepSeek 注重成本效益,通过使用 AMD GPU 和开源 ROCm 软件,以较低的成本训练模型,挑战了业界对英伟达高端 GPU 或谷歌 TPU 的依赖。同时,DeepSeek 将其技术完全开源,并允许全球开发者免费使用,大幅降低了 AI 开发的门槛,打破了部分巨头通过昂贵的订阅模式构筑的壁垒。

  • 专注于技术创新和人才培养: DeepSeek 创始人梁文峰更倾向于从顶尖高校(如北大、清华)招募博士生,而非经验丰富的资深软件工程师,并提供极具竞争力的薪酬和充分的算力资源支持,鼓励员工进行技术创新。

然而,DeepSeek 也面临着一些挑战:

  • 硬件限制: 虽然 DeepSeek 通过技术创新降低了对高端 GPU 的依赖,但长期来看,对先进 GPU 的有限访问仍然可能造成计算差距,阻碍其扩展更大规模的模型。这是中国 AI 产业整体面临的困境,也是 DeepSeek 需要克服的重要障碍。

  • 多模态能力相对薄弱: 相较于其在推理能力上的优势,DeepSeek 在多模态(如图像、语音等)数据的处理和理解方面相对薄弱,需要进一步加强。

  • 商业化和生态建设: 开源策略虽然有利于技术传播,但也可能在商业化方面面临挑战。如何构建完善的生态,将技术转化为实际应用和商业价值,是 DeepSeek 需要认真思考的问题。

能否实现弯道超车?

DeepSeek 的出现无疑给中国 AI 产业带来了一线希望。其独特的技术路线和开源策略,使其在某些方面展现出了超越传统巨头的潜力。如果能够有效克服硬件限制,并在多模态能力和商业化方面取得突破,DeepSeek 有可能在特定领域或任务上实现“弯道超车”。

然而,要全面“击败”ChatGPT 这样的大型模型,并打破西方在整个高端 AI 领域的垄断,仍然面临着巨大的挑战。这不仅仅是 DeepSeek 一家公司的事情,更需要中国整个 AI 产业在基础研究、硬件支持、人才培养和生态建设等方面进行长期投入和协同发展。

低价替代品?

将 DeepSeek 简单地视为“低价替代品”是片面的。DeepSeek 的核心竞争力在于其技术创新,尤其是在强化学习方面的应用。其开源策略也并非单纯的“低价”策略,而是旨在构建一个开放的生态,吸引更多开发者参与,共同推动技术发展。DeepSeek 的出现是中国 AI 产业在困境中寻求突破的一次重要尝试。它展现了中国 AI 产业的创新能力和发展潜力。虽然面临诸多挑战,但 DeepSeek 并非没有机会在特定领域实现“弯道超车”。未来,DeepSeek 能否真正撼动现有格局,取决于其能否持续进行技术创新,克服硬件限制,并成功构建商业生态。更重要的是,这需要中国整个 AI 产业的共同努力,才能真正摆脱“卡脖子”的困境,在全球 AI 竞争中占据更有利的位置。

低成本优势能否撼动美国科技巨头的AI霸权?

DeepSeek 的异军突起,以其独特的低成本优势和技术创新,在全球人工智能领域掀起了一阵波澜。这不禁引发人们思考:DeepSeek 的出现,会对长期占据主导地位的美国科技公司带来怎样的影响?它们是否需要为此感到忧虑?又是否能够凭借强大的算力轻易击败 DeepSeek?

DeepSeek 的崛起:挑战传统AI发展模式

DeepSeek 之所以能够引起广泛关注,并非仅仅因为其“低成本”的标签,更重要的是其背后所代表的技术创新和发展理念:

  • 强化学习驱动的创新: DeepSeek 摒弃了传统的监督微调(SFT)方法,专注于强化学习(RL)技术的应用。这种方法论上的转变,使其在模型推理能力和减少“幻觉”方面展现出独特的优势,挑战了以 SFT 为主流的 AI 模型训练范式。

  • 开源策略的颠覆: DeepSeek 采取了完全开源的策略,将技术和代码开放给全球开发者免费使用。这不仅降低了 AI 开发的门槛,也加速了技术的传播和迭代,对美国科技公司通过 API 订阅等方式构筑的商业壁垒构成了冲击。

  • 成本效益的极致追求: DeepSeek 通过使用 AMD GPU 和开源 ROCm 软件等方式,有效地降低了模型训练和推理的成本。这种对成本效益的极致追求,使其产品和服务在价格上更具竞争力,尤其是在对价格敏感的市场中。

美国科技公司面临的挑战:不只是算力之争

面对 DeepSeek 的崛起,美国科技公司并非可以高枕无忧,简单地依靠强大的算力就能将其“击败”。它们需要关注以下几个方面:

  • 技术路线的重新审视: DeepSeek 在强化学习方面的探索,如果被证明是更优的路径,将迫使美国公司重新审视自身的技术路线,并考虑是否需要进行调整。这并非单纯的算力投入能够解决的问题,而是关乎技术方向的选择和战略调整。

  • 开源浪潮的应对: DeepSeek 的开源策略可能会加速全球 AI 技术的发展,并对美国公司构筑的商业壁垒构成冲击。美国公司需要思考如何应对这种开源浪潮,例如是否也需要更加开放其部分技术或数据,或者通过提供更具差异化的服务来保持竞争力。

  • 价格竞争的压力: DeepSeek 的低成本优势可能会引发价格竞争,迫使美国公司更加关注成本控制,并通过技术创新和运营效率的提升来降低自身成本。

  • 全球AI人才竞争的加剧: DeepSeek 的成功也反映了中国在 AI 人才培养方面的进步,这可能会加剧全球 AI 人才的竞争,美国公司需要更加重视人才的吸引和保留。

  • 国家安全层面的考量: 一些评论指出,DeepSeek 的出现可能加速 AI 技术在全球范围内的扩散,这可能会引起美国政府在国家安全方面的担忧。

美国科技公司的应对策略:竞争与合作并存

面对 DeepSeek 带来的挑战,美国科技公司更可能采取一种多元化的应对策略:

  • 密切关注并学习 DeepSeek 的技术: 美国公司需要密切关注 DeepSeek 的技术进展,学习其在强化学习等方面的经验,并将其应用到自身的产品和服务中。

  • 持续加大技术创新投入: 为了保持技术领先优势,美国公司需要继续加大在 AI 基础研究和技术创新方面的投入,开发更先进的算法和模型架构。

  • 寻求合作与共赢: 在某些领域,美国公司可能会与 DeepSeek 或其他中国 AI 公司展开合作,共同推动 AI 技术的发展,实现共赢。

  • 差异化竞争: 美国公司可以通过提供更高端、更专业、更定制化的产品和服务,与 DeepSeek 形成差异化竞争,避免陷入单纯的价格战。

结论:DeepSeek 不容小觑,但美国科技巨头仍具优势

DeepSeek 的出现无疑给美国科技公司敲响了警钟,提醒它们不能固步自封,需要密切关注新的技术趋势和竞争对手。DeepSeek 的低成本优势和技术创新不容小觑,但美国科技巨头在算力、数据、人才和生态系统等方面仍然拥有显著的优势。

未来的竞争格局很可能是竞争与合作并存的局面。美国科技公司需要保持开放的心态,积极应对新的挑战,并通过持续的技术创新和战略调整来保持其在全球 AI 领域的领先地位。而将 DeepSeek 简单地视为“低价替代品”则是一种过于片面的看法,忽视了其背后的技术创新和战略意义。


浏览(993)
thumb_up(0)
评论(7)
  • 当前共有7条评论
  • 汪翔

    我昨天的解读和预判,从今天早上股市的反应来看,是对的。昨天是个很不错和难得的淘宝时刻,今天依然有机会。这样的机会不多,得珍惜。

    屏蔽 举报回复
  • 汪翔 回复 白草

    我不觉得,也不相信,它能够真正的形成革命性的挑战。如果真的有某种“革命性”的技术潜力,很快,其它公司的高薪挖角,就会快速的瓦解团队。结果就是新一轮的低水平重复。

    屏蔽 举报回复
  • 白草 回复 汪翔

    "人工智能依然处于初级阶段,依然需要强大的算力支持,"

    DeepSeek 的意义在于提供了造神过程的一个参照。如果用几十分之一的硬件成本就能实现目前的最高性能,那么现在几十倍的硬件消耗就很难在经济上合理。

    硬件算力升级是长期的不假,但需求有多大则难以量化。Nvidia 过去两年的涨幅已经太快太多。冲击AGI,很象是科技造神运动。这个无所不能的未来模型(就是神)需要多大的算力,电力和能创造出何种成果,都不是清晰可见的。就算未来五年中国的硬件算力追不上美国,美国也未必能做出AGI然后以AGI治国加速前进拉开距离永保领先。这个故事不再是单纯的科技突破。而是华尔街和硅谷联合造神。能不能成功,原来没有挑战者,现在有了。

    屏蔽 举报回复
  • 汪翔

    昨天预判,苹果应该得益:它在中国的手机销售不好,(我觉得)应该是AI模型(美国的进不了中国),而它自己也没有花巨资训练模型(低价模型的出现对它没有影响)。现在, DeepSeek刚好补了短板。

    谁知道,华尔街动作也很快。几天前加了一些苹果股票。今天加了些大跌的其它几家巨头的股票。

    我相信:人工智能依然处于初级阶段,依然需要强大的算力支持,而且还是很多年的继续支持。一个小毛孩,想震撼世界,可能性极低。

    屏蔽 举报回复
  • 汪翔

    这哥们和我看法相同:

    "While the model is impressive and it will have a ripple impact, the reality is that [Magnificent] 7 and US tech is focused on the AGI endgame with all the infrastructure and ecosystem that China and especially DeepSeek cannot come close to in our view," Wedbush analysts, including Daniel Ives, said in the note.

    Wedbush said the DeepSeek model "is not launching 100 times the capacity/ algorithms that is needed to even consider this a competitive threat."

    "The bears... will miss the next two years constantly waiting for the black swan event to end the AI Revolution trade... and today is no different," the analysts said. "These are just the opportunities to own the Nvidia, Microsoft, Alphabet (GOOG), Palantir (PLTR), Salesforce (CRM), Amazon (AMZN) and broader tech ecosystem that is under heavy pressure today."

    屏蔽 举报回复
  • 汪翔

    继续让你们再忧郁一点:Marc Andreessen, the Silicon Valley venture capitalist who has been advising President Trump, praised DeepSeek's model and called it a "Sputnik moment" in a post on social-media site X. That refers to the Soviet Union's 1957 launch of the first artificial satellite, named Sputnik, which shook the U.S.'s view of its technological dominance over its geopolitical rival.That raises questions about whether companies such as Microsoft and Google-parent Alphabet will need or want to continue spending increasingly larger amounts on Nvidia's future chips. It is likely to increase the focus on the potential shift away from training larger models and toward inference -- the process of generating answers or results from the models, where Nvidia's hardware advantage is less marked.

    屏蔽 举报回复
  • 汪翔
    梁文锋是DeepSeek的创始人,也是其母公司幻方量化的创始人。他是一位80后,本科和研究生都毕业于浙江大学信息与电子工程学系,拥有深厚的理工科背景。与许多量化基金创始人拥有海外对冲基金从业经历不同,梁文锋一直拥有本土教育和工作背景。

    早在2008年毕业后,梁文锋就开始带领团队使用机器学习等技术探索全自动量化交易,是中国量化投资领域的早期探索者之一。2010年沪深300股指期货的推出,为量化投资带来了发展机遇。2015年,梁文锋与校友共同创立幻方量化,并在短短一年后推出了首个基于深度学习的交易模型。2017年,幻方量化宣布实现投资策略的全面AI化。

    除了在量化投资领域的成功,梁文锋也对人工智能技术有着浓厚的兴趣。早在2017年前后,他就开始涉足AI相关探索,孵化AI项目“萤火虫”,并在2018年正式对外展示了“萤火虫”超级计算机,展现了其在硬件和基础设施方面的投入和远见。

    梁文锋在业界以技术实力著称,被认为是一位“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人。他拥有“令人恐怖的学习能力”,并且作风低调务实,更像一位技术极客而非传统意义上的老板。他倾向于从顶尖高校(如北大、清华)招募年轻人才,并提供优厚的待遇和资源支持,鼓励技术创新。DeepSeek的创立,正是梁文锋将其在量化投资领域积累的经验和对AI技术的深刻理解相结合的成果。

    (还是个校友)

    屏蔽 举报回复