AI领域超级明星预言:危机即将到来

华尔街日报 2026-05-22 14:59+-

  两位参与构建广受欢迎的OpenClaw AI 代理核心的工程师发出严厉警告:本应能够取代高薪软件开发人员的人工智能,正在向世界倾泻大量糟糕的、甚至可能危险的代码。

  他们把这种现象称为“vibe slop”,它是“vibe coding”(用人工智能工具创建软件,并用简单的英语进行描述)和“AI slop”(社交媒体上无穷无尽的低价值人工智能生成内容)的结合体。

  他们说,当程序员用人工智能快速生成程序来代替设计和测试系统的繁琐工作时,就会出现“软件质量低劣”的问题,而最终生成的软件经不起时间的考验。这个问题已经非常严重,以至于全球主要的开源代码库——GitHub——已经制定了新的政策和功能来应对它。

  “基础设施正在崩溃,软件也比以前漏洞百出,” Pi (OpenClaw内部的智能体框架)的创建者Mario Zechner说。“我们或许还能再玩几个月,甚至几年,但最终它会让我们付出代价。”

  泽克纳和他的合作伙伴阿明·罗纳赫尔并非认为人工智能毫无用处。他们两人都在自己的项目中利用人工智能处理繁琐的工作。而且,他们对人工智能充满信心,以至于开发出了一款如今已被数百万人使用的AI编程工具。

  他们的核心观点是:这些系统本应大幅提升资深工程师的生产力,从而使公司能够裁减初级工程师,但实际上,许多公司却为了短期的生产力而牺牲了长期的利益。不仅初级人才储备枯竭,而且还会带来诸多后续影响,例如软件漏洞百出、服务中断、安全隐患以及不断累积的技术债务。

  人类被排除在外

  作为有声望但又不依赖于大型科技公司的独立程序员,这两位正在软件界激烈争论中发表意见——而此时,OpenAI 和 Anthropic 这两家巨头正着眼于它们的首次公开募股 (IPO)。

  支持者认为,人工智能可以彻底改变公司处理数十年遗留代码的方式,而且在某些情况下确实如此。即使是那些没有将人工智能应用于公司核心软件的开发人员也表示,他们找到了一个平衡点,即利用人工智能创建软件测试或快速原型。许多顶尖人工智能实验室的专家坚信,人工智能本身就是评估和改进人工智能生成代码的解决方案,无需人工逐行审查。

  “如果你认为它开箱即用,那它很可能不会,”领导 OpenAI 团队构建其编码工具 Codex 的 Rohan Varma 说。

  他补充说,为了让人工智能生成的代码能够真正部署到客户手中,工程师现在可以直接使用 Codex 来检查这些代码。目前,该系统已经能够像人一样查看和测试网站,检查代码是否遵循公司特定的最佳实践,并检测是否存在安全问题。

  然而,他表示,对于服务于数百万人的关键基础设施而言,即使在 OpenAI,人类工程师最终也负责审查人工智能生成的任何代码,并对这些系统的成功或失败负责。

插图描绘了一个面带微笑的粉色人物,他拿着一台笔记本电脑,绿色液体从电脑里流出来,他竖起了大拇指。

 Joe Magee for WSJ

  人工智能编码的局限性

  Alphabet首席执行官桑达尔·皮查伊 (Sundar Pichai)在最近的一篇文章中写道,谷歌所有新代码中 75% 是由人工智能生成的,高于去年秋季的 50%。一年前,Meta首席执行官马克·扎克伯格 (Mark Zuckerberg)预测,到 2026 年底,人工智能将负责编写和审查公司内部人工智能开发团队的大部分代码。

  很难将这种说法与批评者的疑虑调和起来。但泽克纳表示,这恰恰说明人们对当今人工智能代理的能力范围存在误解。

  例如,人工智能编码工具更擅长生成新代码,而不是评估和升级现有软件,尤其是成熟公司内部存在的大量现有软件。

  利用人工智能代理进行产品概念编码的初创公司可以快速创建新程序。但泽克纳补充说,一旦他们的系统达到一定规模和复杂度,他们就会发现自己与大型企业面临着同样的困境,即人工智能代理的用途有限。

  人因工程及其克劳德代码工具是这些矛盾的一个案例研究。

  泽克纳赞扬该公司“自研”自家软件的做法——也就是用自己的软件构建内部系统。但他并不喜欢这款工具。

  “Claude Code是我这辈子用过的最烂的软件之一,”他说道,并列举了屏幕画面闪烁、功能臃肿以及内存占用过高等问题。Zechner将这些问题归咎于开发者使用人工智能技术进行开发。

  Anthropic公司旗下Claude Code的产品负责人Catherine Wu表示,视觉闪烁是软件团队快速开发、优先推出新功能所导致的副作用。过去一年,Claude Code的用户平均使用时长从每天20分钟增加到每周20小时。她补充说,闪烁问题已基本解决。

  吴女士表示,人工智能工具使初级工程师能够对他们开发的功能承担更多责任,从概念设计到最终交付给客户。她补充说,虽然 Anthropic 公司不断更新其向人工智能发出的指令,以帮助其避免过去的错误,但“最终责任仍然在于人”。

  Anthropic 拥有全球顶尖的人工智能工程师,因此,采用人工智能驱动型方案对他们来说或许可行,但这种方案未必适用于该公司的所有客户。撰写时事通讯《理解人工智能》(Understanding AI )的计算机科学家 Timothy B. Lee 指出,许多公司在处理内部软件系统时,依赖于程序员多年积累的隐性知识——而这些知识并不会用于人工智能代理的训练数据中。

  “这些模型很容易出错,必须有人注意到这一点,”李说。

  账单到期时

  泽克纳认为,清算即将到来。他认为,大型公司很快就会意识到,过度依赖人工智能生成的代码正在推高成本,并导致软件质量下降。他认为,许多依赖直觉式编程的小型创业公司将会倒闭。他还认为,像GitHub这样的云端软件工具库将继续充斥着人工智能生成的垃圾代码。

  就在泽克纳和罗纳赫从奥地利的家中办公室拨入我们的视频采访之前,泽克纳不得不禁止一位(人类)程序员向他在GitHub上的一个代码库提交代码。这位程序员毫不知情,他的AI代理程序却不断地提交虚假的错误报告。

  泽克纳摇了摇头,说道:“我的意思是,我们到底在做什么?”