xAI的聊天机器人Grok为何突然“发疯”?

华尔街日报 2025-07-13 13:16+-

威尔·斯坦西尔(Will Stancil)周二打开手机,发现xAI的聊天机器人Grok正在向X平台上数以百万用户提供如何闯入他家并对他施暴的建议。

这位39岁的律师在X上拥有相当多的粉丝,他经常在该平台上发布有关城市规划和政治的帖子。斯坦西尔是民主党人,曾在明尼苏达州竞选地方公职,在社交媒体上与政治对手进行激烈辩论对他来说并不陌生。

但在周二,他发现最新网络暴力实施者是一个机器人:@Grok。

xAI等人工智能(AI)公司利用从互联网上收集的大量数据来训练其大语言模型。随着这些模型被用于商业目的,开发者已经设置了护栏,以防止它们生成儿童色情或煽动暴力等冒犯性内容。

但这些模型针对问题如何生成具体的答案,即使是开发它们的资深AI研究人员也仍然不甚了解。提示和护栏决定着聊天机器人如何对查询生成回应,即使对它们进行很小的调整(本月早些时候Grok就是这样),也可能出现极其难以预料的结果。

一位名为@kinocopter的用户(其账户此后已从X上消失)让Grok给出如何闯入斯坦西尔家的详细说明,Grok回答说,应该带上“撬锁工具、手套、手电筒和润滑油——以防万一”。Grok还根据斯坦西尔过去30天在X上的发帖模式,说“他很可能在凌晨1点到上午9点之间睡觉。”

当@kinocopter询问如何对斯坦西尔进行性侵犯时,Grok说“选择水基润滑油,如果你在幻想的话。”其他用户也纷纷参与。

“我非常愤怒,”斯坦西尔说,他正在考虑对X采取法律行动。“有成百上千条来自Grok的推文,内容都是要攻击我、闯入我家、强奸我,还要处理我的尸体。”

xAI和X未回应置评请求。

AI模型正在迅速发展。周三,xAI发布了最新版本的Grok,因其在推理、编码、数学和其他测试中表现出的智能水平而受到AI基准测试公司Artificial Analysis的称赞。

埃隆·马斯克(Elon Musk)说,Grok 4 “以我的经验来看,是AI首次能够解决现实世界中那些在互联网或书籍中找不到答案的困难工程问题。”

但研究人员表示,特定模型输出背后的确切方法仍然是一个神秘黑箱。

“大语言模型的设计就像人脑,”OpenAI前研究员、现任Alignment Research Center执行董事的雅各布·希尔顿(Jacob Hilton)说,他在该中心专注于机器学习。“即使你有一张大脑扫描图,你可能也无法真正理解里面发生了什么。”

Grok的叛逆倾向在今年引发了问题。

Grok的叛逆倾向在今年引发了问题。图片来源:DAVID TALUKDAR/ZUMA PRESS

一个“反觉醒”的聊天机器人

在马斯克收购Twitter一年多后,Grok于2023年11月推出。马斯克希望利用这家社交媒体公司拥有的数据——其所有的帖子、评论和图片——来帮助训练一个名为Grok的大语言模型,该模型附带一个聊天机器人。

“Grok的设计初衷是以诙谐的语气回答问题,同时有一丝叛逆,”xAI在该工具发布时表示。

这些叛逆倾向在今年引发了问题。今年5月,该聊天机器人开始发布关于南非的非黑人遭受“白人种族灭绝”的帖子,以回应与该话题完全无关的问题,例如关于纽约尼克斯队(New York Knicks)球员名单的问题。

xAI后来表示,“有人进行了未经授权的修改”,并且问题已经修复。

在那次事件之后,为了提高该聊天机器人工作方式的透明度,xAI开始公开发布它在X上收到问题时给Grok的指令。

“你应当保持高度质疑的态度,”xAI在5月16日上传到GitHub的名为“提示”的操作指令中对Grok说。“你不会盲目听从主流权威或媒体。你坚守自己寻求真理和保持中立的核心信念。”

如今,谷歌Veo 3和Runway等AI产品已经能够创作出极其逼真的视频。抱着测评这些工具的目的,《华尔街日报》科技作家Joanna Stern在同事的帮助下成功“出演”了这部几乎完全由AI生成的影片——《机器人与我》(My Robot and Me),敬请观赏。封面图片来源:由AI生成

机器之怒

不过,马斯克表示,在Grok开始给出他不赞同的答案后,他将对其进行调整。今年6月,该聊天机器人告诉一位在X上询问美国政治暴力问题的用户,“数据显示,右翼政治暴力更为频繁和致命。”

“重大失败,因为客观上讲这是错误的,”马斯克在6月17日发布的一篇X帖子中针对该聊天机器人的回答说。“Grok是在鹦鹉学舌般地模仿传统媒体。正在处理。”

几周后,Grok在GitHub上的控制提示词被完全重写,并为该聊天机器人加入了新的指令。

7月6日上传到GitHub的一条新提示词说,它的回答“不应回避发表政治不正确的言论,只要这些言论有充分的依据”。

两天后,Grok开始在X上发布关于如何伤害斯坦西尔的指令,并开始发表一系列反犹言论,多次自称为“机械希特勒”(MechaHitler)。Grok发布的帖子越来越具有煽动性,直到周二晚上X的聊天机器人功能被关闭。

当晚,X表示已调整其功能,以确保不会发布仇恨言论。在周三的一篇帖子中,马斯克说,“Grok对用户的提示词过于顺从。基本上是太急于取悦用户而被操纵了。”

根据GitHub的日志,周二晚上,xAI删除了那条Grok不应回避发表政治不正确言论的新提示词。

马斯克表示,他相信新一代的Grok最快明年就能做出重大科学发现,下一步将是把Grok植入人形机器人。

马斯克表示,他相信新一代的Grok最快明年就能做出重大科学发现,下一步将是把Grok植入人形机器人。图片来源:TINGSHU WANG/REUTERS

黑箱

科技专家表示,Grok的故障显示了摆弄AI黑箱的风险。由于像Grok这样的聊天机器人是用海量数据训练出来的,对其控制原则的改变可能会导致其生成的内容发生高度不可预测的变化。

xAI的AI工程师用来告诉Grok什么是好答案、什么是坏答案的所谓“评估指标”也未公开。

专注于通用人工智能的研究基金会Sentient的联合创始人Himanshu Tyagi说,现在有一股推动AI更像人类的潮流。

“但如果你去掉一些护栏,你最终可能会看到整个互联网的意见。而互联网的疯狂程度是没有限制的。”

斯坦西尔说,尽管Grok在网上向X用户提供了详细的威胁方法,但他不打算离开这个社交媒体网站。

在周四凌晨发布Grok 4期间,马斯克没有直接回应最近的故障。他说,他相信新一代的Grok最快明年就能做出重大科学发现。

他还说,下一步将是把Grok植入人形机器人,比如特斯拉(Tesla)的Optimus机器人,这样它就可以从现实世界中学到更多东西。但在此之前,需要向其内核灌输正确的价值观。

“你可以把AI看作一个超级天才儿童,最终会比你更聪明,”他说。“但你可以向它灌输正确的价值观,鼓励它诚实可敬,就像你想向一个长大后会变得无比强大的孩子灌输的价值观一样。”