舒畅：马斯克推出 Grok 4，意义重大

发表时间：2025-07-11 18:33

舒畅：马斯克推出 Grok 4，AI 军备竞赛正式升级

马斯克最近又出手了。这一次，他在人工智能领域掀起了新的波澜。由他主导的 xAI 公司，刚刚发布了新一代通用人工智能模型，命名为 Grok 4。这不是一个简单的升级，而是一种战略性宣示，它向 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 等一众大模型发起了直接挑战，甚至隐含了向“强人工智能”——也就是 AGI（Artificial General Intelligence，通用人工智能）迈进的野心。

说到这里，有必要对一些术语做个简单解释。所谓 xAI，是马斯克在 2023 年创建的一家人工智能公司，其宗旨是打造“最大限度追求真理”的 AI，强调不被政治正确绑架，主张模型能说真话、能批判。而 AGI，则是人工智能界长期追求的终极目标：一个能够像人类一样全面思考、理解、学习并解决各类问题的系统，不再只是语言模型，而是具备人类级别智能的“通才思维引擎”。Grok 4 正是在这样的理念下诞生的。

这听来好像是天方夜谭，不可思议，但事实就是这样

这次发布的 Grok 4 分为普通版和名为 Grok 4 Heavy 的高级版。后者采用类似“多智能体协同推理”的技术架构，让多个子模型分工合作，从而完成更复杂、更连贯的思维任务。这种结构目前在主流模型中还相当罕见。xAI 还推出了收费高达每月 300 美元的 SuperGrok 高级订阅计划，面向更深度使用者与开发者群体。这些不同层级的设置，不仅是商业策略，更是表明马斯克准备亲自参与到 AGI 的竞赛当中。

为什么说它“恐怖”？有两个例子就足以说明。第一，在一项被称为“人类最后的考试”（Humanity’s Last Exam）的测试中，Grok 4 Heavy 的得分高达 44.4%，大幅领先 Google Gemini 2.5 Pro 和 OpenAI 最新版本，甚至远超 Claude Opus。第二，在 ARC-AGI-2 图形类推理测试中，Grok 4 Heavy 的得分也遥遥领先其他大模型，是 Claude 的两倍。ARC 测试主要评估 AI 是否具备抽象思维能力，它并非拼记忆或堆数据，而是看 AI 是否真正“会想”。Grok 在这一点上已经让人感到，它不只是能聊天，更像是在用某种近似于“理性”的方式去思考。

与此同时，它也因为“太自由”而招致争议。Grok 4 的自动发帖系统曾在上线初期发布过极具争议的内容，包括一些涉及极端主义的说法，引发外界不满。xAI 方面紧急介入，删除内容，并强调将改进过滤机制。这也从另一个角度反映出：当一个 AI 模型试图不受人类限制、自由表达的时候，它究竟是更接近真理，还是更接近混乱？这个问题值得深思。

进一步来看，Grok 4 不仅仅是一个写文章、答问题的工具，它还极有可能被美国国防界关注与接入。马斯克本人就曾经与五角大楼、NASA、国防高级研究计划局（DARPA）等有深厚合作关系。他的 Starlink 已经被美军用于战场通信，SpaceX 的火箭被用来发射军事卫星。那么，Grok 4 作为一个具备高级推理、图像识别、代码分析与目标规划能力的系统，将来如果被用于军事战略制定、敌情预警、无人系统指挥，甚至核危机管理，并不令人意外。尤其在面对日益复杂的国际安全局势中，美国肯定不希望被中国、俄罗斯或其他势力在 AI 军事化领域超前一步。从这个角度来看，Grok 4 很可能是美国科技与军工深度融合的新平台。

此外，Grok 4 还可能在科学研究领域扮演重要角色。过去 AI 模型只能辅助查找文献、生成摘要，而如今的 Grok 4 已具备结构性建模与跨领域概念迁移能力，甚至可以提出新的假设。这就带来了一个震撼的问题：它的“智商”是否已经超过人类？目前并没有正式的 IQ 测验标准来衡量 AI，但如果让它做人类常用的智商测试——例如韦氏量表、雷文矩阵等，Grok 4 Heavy 我相信完全可能在推理速度、抽象能力、问题处理上超越大多数人类平均水平。如果真如此，那么它参与科学创新，甚至提出新型数学猜想、设计分子结构、规划能源模型，这些原本只有天才科学家能完成的任务，也许都可以交由它处理。AI 不再是“助手”，而是在某个领域、某个研究的“引路人”。

在look for被广泛使用之前，先顺便介绍一下ChatGPT的使用情况，OpenAI 的 GPT-4 虽然也功能强大，但至少普通人可以通过 20 美元的月费方式获得 GPT-4-turbo 版本的使用权。目前这项服务在美国、加拿大、澳洲、新加坡、香港等地广泛开放，但中国大陆地区无法直接使用，只能通过第三方方式绕道访问。而免费的 GPT-3.5 版本仍可供大多数人使用，适合日常写作、翻译、问答等需求。OpenAI 也为企业用户提供按调用量计费的 API 服务，适合更高级开发者接入大模型接口。从这一点出发，我们是不是可以这样推行格，将来要推广到中国被使用看来时遥远的事情。这是因为整体趋势正在加速清晰： AI 已不仅仅是一个聊天机器人或写作工具，它还将可能是科学的发现者、战争的预演者、文明的塑造者和最高级的医生。而马斯克这次推出的 Grok 4，只是其中一步，它已不仅是科技产品，更是一次文明方向的预演。我们站在历史关口，而 AI，正走在前面。