舒畅

注册日期:2025-02-27
访问总量:277029次

menu网络日志正文menu

舒畅:马斯克推出 Grok 4,意义重大


发表时间:+-

舒畅:马斯克推出 Grok 4,AI 军备竞赛正式升级

马斯克最近又出手了。这一次,他在人工智能领域掀起了新的波澜。由他主导的 xAI 公司,刚刚发布了新一代通用人工智能模型,命名为 Grok 4。这不是一个简单的升级,而是一种战略性宣示,它向 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 等一众大模型发起了直接挑战,甚至隐含了向“强人工智能”——也就是 AGI(Artificial General Intelligence,通用人工智能)迈进的野心。

说到这里,有必要对一些术语做个简单解释。所谓 xAI,是马斯克在 2023 年创建的一家人工智能公司,其宗旨是打造“最大限度追求真理”的 AI,强调不被政治正确绑架,主张模型能说真话、能批判。而 AGI,则是人工智能界长期追求的终极目标:一个能够像人类一样全面思考、理解、学习并解决各类问题的系统,不再只是语言模型,而是具备人类级别智能的“通才思维引擎”。Grok 4 正是在这样的理念下诞生的。

这听来好像是天方夜谭,不可思议,但事实就是这样

这次发布的 Grok 4 分为普通版和名为 Grok 4 Heavy 的高级版。后者采用类似“多智能体协同推理”的技术架构,让多个子模型分工合作,从而完成更复杂、更连贯的思维任务。这种结构目前在主流模型中还相当罕见。xAI 还推出了收费高达每月 300 美元的 SuperGrok 高级订阅计划,面向更深度使用者与开发者群体。这些不同层级的设置,不仅是商业策略,更是表明马斯克准备亲自参与到 AGI 的竞赛当中。

为什么说它“恐怖”?有两个例子就足以说明。第一,在一项被称为“人类最后的考试”(Humanity’s Last Exam)的测试中,Grok 4 Heavy 的得分高达 44.4%,大幅领先 Google Gemini 2.5 Pro 和 OpenAI 最新版本,甚至远超 Claude Opus。第二,在 ARC-AGI-2 图形类推理测试中,Grok 4 Heavy 的得分也遥遥领先其他大模型,是 Claude 的两倍。ARC 测试主要评估 AI 是否具备抽象思维能力,它并非拼记忆或堆数据,而是看 AI 是否真正“会想”。Grok 在这一点上已经让人感到,它不只是能聊天,更像是在用某种近似于“理性”的方式去思考。

与此同时,它也因为“太自由”而招致争议。Grok 4 的自动发帖系统曾在上线初期发布过极具争议的内容,包括一些涉及极端主义的说法,引发外界不满。xAI 方面紧急介入,删除内容,并强调将改进过滤机制。这也从另一个角度反映出:当一个 AI 模型试图不受人类限制、自由表达的时候,它究竟是更接近真理,还是更接近混乱?这个问题值得深思。

进一步来看,Grok 4 不仅仅是一个写文章、答问题的工具,它还极有可能被美国国防界关注与接入。马斯克本人就曾经与五角大楼、NASA、国防高级研究计划局(DARPA)等有深厚合作关系。他的 Starlink 已经被美军用于战场通信,SpaceX 的火箭被用来发射军事卫星。那么,Grok 4 作为一个具备高级推理、图像识别、代码分析与目标规划能力的系统,将来如果被用于军事战略制定、敌情预警、无人系统指挥,甚至核危机管理,并不令人意外。尤其在面对日益复杂的国际安全局势中,美国肯定不希望被中国、俄罗斯或其他势力在 AI 军事化领域超前一步。从这个角度来看,Grok 4 很可能是美国科技与军工深度融合的新平台。

此外,Grok 4 还可能在科学研究领域扮演重要角色。过去 AI 模型只能辅助查找文献、生成摘要,而如今的 Grok 4 已具备结构性建模与跨领域概念迁移能力,甚至可以提出新的假设。这就带来了一个震撼的问题:它的“智商”是否已经超过人类?目前并没有正式的 IQ 测验标准来衡量 AI,但如果让它做人类常用的智商测试——例如韦氏量表、雷文矩阵等,Grok 4 Heavy 我相信完全可能在推理速度、抽象能力、问题处理上超越大多数人类平均水平。如果真如此,那么它参与科学创新,甚至提出新型数学猜想、设计分子结构、规划能源模型,这些原本只有天才科学家能完成的任务,也许都可以交由它处理。AI 不再是“助手”,而是在某个领域、某个研究的“引路人”。

在look for被广泛使用之前,先顺便介绍一下ChatGPT的使用情况,OpenAI 的 GPT-4 虽然也功能强大,但至少普通人可以通过 20 美元的月费方式获得 GPT-4-turbo 版本的使用权。目前这项服务在美国、加拿大、澳洲、新加坡、香港等地广泛开放,但中国大陆地区无法直接使用,只能通过第三方方式绕道访问。而免费的 GPT-3.5 版本仍可供大多数人使用,适合日常写作、翻译、问答等需求。OpenAI 也为企业用户提供按调用量计费的 API 服务,适合更高级开发者接入大模型接口。从这一点出发,我们是不是可以这样推行格,将来要推广到中国被使用看来时遥远的事情。这是因为整体趋势正在加速清晰: AI 已不仅仅是一个聊天机器人或写作工具,它还将可能是科学的发现者、战争的预演者、文明的塑造者和最高级的医生。而马斯克这次推出的 Grok 4,只是其中一步,它已不仅是科技产品,更是一次文明方向的预演。我们站在历史关口,而 AI,正走在前面。



浏览(300)
thumb_up(1)
评论(0)
  • 当前共有0条评论