马斯克发布Grok3聊天机器人,号称性能胜过DeepSeek和ChatGPT * 阿波罗新闻网
新闻 > 科教 > 正文
马斯克发布Grok3聊天机器人,号称性能胜过DeepSeek和ChatGPT

2月18日消息,埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok3聊天机器人,同OpenAIDeepSeek等大模型展开新一轮竞争。他将Grok3描述为“地球上最聪明的人工智能”,并通过基准测试和图表展示了这款聊天机器人的强大推理能力。

马斯克表示,Grok3首先面向 X的 Premium Plus订阅用户开放,他们将作为首批体验者。此外,xAI还为忠实粉丝推出了名为 Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限。

xAI表示,Grok3的预训练已经完成,整个团队一直在积极地将推理能力整合到当前的Grok3模型中。然而,这种集成仍处于早期阶段,需要更多的改进。Grok3目前正在继续接受训练。

除了Grok3推理模型外,xAI还在训练一个该推理模型的迷你版。可以将Grok3的推理数据与迷你推理模型进行对比,有时其后者的表现甚至会略微优于Grok3推理模型。

号称性能超越DeepSeek和ChatGPT

在发布会上,马斯克表示,xAI之所以将其聊天机器人命名为 Grok,是因为这个词源自美国科幻作家罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。在书中,“Grok”由一位在火星上长大的角色使用,意指对某事物全面且深刻的理解。

马斯克和他的人工智能团队声称,Grok3测试版的推理能力超过了现有的人工智能模型。在有关推理和测试时间的基准测试中,Grok3取得了比DeepSeek-R1、OpenAIo1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更优的效果。

美国AIME2025数学竞赛

xAI的比较基准显示,Grok3在科学、编码和数学方面的得分高于Gemini2 Pro、Deepseek V3、ChatGPT4o等。

并且,在盲测方面,xAI的 Grok-3(早期版本)在 lmArena排行榜中以1402分的历史最高成绩登顶,成为首个突破1400分的AI模型。这一成绩超越了 Google、OpenAI、DeepSeek等业界主要竞品。

122天打造AI超算中心,使其性能翻倍

在演示过程中,马斯克和xAI的几位高管分享了他们是如何构建Grok。马斯克透露,由于xAI希望尽快推出Grok3,时间非常紧迫。因此,他们意识到必须在短短四个月内建成数据中心。

因此,xAI花了122天让首批10万颗GPU上线并运行。这是目前全球最大的全连接H100集群。随后,xAI进一步加速扩建数据中心,仅用92天便完成第二阶段建设,使计算能力再次翻倍。

xAI团队还展示了Grok3如何执行有趣的任务。例如计算从地球到火星的航天器任务。Grok3生成了一张太空发射的动画3D轨迹图(即从地球到火星然后再返回地球的可行轨迹)。这涉及一些复杂的物理知识,Grok3需要理解这些内容。

Grok3还展示了在自动化游戏开发方面的潜力。

xAI团队要求 Grok3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素,并呈现出独特玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除,这种方式类似《宝石迷阵》。

此外,Grok3包含一个名为Big Brain的功能,这是一个推理模型模式,允许在处理查询时进行更深入的思考。马斯克指出,17个月前,最初的Grok模型几乎不能解决高中问题,而现在它已经进步了很多,他幽默地比喻“Grok已经准备好上大学了”。

开发深度搜索功能、考虑开源Grok2

除了推出 Grok3之外,xAI还透露,该公司正在筹建一家人工智能游戏工作室,该工作室将专注于为消费者提供服务。

此外,xAI正在为 Grok开发深度搜索功能(DeepSearch)。这将成为其 AI智能体的核心能力之一。DeepSearch是一款推理聊天机器人,能够阐述其理解查询内容的过程以及规划回复的方式。演示显示,DeepSearch具有研究、头脑风暴和数据分析等功能。马斯克团队还表示,他们打算“尽快”推出一款基于语音的聊天机器人。

对于Grok3是否会开源,马斯克表示,“我们通常会在新模型发布的时候,开源上一代模型,所以几个月后,我们也会对Grok2进行开源。”

结语

随着Grok-3不断刷新纪录,人工智能竞赛正加速升温。xAI通过强化推理能力、构建超大算力集群,并在游戏等应用领域进行实验性探索,正快速跻身DeepSeek、ChatGPT等头部大模型的竞争行列。

Grok-3的持续迭代表明,AI竞赛不仅未见终点,反而正在进入更激烈的阶段。

责任编辑: 李华  来源:腾讯科技 转载请注明作者、出处並保持完整。

本文网址:https://d2tszk158s4skr.cloudfront.net/2025/0218/2177429.html