发布信息

马斯克官宣Grok-3全家桶:人类史上首个20万块GPU训练模型问世,性能超越o3-mini/DeepSeek-R1

作者:软荐小编      2025-02-20 09:10:54     173

在200,000 GPU的人类历史上的第一个模型终于出现了!

刚才,马斯克带领三名XAI成员开始在线直播,正式宣布了Grok-3家庭桶 -

Grok-3(Beta),Grok-3 mini第一个推理模型Grok-3推理(Beta),Grok-3 mini推理:击败O3 Mini/deepSeek-r1,在解锁推断时计算第一个AI Agent“ DeepSearch”:深入搜索互联网

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Openai发射活动的气味吸引了您

据报道,第三代Grok的训练计算量实际上是Grok-2的10倍,那么实际性能是什么?

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

全球最大的超级计算机集群Colossus拥有200,000 GPU:经过100,000 GPU的同步培训(第一阶段花了122天的时间); 200,000 GPU(第二阶段花了92天才能完成)

在多个基准测试中,Grok-3刷新了数学(AIME 2024),科学问答(GPQA)和编码(LCB)(LCB)的SOTA,显着超过了DeepSeek-V3,Gemini-2 Pro和GPT-4O。

Grok-3 mini的性能基本上是领先或与其他封闭式/开源型号相提并论。

Grok-3的数学能力是惊人的,几乎可以完成大多数美国数学专业能力测试问题。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

更令人惊讶的是,Grok-3还带来了推理模型-Grok-3推理,这将在回答问题时显示思维过程。

输入聊天门户,然后直接选择“思考”模式以启用魔术。

此外,同时启动了代理的“大脑”模式和“深度搜索”模式。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

几天前,马斯克在预告片中发表了大胆的声明:“这是地球上最聪明的AI”,这一说法是正确的。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

始终喜欢做某事的Ultraman说,GPT-4.5会让我深深地感觉到Agi,然后我将不得不开源模型在整个网络上投票。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

一些网民甚至建议我们不妨在晚上7:30发布GPT-4.5! Ultraman:那不是很好。

Ultraman的言论显然是为了破坏军队的士气。据谣言,Grok-3发布了这个历史性的时刻,所有Openai成员都观看了这场战斗。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Openai发布的O3米尼刚刚击败了R1,现在被Grok-3恢复了。我想知道GPT-4.5是否会今晚到达?

关键命中O3米尼,DeepSeek-R1,解锁测试时的计算

有人说Grok-3是最终的扩展法测试,现在似乎就是这样。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

从2023年的Grok-1首次发布到Grok-1.5的逐渐迭代,再到Grok-2的逐渐迭代,模型推断性能迅速飙升,并且还吞噬了很多计算能力。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Grok-3家族将“测试时间计算”带入了极端。凭借100,000 H100超级计算机,受过训练的野兽几乎没有与之竞争的“模型”。

它成为第一个在ELO分数中打破1400的模型,在所有分类测试中排名第一。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

在多个基准测试中,推理模型的性能GROK-3推理和Grok-3 Mini推理显着超过了O3-Mini(高),O1,DeepSeek-R1和Gemi-2在数学,科学和科学和GEMI-2闪光编码。思维。

可以说,到目前为止,最强的“推理模型”都被Grok-3推理所击败。可以说,这是真正的“世界上最聪明的模式”。

该小组说,格罗克被允许思考和理由持续更长的时间。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

在最新的数学基准AIME 2025上,Grok-3的两个新型号的性能分别刷新了SOTA,分别为93分和90分。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

顺便说一句,Grok-3思维链与O3-Mini常规相同 - 防止被盗的Xai掩盖了思维过程的一部分。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

接下来,让我们看一下Grok-3的强大推理能力。

先进的推理思考

首先是一个航天器任务,为地球发射,火星着陆和下一个返回地球的窗口生成了动画3D代码。

请注意,此问题的困难是该过程涉及大量数学和物理模型计算。在此之前,团队从未尝试过让大型模型计算出空间的发射窗口。

在“思考”模式下,您可以看到Grok的思想痕迹,甚至可以进入解决问题时Grok在想什么。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Grok 3迅速产生了一个完整且可播放的3D动画。在代码中,开普勒定律在Grok-3上数字求解。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

下图是一张3D动画图片,在任务期间直观地显示了太阳,地球,火星和航天器之间的位置关系。

即使,宇航员也可以基于此直接计算出口机舱的时间和距离。地球上有一个转移路径,这种交叉每26个月发生一次。接下来,我们现在在过渡窗口中。

检查后,研究人员兴奋地说:Grok-3给出的答案是完全正确的!

最后,马斯克发现了答案:实际上,这是SpaceX的真实探索曲目。他自信地说,在两年内,地球和火星将连接。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

很快,一些网民评论说:“可以证实,Grok-3非常强大!”

相比之下,O1,O1-Pro和O3-Mini(高)都陷入了此问题:生成一个从地球发射的代码,登录火星,然后在下一个发射窗口中返回地球。

“如果可以运行,他们生成的代码可以运行,但是不幸的是,航天器从未接近火星,更不用说回来了。”网民说。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

然后,团队要求Grok-3进行比赛。要求是两个游戏的混合,即俄罗斯方块和宝石迷宫。

演示说:“显然,如果让AI创建像Tetris这样的游戏,互联网上有很多示例或Gem Maze之类的游戏。它可以复制它们。”

因此,他们要求Grok-3创建两个游戏的混合体,即俄罗斯方块和宝石迷宫。这次,他们使用了“大脑”模式,这种模式可以使用更多的计算能力。

然后,Grok-3然后使用Python开始编写代码,可以看出它称为Pygame,随机和时间库来完成游戏写作。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

代码完成后,Grok-3,Tetris和Gem Maze产生的两个游戏的混合物成功运行。尽管游戏逻辑有些随机,但界面还是很漂亮。

“我们准备好在X.AI建立游戏工作室了吗?”演示员工兴奋地说。 “是的,所以我们正在X.AI创办AI Game Studio。”

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

在此过程中,研究人员讨论了:最佳的AI模型必须像人类一样思考,思考所有可能的对策和解决方案,批评自己,追踪并从第一原则中思考。

甚至Grok都可以理解他的逻辑和推理过程中的某些错误,纠正他的错误,并概念化一些数学推理过程,而在现实生活中,这是这些问题的扩展。

研究人员说,真正令人兴奋的是,Grok-3可用于完成现实世界中的任务,例如建造特斯拉或发射火箭。

这正是Grok团队目前正在考虑的事情。

DeepSearch

出乎意料的是,这次马斯克还带来了Grok -3的第一个代理-DeepSearch。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

DeepSearch是Grok的第一代代理,它可以在Internet上进行更多的深入搜索。

它允许用户对Internet和X平台进行全面搜索。该模式分析了大量信息,并通过快速有效的搜索过程提供了详细且合理的答案。

此外,其信息检索过程对用户更透明。您可以告诉它仅使用X中的内容,并且它将尝试遵守此要求,因此它更可控制和更聪明。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

我们可以问DeepSearch Agent:下一个星际飞船何时发布?

如您所见,在左侧,它显示了搜索和推理的过程,而在右侧,它显示了深思熟虑的过程以及模型正在浏览的网址和网页。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

最后,经纪人给出了答案:2月24日25日。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

玩家还可以问:POE 2中最难的核心类型是什么?

除了给出答案之外,炼狱大师召唤流还提供了有关如何在答案中获得更多武器的指南。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

因此,使用Grok Intelligence节省了比当今普通搜索引擎更多的时间。

Grok团队说,从现在开始,也许所有实习生都将失业,我们所需要的就是将任务纳入大型模型。每月花费40美元可以带来数十亿美元的回报。

马斯克:所有功能都在一周内启动,并将在几个月内完全开放

那么,何时打开Grok-3?

作为回应,马斯克说,现在可以使用Premium Plus的X用户。

Grok忠实的粉丝可以单独订阅Supergrok,从而解开高级功能,例如深入搜索和思考模型,并成为新功能的早期体验的浪潮。

新的URL是GROK.com,您也可以在App Store中下载它。

马斯克强调,最新版本必须是网络版本,并且应用商店相对落后。

目前,Grok-3每天都在更新其推理功能。马斯克说:一周之内,所有Grok的功能都将启动!

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

门户网站:

问答

语音助手版本何时发布?这将需要一个星期。

什么时候启动Grok-3 API?几周之内。

Grok 3语音模式是本地的,还是文本到语音的?它是Grok-3的变体,可以理解您说的话并直接生成音频。

Grok-3可以将音频转录成文本吗?没问题。该声音模型不仅像文本语音一样简单,还具有对话记忆功能,并且可以记住与您的先前交互记录。

马斯克说,Grok-3将在几个月内完全开放。

Grok-3中最令人兴奋的部分是什么?培训模型和100%逻辑推理是最难的部分,就像您需要随时随地设计宇宙中的最新发展一样。

如何设计历史上最困难的推理模型?研究人员说,我们花了24个月的时间来擦亮该模型,以确认它在逻辑推理方面取得了最新进展。同时,他们使用了一家废弃的工厂。数据中心是在孟菲斯建造的,因为它需要计算能力和能量功能,因此需要1/4 GW才能向GPU供电,并且还需要冷却设施。

以前,没有人真正在数据中心实施了液体冷却,但是Grok团队做到了!

为了进一步为数据中心提供动力,我们使用了特斯拉的Megapacks,并重新计算了建筑物的能源供应。最终证明:团队的计算是有效的!

此外,需要将不同的计算机连接在一起以在此过程中共享信息。在此过程中,团队将看到模型之间的供应不平衡。

一方面,它是建筑能源供应和节能的重新设计。另一方面,团队设计了一个大型型号,并设计了一个全新的算法流程。

研究人员说,尚不知道其他大型模型是否还需要太多的人力和物质资源,例如Grok-3。

当然,团队还希望减少模型的能耗,并在下一步中将数据中心的能耗从1/4 GW减少。也许需要重新设计它,以使其成为世界上最有效的数据中心。

AI巨人高度赞扬:Grok-3取得了惊人的成绩

事先获得内部测试资格后,AI Tycoon Karpathy进行了评估,并分享了比文章更长的见解。

总而言之,Grok-3推理模型是最先进的,并解决了Catan定居者的问题。上传GPT-2纸后,Grok-3完成了一个简单的搜索问题。

它不能解决Riemann假设难题,而是简单地说:“这是一个很大的尚未解决的难题。”

在体验“深入搜索”功能时,它结合了思考 +深入研究的能力,为需要研究和发现的问题提供高质量的答案,并提供参考链接。

最后,Karpathy的评估是“ Grok-3 +思维似乎已经达到了与O1 Pro(每月200美元)的可比性,并且比DeepSeek-R1和Gemini 2.0 2.0 Flash Thinking略好。”

大约一年前,XAI团队从0开始,在这么短的时间内达到了最高水平,这是一个前所未有的惊人成就。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Grok-3还通过了物理模拟测试,其效果与O3-Mini相当。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Xai Lianchuang还说:“我们改善模型和系统的速度比任何一个里程碑更重要。Grok-3证明我们能够在19个月内从零开始以达到最先进的水平。”

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

此外,XAI工程师还揭示了即将到来的“高级语音模式”

Grok-3出现了,并将Xai带回了世界上第一个梯队。

要总结一下马斯克的话 - 要确定哪个公司在技术竞争中将赢得胜利,您只需要注意其创新速度的一阶派生派和二阶导数即可。

_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Xai团队获胜的那一刻值得录制。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI__马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

Ultraman的AGI也准备好了。

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI_

参考:

相关内容 查看全部