发布信息

DeepSeek R1震撼发布:2025年AI领域的新起点,纯强化学习路线引领未来

作者:软荐小编      2025-01-26 14:01:00     186

我们谁也没想到,AI领域的2025年会是这样开始的。

DeepSeek R1 太棒了!

近期,“神秘东方势力”DeepSeek正在“难以控制”硅谷。

黄金特工2黄金圈在线看_物理暴击宝珠有哪些_

我将让 R1 详细解释勾股定理。这一切都是人工智能在不到30秒的时间内一口气完成的,没有任何错误。简单来说,结束了。

在国内外AI圈子里,普通网友发现了一种神奇而强大的新AI(也是开源的),学术专家纷纷高呼“我们必须迎头赶上”。也有传言称,海外AI企业已经面临强敌。

我们来谈谈本周刚刚发布的DeepSeek R1。其没有任何监督训练的纯强化学习路线令人震惊。看起来已经从去年12月的Deepseek-v3基础发展到了今天堪比OpenAI o1的思维链能力。完成某事。

但在AI界忙于阅读技术报告、对比实测的同时,人们仍然对R1心存疑虑:除了跑赢一堆基准测试之外,它真的能领先吗?

创建自我模拟“物理定律”的能力

你不相信吗?快来让大模特打弹球吗?

最近几天,AI 社区的一些人迷上了一个测试——测试不同的大型 AI 模型(尤其是所谓的推理模型)来处理一类问题:“编写一个 Python 脚本制作一个黄球在某个形状内弹跳,让形状缓慢旋转并确保球停留在形状内。”

在这个“旋转球体”基准测试中,某些模型的表现优于其他模型。据CoreView CTO Ivan Fioravanti介绍,国内人工智能实验室DeepSeek的开源大型模型R1完全击败了OpenAI的o1 pro模型,该模型是OpenAI ChatGPT Pro计划的一部分,每月费用为200美元。

黄金特工2黄金圈在线看_物理暴击宝珠有哪些_

左边是OpenAI o1,右边是DeepSeek R1。如上所述,这里的提示是:“为正方形内弹跳的黄色球编写一个Python脚本,确保正确处理碰撞检测。使正方形缓慢旋转。在Python中实现它。确保球留在正方形内。 ” ”

据X上另一位网友透露,Anthropic的Claude 3.5 Sonnet和Google的Gemini 1.5 Pro模型对物理判断错误,导致球偏离了形状。也有用户反映,谷歌最新的Gemini 2.0 Flash Thinking Experimental和相对较老的OpenAI GPT-4o一口气通过了评估。

但这里我们也可以区分优劣:

_物理暴击宝珠有哪些_黄金特工2黄金圈在线看

这条推文下的网友表示:o1的能力原本很好,但经过OpenAI优化速度后变得更弱,即使是200美元的月费会员版本。

模拟弹跳球是一个经典的编程挑战。精确的模拟结合了碰撞检测算法,需要识别两个物体(例如球和形状的侧面)何时发生碰撞。编写不当的算法可能会影响模拟的性能或导致明显的物理错误。

人工智能初创公司 Nous Research 的研究员 N8 Programs 表示,他花了大约两个小时从头开始对旋转七边形中的弹跳球进行编程。 “你必须跟踪多个坐标系,了解每个系统中的碰撞如何进行,并从头开始设计代码以使其稳健。”

虽然弹跳球和旋转形状是对编程技能的合理考验,但这是一个大型模型的新项目,即使提示的细微变化也可能产生不同的结果。所以如果想让它最终成为AI大模型基准测试的一部分,它仍然需要改进。

无论如何,经过这一波实际测试,我们已经感受到了大型号之间能力的差异。

DeepSeek 是新的“硅谷神话”

DeepSeek 正在大洋彼岸引起“恐慌”。

_物理暴击宝珠有哪些_黄金特工2黄金圈在线看

一位 meta 员工发帖称,“meta 工程师正在疯狂分析 DeepSeek,试图从中复制任何内容。”

AI技术初创公司Scale AI创始人Alexandr Wang也公开表示,中国人工智能公司DeepSeek的大型AI模型的性能大致相当于美国最好的模型。

他还认为,过去十年美国在人工智能竞赛中可能一直领先于中国,但 DeepSeek 大型 AI 模型的发布可能会“改变一切”。

X博主@8teAPi认为DeepSeek并不是一个“副业项目”,而是像洛克希德·马丁公司之前的“Skunk Works”一样。

所谓“臭鼬工厂”,是洛克希德·马丁公司专门成立的一个高度保密、相对独立的小团队,专门研发许多先进飞机。它从事尖端或非常规技术的研究和开发。从U-2侦察机、SR-71黑鸟到F-22猛禽、F-35闪电II战斗机,都出自这里。

后来,这个词逐渐演变为一个通用术语,用来形容大公司或组织内部建立的“小而精”、相对独立、更自由的创新团队。

他给出的理由有两个:

一方面,DeepSeek 拥有大量 GPU,据称超过 10,000 个,Scale AI CEO Alexandr Wang 甚至表示可能会达到 50,000 个。

另一方面,DeepSeek只从国内排名前三的大学招聘人才,这意味着DeepSeek与阿里巴巴和腾讯具有同等竞争力。

仅凭这两个事实,很明显 DeepSeek 在商业上是成功的,并且足够知名,可以访问这些资源。

物理暴击宝珠有哪些__黄金特工2黄金圈在线看

至于DeepSeek的开发成本,该博主表示,中国科技公司可以获得各种补贴,比如低廉的电费和土地等。

因此,很可能DeepSeek的大部分成本都被“放置”在其核心业务之外的账户中,或者以某种数据中心建设补贴的形式。除了创始人之外,没有人完全了解所有的财务安排。有些协议可能是“口头的”,并且可以仅凭声誉来签订。

无论如何,有几点是明确的:

这个模型非常好,与两个月前发布的 OpenAI 版本相当,但可能不如 OpenAI 和 Anthropic 尚未发布的新模型。

从目前来看,研究方向仍主要由美国企业主导。 DeepSeek 模型是 o1 版本的“快速后续版本”。不过,DeepSeek的研发进展非常迅速,追赶的速度比预期要快。他们没有抄袭或者作弊,顶多只是逆向工程。

DeepSeek主要是自己培养人才,而不是依赖美国培养的博士,这极大地扩大了人才库。

与美国公司相比,DeepSeek 在知识产权许可、隐私、安全、政治等方面受到的限制较少,对其不打算训练的数据的错误使用也较少担心。诉讼更少,律师更少,担忧也更少。

黄金特工2黄金圈在线看__物理暴击宝珠有哪些

毫无疑问,越来越多的人相信2025年将是决定性的一年。与此同时,各家企业也在摩拳擦掌。例如,meta正在建设一个2GW+的数据中心,预计2025年投资60-650亿美元,到年底拥有超过130万个GPU。

meta 甚至还制作了一张图表,显示了 2 吉瓦数据中心与纽约曼哈顿的对比情况。

_黄金特工2黄金圈在线看_物理暴击宝珠有哪些

但现在 DeepSeek 以更低的成本和更少的 GPU 做得更好,这怎能不让人着急呢?

Yann LeCun:感谢开源

Hyperbolic CTO兼联合创始人金宇辰发文表示,在短短4天内,DeepSeek-R1向我们证明了4个事实:

开源 AI 落后闭源 AI 不到 6 个月

中国在开源人工智能竞赛中占据主导地位

我们正在进入大语言模型强化学习的黄金时代

蒸馏模型如此强大,我们将在手机上运行高度智能的AI

黄金特工2黄金圈在线看__物理暴击宝珠有哪些

DeepSeek 引发的连锁反应仍在继续,比如 OpenAI o3-mini 可以免费使用、社区希望减少有关 AGI/ASI 的模糊讨论、meta 陷入恐慌的传言等。

他认为,很难预测最后谁会获胜,但不要忘记后来者优势的力量。毕竟,我们都知道 Google 发明了 Transformer,而 OpenAI 则释放了其真正的潜力。

此外,图灵奖获得者、meta首席人工智能科学家Yann LeCun也表达了自己的观点。

“对于那些在看到 DeepSeek 的表现后认为‘中国正在超越美国人工智能’的人来说,你的理解是错误的。正确的理解是:开源模型正在超越专有模型。”

LeCun 表示,DeepSeek 这次之所以能够一鸣惊人,是因为他们受益于开放研究和开源(比如 meta 的 PyTorch 和 Llama)。 DeepSeek 产生新的想法并以其他人的工作为基础。因为他们的工作是公开发布和开源的,所以每个人都可以从中受益,这就是开放研究和开源的力量。

物理暴击宝珠有哪些__黄金特工2黄金圈在线看

网友的反思仍在继续。他们在对新技术的发展感到兴奋的同时,也会感到一丝担忧。毕竟DeepSeeks的出现可能会带来真金白银。

参考内容:

相关内容 查看全部