软件行业资讯

DeepSeek R1震撼发布：2025年AI领域的新起点，纯强化学习路线引领未来

 作者：软荐小编  2025-01-26 14:01:00  186

我们谁也没想到，AI领域的2025年会是这样开始的。

DeepSeek R1 太棒了！

近期，“神秘东方势力”DeepSeek正在“难以控制”硅谷。

黄金特工2黄金圈在线看_物理暴击宝珠有哪些_

我将让 R1 详细解释勾股定理。这一切都是人工智能在不到30秒的时间内一口气完成的，没有任何错误。简单来说，结束了。

在国内外AI圈子里，普通网友发现了一种神奇而强大的新AI（也是开源的），学术专家纷纷高呼“我们必须迎头赶上”。也有传言称，海外AI企业已经面临强敌。

我们来谈谈本周刚刚发布的DeepSeek R1。其没有任何监督训练的纯强化学习路线令人震惊。看起来已经从去年12月的Deepseek-v3基础发展到了今天堪比OpenAI o1的思维链能力。完成某事。

但在AI界忙于阅读技术报告、对比实测的同时，人们仍然对R1心存疑虑：除了跑赢一堆基准测试之外，它真的能领先吗？

创建自我模拟“物理定律”的能力

你不相信吗？快来让大模特打弹球吗？

最近几天，AI 社区的一些人迷上了一个测试——测试不同的大型 AI 模型（尤其是所谓的推理模型）来处理一类问题：“编写一个 Python 脚本制作一个黄球在某个形状内弹跳，让形状缓慢旋转并确保球停留在形状内。”

在这个“旋转球体”基准测试中，某些模型的表现优于其他模型。据CoreView CTO Ivan Fioravanti介绍，国内人工智能实验室DeepSeek的开源大型模型R1完全击败了OpenAI的o1 pro模型，该模型是OpenAI ChatGPT Pro计划的一部分，每月费用为200美元。

黄金特工2黄金圈在线看_物理暴击宝珠有哪些_

左边是OpenAI o1，右边是DeepSeek R1。如上所述，这里的提示是：“为正方形内弹跳的黄色球编写一个Python脚本，确保正确处理碰撞检测。使正方形缓慢旋转。在Python中实现它。确保球留在正方形内。 ” ”

据X上另一位网友透露，Anthropic的Claude 3.5 Sonnet和Google的Gemini 1.5 Pro模型对物理判断错误，导致球偏离了形状。也有用户反映，谷歌最新的Gemini 2.0 Flash Thinking Experimental和相对较老的OpenAI GPT-4o一口气通过了评估。

但这里我们也可以区分优劣：

_物理暴击宝珠有哪些_黄金特工2黄金圈在线看

这条推文下的网友表示：o1的能力原本很好，但经过OpenAI优化速度后变得更弱，即使是200美元的月费会员版本。

模拟弹跳球是一个经典的编程挑战。精确的模拟结合了碰撞检测算法，需要识别两个物体（例如球和形状的侧面）何时发生碰撞。编写不当的算法可能会影响模拟的性能或导致明显的物理错误。

人工智能初创公司 Nous Research 的研究员 N8 Programs 表示，他花了大约两个小时从头开始对旋转七边形中的弹跳球进行编程。 “你必须跟踪多个坐标系，了解每个系统中的碰撞如何进行，并从头开始设计代码以使其稳健。”

虽然弹跳球和旋转形状是对编程技能的合理考验，但这是一个大型模型的新项目，即使提示的细微变化也可能产生不同的结果。所以如果想让它最终成为AI大模型基准测试的一部分，它仍然需要改进。

无论如何，经过这一波实际测试，我们已经感受到了大型号之间能力的差异。

DeepSeek 是新的“硅谷神话”

DeepSeek 正在大洋彼岸引起“恐慌”。

_物理暴击宝珠有哪些_黄金特工2黄金圈在线看

一位 meta 员工发帖称，“meta 工程师正在疯狂分析 DeepSeek，试图从中复制任何内容。”

AI技术初创公司Scale AI创始人Alexandr Wang也公开表示，中国人工智能公司DeepSeek的大型AI模型的性能大致相当于美国最好的模型。

他还认为，过去十年美国在人工智能竞赛中可能一直领先于中国，但 DeepSeek 大型 AI 模型的发布可能会“改变一切”。

X博主@8teAPi认为DeepSeek并不是一个“副业项目”，而是像洛克希德·马丁公司之前的“Skunk Works”一样。

所谓“臭鼬工厂”，是洛克希德·马丁公司专门成立的一个高度保密、相对独立的小团队，专门研发许多先进飞机。它从事尖端或非常规技术的研究和开发。从U-2侦察机、SR-71黑鸟到F-22猛禽、F-35闪电II战斗机，都出自这里。

后来，这个词逐渐演变为一个通用术语，用来形容大公司或组织内部建立的“小而精”、相对独立、更自由的创新团队。

他给出的理由有两个：

一方面，DeepSeek 拥有大量 GPU，据称超过 10,000 个，Scale AI CEO Alexandr Wang 甚至表示可能会达到 50,000 个。

另一方面，DeepSeek只从国内排名前三的大学招聘人才，这意味着DeepSeek与阿里巴巴和腾讯具有同等竞争力。

仅凭这两个事实，很明显 DeepSeek 在商业上是成功的，并且足够知名，可以访问这些资源。

物理暴击宝珠有哪些__黄金特工2黄金圈在线看

至于DeepSeek的开发成本，该博主表示，中国科技公司可以获得各种补贴，比如低廉的电费和土地等。

因此，很可能DeepSeek的大部分成本都被“放置”在其核心业务之外的账户中，或者以某种数据中心建设补贴的形式。除了创始人之外，没有人完全了解所有的财务安排。有些协议可能是“口头的”，并且可以仅凭声誉来签订。

无论如何，有几点是明确的：

这个模型非常好，与两个月前发布的 OpenAI 版本相当，但可能不如 OpenAI 和 Anthropic 尚未发布的新模型。

从目前来看，研究方向仍主要由美国企业主导。 DeepSeek 模型是 o1 版本的“快速后续版本”。不过，DeepSeek的研发进展非常迅速，追赶的速度比预期要快。他们没有抄袭或者作弊，顶多只是逆向工程。

DeepSeek主要是自己培养人才，而不是依赖美国培养的博士，这极大地扩大了人才库。

与美国公司相比，DeepSeek 在知识产权许可、隐私、安全、政治等方面受到的限制较少，对其不打算训练的数据的错误使用也较少担心。诉讼更少，律师更少，担忧也更少。

黄金特工2黄金圈在线看__物理暴击宝珠有哪些

毫无疑问，越来越多的人相信2025年将是决定性的一年。与此同时，各家企业也在摩拳擦掌。例如，meta正在建设一个2GW+的数据中心，预计2025年投资60-650亿美元，到年底拥有超过130万个GPU。

meta 甚至还制作了一张图表，显示了 2 吉瓦数据中心与纽约曼哈顿的对比情况。

_黄金特工2黄金圈在线看_物理暴击宝珠有哪些

但现在 DeepSeek 以更低的成本和更少的 GPU 做得更好，这怎能不让人着急呢？

Yann LeCun：感谢开源

Hyperbolic CTO兼联合创始人金宇辰发文表示，在短短4天内，DeepSeek-R1向我们证明了4个事实：

开源 AI 落后闭源 AI 不到 6 个月

中国在开源人工智能竞赛中占据主导地位

我们正在进入大语言模型强化学习的黄金时代

蒸馏模型如此强大，我们将在手机上运行高度智能的AI

黄金特工2黄金圈在线看__物理暴击宝珠有哪些

DeepSeek 引发的连锁反应仍在继续，比如 OpenAI o3-mini 可以免费使用、社区希望减少有关 AGI/ASI 的模糊讨论、meta 陷入恐慌的传言等。

他认为，很难预测最后谁会获胜，但不要忘记后来者优势的力量。毕竟，我们都知道 Google 发明了 Transformer，而 OpenAI 则释放了其真正的潜力。

此外，图灵奖获得者、meta首席人工智能科学家Yann LeCun也表达了自己的观点。

“对于那些在看到 DeepSeek 的表现后认为‘中国正在超越美国人工智能’的人来说，你的理解是错误的。正确的理解是：开源模型正在超越专有模型。”

LeCun 表示，DeepSeek 这次之所以能够一鸣惊人，是因为他们受益于开放研究和开源（比如 meta 的 PyTorch 和 Llama）。 DeepSeek 产生新的想法并以其他人的工作为基础。因为他们的工作是公开发布和开源的，所以每个人都可以从中受益，这就是开放研究和开源的力量。

物理暴击宝珠有哪些__黄金特工2黄金圈在线看

网友的反思仍在继续。他们在对新技术的发展感到兴奋的同时，也会感到一丝担忧。毕竟DeepSeeks的出现可能会带来真金白银。

参考内容：

下一篇： Windows 10 KB5049981更新引发USB DAC设备故障及系统资源不足问题
上一篇： 如何妥善保存和分享美好回忆：传统相册与数字时代的完美结合

软件行业资讯

DeepSeek R1震撼发布：2025年AI领域的新起点，纯强化学习路线引领未来

相关内容查看全部 

北京市发布技术要

大众CEO站桌演讲

OpenAI凌晨发布GP

2024微博娱乐白皮

沐曦集成电路裁员

郑丽揭秘今年最火

别急着退订 ChatG

俞敏洪与胖东来创

特朗普贸易政策加

薯条专门店市场热

DeepSeek R1震撼发布：2025年AI领域的新起点，纯强化学习路线引领未来

相关内容 查看全部 

相关内容查看全部 