软件行业资讯

探索AI智能下半场：DeepSeek R1如何推动新范式与未来智能突破的Aha Moment

 作者：软荐小编  2025-02-08 14:01:40  155

自24Q3以来，我们一直在谈论AI的后半部分。尽管Openai O1提出了RL叙述，但由于各种原因，它并没有打破圈子。 DeepSeek R1解决了RL的难题，促进了整个行业进入新的范式，并真正进入了聪明的下半场。。

关于DeepSeek市场中的什么以及为什么，已经有很多讨论。下一个更有价值的讨论是如何参加AI比赛？我总结了过去半个月的想法，希望成为探索下半场的路线图，并偶尔对它们进行审查。还列出了一些最奇怪的问题。欢迎填写问卷调查并交换想法。我们将在下一个智能突破时刻组织一个小的讨论：

•下一个智能突破会在哪里出现？

•如果您拥有丰富的勘探资源，您将在哪个方向上投资勘探资源？

•例如，下一代变压器体系结构，合成数据的突破以及在线学习更有效的学习方法。你有什么赌注？

洞察力01

DeepSeek超过了Openai吗？

DeepSeek超过了meta Llama，但它与Openai，Anthropic和Google等一流球员相去甚远。例如，Gemini 2.0闪存的成本低于DeepSeek，具有强大的功能，并且完全模态。外界低估了双子座的第一个梯队以2.0代表的梯队的能力只是它没有开源，并且已经达到了这种轰动的效果。

DeepSeek非常令人兴奋，但不能称为范式级创新。一个更准确的陈述是开源的Openai O1的前一个半上隐藏的范式，将整个生态系统提高到非常高的渗透率。

从第一原则的角度来看，很难超越变压器生成体系结构下的第一类模型制造商。在同一道路上很难超越。今天，我希望有人可以探索下一代智能建筑和范式。

对DeepSeek和智能下半场的几条判断__对DeepSeek和智能下半场的几条判断

DeepSeek需要一年

赶上Openai和Anthropic

见解02

DeepSeek打开了新的范式吗？

如前所述，从严格的角度来看，DeepSeek并未发明新的范式。

但是，DeepSeek的重要性是帮助RL的新范式和测试时间计算确实出现。如果Openai发布的最初O1是该行业的谜语，那么DeepSeek是第一个公开解决难题的人。

在DeepSeek发布R1和R1-Zero之前，该行业中只有少数人正在练习RL和推理模型，但是DeepSeek指出了路线图，使该行业相信这样做可以真正提高智力，这将增强信心，这会增强信心并吸引更多的AI AI。。转向新范式的研究人员非常有帮助。

只有当人才进入时，才会进行算法创新，只有紧随开源的遵循，才能在计算资源上有更多的投资。在DeepSeek之后，Openai最初计划不再发布新模型，然后又一次发行了O3mini，并计划继续发布O3，并考虑了开源模型。 Anthropic和Google还将加快RL研究。该行业的新范式的发展是由于DeepSeek的加速，中小型团队也可以在不同的领域上尝试RL。

此外，推理模型的改进将进一步帮助实施代理商，而AI研究人员现在对代理的研究和探索更有信心。因此，也可以说，DeepSeek开源推理模型促进了该行业对代理商的进一步探索。

因此，尽管DeepSeek并未发明新的范式，但它将整个行业推向了新的范式。

洞察力03

人类技术路线与R1有什么区别？

从达里奥（Dario）的采访中，我们可以看到人类对R-1/推理模型的理解与O系列有所不同。达里奥（Dario）认为基本模型和推理模型应该是连续的频谱，而不是像OpenAI这样的独立模型系列。如果您只做O系列，您很快就会遇到天花板。

我一直想知道为什么SonNET 3.5的编码，推理和代理能力得到了如此强烈的进步，但是4o尚未赶上？

他们在训练前模型阶段做了很多RL工作，而核心是增加基本模型，否则，只要仅依靠RL来改善推理模型，就可以很容易地吃掉所有利润。

洞察力04

DeepSeek的感觉是不可避免的和偶然的

两位早期的Openai研究人员撰写的“为什么不能计划伟大”也适合描述DeepSeek。

从技术角度来看，DeepSeek具有以下亮点：

•开源：开源非常重要。在Openai开始从GPT-3转到封闭源公司之后，一线巨头不再透露技术细节，并放弃了空白的开源壁ki，但是meta和Mistral也没有牢牢地担任这个职位，DeepSeek是一个惊喜这次攻击，并且在开源轨道中很顺利。

如果感觉得分100分，智能的改善将贡献30分，开源将贡献70分。美洲驼以前也是开源的，但没有这种轰动的效果，这意味着美洲驼的智力水平还不够。

•便宜：句子“您的利润是我的机会”的价值仍在上升。

•Internet连接 +公共婴儿床：用户的这两个点可以带来良好的用户体验。 DeepSeek的两张卡是同时使用的，可以说是国王，从而为C-End用户提供了体验和其他聊天机器人。相同的。特别是，COT是透明的，这使模型思维过程公开。透明度可以使用户更信任AI并促进打破圈子。但是，从理论上讲，困惑也产生了很大的影响，但是DeepSeek服务器不稳定。困惑团队很快回答说R-1是被推出的，而是接管了DeepSeek R-1溢出的用户。

•RL概括：尽管RL首先是由OpenAI O1提出的，因为各种操作始终被半堵塞，并且穿透速率不高。 DeepSeek R-1极大地促进了推理模型范式的过程，生态接受程度得到了极大的提高。

DeepSeek在技术探索方面的投资是确定性因素，值得通过这一智能成就更多地关注和讨论，但是DeepSeek R1发起的时机使这种感觉偶尔：

•过去，美国一直说它是基础技术研究的重要领导者，但DeepSeek是中国原产地，这也是一个亮点。在此过程中，许多美国技术大亨已经开始促进DeepSeek，以挑战美国技术霸主的地位。在论点中，DeepSeek是对公众舆论战争的一种被动参与。

•在DeepSeek R1发行之前，Openai Stargate $ 500B事件刚刚开始发酵。这项巨大的投资太尖锐，并且智能团队的智能产出效率很难吸引注意力和讨论。

•DeepSeek使NVIDIA的股价暴跌，并进一步发酵了公众舆论。他们一定没有想到2025年初他们将成为美国股票市场的第一批黑天鹅。

•春节是产品的训练场。在移动互联网时代，许多超级应用程序在春季音乐节期间爆炸了，AI时代也不例外。 DeepSeek R1恰好是在春节之前发布的。令公众感到惊讶的是它的写作能力，而不是培训期间强调的编码和数学能力。公众更有可能感受到文化和创意产品，并且更有可能流行。

洞察力05

谁受伤？谁受益？

该领域的参与者可以分为三类：TOC，开发人员和企业（对政府）：

1。TOC：聊天机器人肯定会受到最多的打击，心灵和品牌的关注被DeepSeek偷走了，Chatgpt也不例外。

2。开发人员链接的影响非常有限。我们看到一些用户说R1不容易使用而不是十四行诗的评论。光标官员还表示，十四行诗的表现仍然跑赢大，用户的惊喜比例很高，而且没有显着迁移。

3。在第三维度中，企业和政府的业务涉及对需求的信任和理解。大型组织做出决策的兴趣很复杂，不像C-End用户那么容易。

让我们从封闭的来源，开源和计算能力的角度来改变观点，并考虑这个问题：

在短期内，每个人都会觉得封闭的OpenAI/Anthropic/Google受到更大的影响：

•技术的神秘感已经打开，AI炒作中最重要的奥秘的溢价也被打破了；

•更现实的因素，市场认为，这些封闭源公司的一些潜在客户和市场规模已被盗，GPU投资的回报周期已经更长。

•领导者Openai是最“损失”的人。试图使技术没有引入和半覆盖的梦想，希望获得更多的技术溢价。

但是，在中长期中，拥有丰富的GPU资源的公司仍将受益。一方面，第二个梯队中的元可以迅速跟进新方法，资本支出更有效，元可能是一个伟大的受益人，另一方面，智能改进仍然需要改进，探索智能，DeepSeek开源源会带来每个人都在一起，进入全新的探索需要10次甚至大量的GPU投资。

从第一原则的角度来看，对于AI智能行业，无论是发展智能还是应用智能，它都将不可避免地用物理学消耗庞大的计算能力。这是由基本定律决定的，无法通过技术优化完全避免。

因此，无论是探索情报还是应用智能，即使存在短期疑问，在中长期中对计算能力的需求都会爆炸。这也解释了为什么马斯克从第一原则开始，而Xai坚持扩大簇的群体，而在Xai和Stargate后面，深层逻辑可能是相同的。亚马逊等云供应商宣布将添加资本支出指导。

让我们假设全球AI研究人才水平和认知都是相同的，并且可以使用更多的GPU来进行更多的实验探索？最后，它可能仍然恢复了计算的竞争。

DeepSeek不怕赤脚穿鞋，没有商业要求，并且专注于探索AGI智能技术。开源的作用对于促进AGI过程具有重要意义，AGI过程加剧了竞争并促进开放性，这具有cat鱼效应。

洞察力06

蒸馏可以超越SOTA吗？

有一个不确定的细节。如果DeepSeek使用了前火车阶段的大量蒸馏COT数据，那么今天的效果并不令人惊讶。它仍然是一线巨头肩膀上获得的基本智能，然后开放以采购它。如果在前火车阶段没有大量的蒸馏数据，DeepSeek将从0开始，以实现今天的结果，这将是惊人的。

此外，在基本模型中，蒸馏是否不可能超过SOTA。但是DeepSeek R-1非常强大，并且猜测奖励模型做得很好。如果R-1零路径是可靠的，则有机会超越SOTA。

洞察力07

没有护城河！

Google先前对Openai的评论：没有护城河！这句话在这里也很合适。

_对DeepSeek和智能下半场的几条判断_对DeepSeek和智能下半场的几条判断

DeepSeek这浪潮的聊天机器人用户经历了大量的迁移，这给市场带来了非常重要的灵感：智能技术的进步非常陡峭，而分阶段产品很难形成绝对的障碍。

无论是Chatgpt/Sonnet/困惑，它都刚刚形成了思想和声誉，还是光标和Windsurf等开发人员工具，一旦有更智能的产品，用户都不会对“上一代”智能产品（无论如何）都不会忠诚今天的模型是什么。很难构建一层或应用层的护城河。

DeepSeek这次还验证了一件事：模型是应用程序，DeepSeek没有产品形式的创新，核心是智能 +开源。我忍不住想：在AI时代，任何产品或商业模式中的任何创新都不如智能。它是创新的吗？

洞察力08

DeepSeek应该被接受

这浪的聊天机器人流量更大吗？

从聊天机器人的知名度到今天，DeepSeek团队的反应可以清楚地感受到DeepSeek尚未弄清楚如何使用这种交通浪潮的情况。

是否要捕捉和积极运营这批流量的问题的本质是，可以在一个组织中共存出色的商业公司和出色的研究实验室？

这是对能源和资源分配，组织能力和战略选择的非常考验。如果它是像Byte和meta这样的大型公司，则应遵循他们的第一个反应，并且他们也有一定的组织基础，但是DeepSeek是一个研究实验室组织，进行这种巨大的交通流量的压力将不可避免地非常重要高的。

但是与此同时，我还想认为这浪的聊天机器人将是分阶段的流量吗？聊天机器人是未来智能探索的主线吗？似乎每个智能阶段都有相应的产品表格，而聊天机器人只是已解锁的早期表格之一。

从接下来的3 - 5年的角度来看，对于DeepSeek而言，如果今天不进行聊天机器人流量，这会是一种错过吗？如果有一天有规模经济怎么办？如果最终实施了AGI，它将接管什么承运人？

洞察力09

下一个智能突破的时刻来自哪里？

一方面，第一个梯队的下一代模型非常关键，但是今天我们处于变压器的极限，仍然不确定第一个梯队是否可以提出代际改进的模型。 Openai，Anthropic和Google对发送的模型中有30-50％的回应可能不足以节省情况，因为它们的资源增加了10-30倍。

另一方面，代理的实施更为关键，因为代理需要进行长距离多步推理。如果该模型为5-10％，则领先效应将被大量放大。因此，OpenAI，Anthropic和Google一方面需要实施代理产品。，完整的堆栈集成模型 +代理产品，就像Windows + Office一样，其次，我们必须显示更强大的模型，例如由O3完整版和SonNET 4/3.5 OPUS代表的下一代模型。

在技术不确定性下，最有价值的是天才AI研究人员。任何想要探索AGI的组织都必须在下一个范式上投资更多的激进资源，尤其是在当今训练阶段的背景下，该范围已被放弃。拥有良好的才能 +丰富的资源来探索下一个智能的AHA时刻。

洞察10

DeepSeek这一波使我正确

中国人工智能才能更自信，非常令人鼓舞

最后，希望技术没有边界。

下一篇： 如何正确卸载手机App以释放空间并提升运行速度
上一篇： AlphaGeometry2突破性进展：解决国际数学奥林匹克竞赛84%几何问题

软件行业资讯

探索AI智能下半场：DeepSeek R1如何推动新范式与未来智能突破的Aha Moment

相关内容查看全部 

OpenAI最新o3和o4

韩国科学家研发新

特斯拉Cybercab自

妙鸭相机AI写真火

2025年大模型应用

360织语升级为360

松应科技融资历程

快手2024年财报：

AI终端智能觉醒：

OpenAI O3和o4-mi

探索AI智能下半场：DeepSeek R1如何推动新范式与未来智能突破的Aha Moment

相关内容 查看全部 

相关内容查看全部 