自24Q3以来,我们一直在谈论AI的后半部分。尽管Openai O1提出了RL叙述,但由于各种原因,它并没有打破圈子。 DeepSeek R1解决了RL的难题,促进了整个行业进入新的范式,并真正进入了聪明的下半场。 。
关于DeepSeek市场中的什么以及为什么,已经有很多讨论。下一个更有价值的讨论是如何参加AI比赛?我总结了过去半个月的想法,希望成为探索下半场的路线图,并偶尔对它们进行审查。还列出了一些最奇怪的问题。欢迎填写问卷调查并交换想法。我们将在下一个智能突破时刻组织一个小的讨论:
•下一个智能突破会在哪里出现?
•如果您拥有丰富的勘探资源,您将在哪个方向上投资勘探资源?
•例如,下一代变压器体系结构,合成数据的突破以及在线学习更有效的学习方法。你有什么赌注?
洞察力01
DeepSeek超过了Openai吗?
DeepSeek超过了meta Llama,但它与Openai,Anthropic和Google等一流球员相去甚远。例如,Gemini 2.0闪存的成本低于DeepSeek,具有强大的功能,并且完全模态。外界低估了双子座的第一个梯队以2.0代表的梯队的能力只是它没有开源,并且已经达到了这种轰动的效果。
DeepSeek非常令人兴奋,但不能称为范式级创新。一个更准确的陈述是开源的Openai O1的前一个半上隐藏的范式,将整个生态系统提高到非常高的渗透率。
从第一原则的角度来看,很难超越变压器生成体系结构下的第一类模型制造商。在同一道路上很难超越。今天,我希望有人可以探索下一代智能建筑和范式。
DeepSeek需要一年
赶上Openai和Anthropic
见解02
DeepSeek打开了新的范式吗?
如前所述,从严格的角度来看,DeepSeek并未发明新的范式。
但是,DeepSeek的重要性是帮助RL的新范式和测试时间计算确实出现。如果Openai发布的最初O1是该行业的谜语,那么DeepSeek是第一个公开解决难题的人。
在DeepSeek发布R1和R1-Zero之前,该行业中只有少数人正在练习RL和推理模型,但是DeepSeek指出了路线图,使该行业相信这样做可以真正提高智力,这将增强信心,这会增强信心并吸引更多的AI AI。 。转向新范式的研究人员非常有帮助。
只有当人才进入时,才会进行算法创新,只有紧随开源的遵循,才能在计算资源上有更多的投资。在DeepSeek之后,Openai最初计划不再发布新模型,然后又一次发行了O3mini,并计划继续发布O3,并考虑了开源模型。 Anthropic和Google还将加快RL研究。该行业的新范式的发展是由于DeepSeek的加速,中小型团队也可以在不同的领域上尝试RL。
此外,推理模型的改进将进一步帮助实施代理商,而AI研究人员现在对代理的研究和探索更有信心。因此,也可以说,DeepSeek开源推理模型促进了该行业对代理商的进一步探索。
因此,尽管DeepSeek并未发明新的范式,但它将整个行业推向了新的范式。
洞察力03
人类技术路线与R1有什么区别?
从达里奥(Dario)的采访中,我们可以看到人类对R-1/推理模型的理解与O系列有所不同。达里奥(Dario)认为基本模型和推理模型应该是连续的频谱,而不是像OpenAI这样的独立模型系列。如果您只做O系列,您很快就会遇到天花板。
我一直想知道为什么SonNET 3.5的编码,推理和代理能力得到了如此强烈的进步,但是4o尚未赶上?
他们在训练前模型阶段做了很多RL工作,而核心是增加基本模型,否则,只要仅依靠RL来改善推理模型,就可以很容易地吃掉所有利润。
洞察力04
DeepSeek的感觉是不可避免的和偶然的
两位早期的Openai研究人员撰写的“为什么不能计划伟大”也适合描述DeepSeek。
从技术角度来看,DeepSeek具有以下亮点:
•开源:开源非常重要。在Openai开始从GPT-3转到封闭源公司之后,一线巨头不再透露技术细节,并放弃了空白的开源壁ki,但是meta和Mistral也没有牢牢地担任这个职位,DeepSeek是一个惊喜这次攻击,并且在开源轨道中很顺利。
如果感觉得分100分,智能的改善将贡献30分,开源将贡献70分。美洲驼以前也是开源的,但没有这种轰动的效果,这意味着美洲驼的智力水平还不够。
•便宜:句子“您的利润是我的机会”的价值仍在上升。
•Internet连接 +公共婴儿床:用户的这两个点可以带来良好的用户体验。 DeepSeek的两张卡是同时使用的,可以说是国王,从而为C-End用户提供了体验和其他聊天机器人。相同的。特别是,COT是透明的,这使模型思维过程公开。透明度可以使用户更信任AI并促进打破圈子。但是,从理论上讲,困惑也产生了很大的影响,但是DeepSeek服务器不稳定。困惑团队很快回答说R-1是被推出的,而是接管了DeepSeek R-1溢出的用户。
•RL概括:尽管RL首先是由OpenAI O1提出的,因为各种操作始终被半堵塞,并且穿透速率不高。 DeepSeek R-1极大地促进了推理模型范式的过程,生态接受程度得到了极大的提高。
DeepSeek在技术探索方面的投资是确定性因素,值得通过这一智能成就更多地关注和讨论,但是DeepSeek R1发起的时机使这种感觉偶尔:
•过去,美国一直说它是基础技术研究的重要领导者,但DeepSeek是中国原产地,这也是一个亮点。在此过程中,许多美国技术大亨已经开始促进DeepSeek,以挑战美国技术霸主的地位。在论点中,DeepSeek是对公众舆论战争的一种被动参与。
•在DeepSeek R1发行之前,Openai Stargate $ 500B事件刚刚开始发酵。这项巨大的投资太尖锐,并且智能团队的智能产出效率很难吸引注意力和讨论。
•DeepSeek使NVIDIA的股价暴跌,并进一步发酵了公众舆论。他们一定没有想到2025年初他们将成为美国股票市场的第一批黑天鹅。
•春节是产品的训练场。在移动互联网时代,许多超级应用程序在春季音乐节期间爆炸了,AI时代也不例外。 DeepSeek R1恰好是在春节之前发布的。令公众感到惊讶的是它的写作能力,而不是培训期间强调的编码和数学能力。公众更有可能感受到文化和创意产品,并且更有可能流行。
洞察力05
谁受伤?谁受益?
该领域的参与者可以分为三类:TOC,开发人员和企业(对政府):
1。TOC:聊天机器人肯定会受到最多的打击,心灵和品牌的关注被DeepSeek偷走了,Chatgpt也不例外。
2。开发人员链接的影响非常有限。我们看到一些用户说R1不容易使用而不是十四行诗的评论。光标官员还表示,十四行诗的表现仍然跑赢大,用户的惊喜比例很高,而且没有显着迁移。
3。在第三维度中,企业和政府的业务涉及对需求的信任和理解。大型组织做出决策的兴趣很复杂,不像C-End用户那么容易。
让我们从封闭的来源,开源和计算能力的角度来改变观点,并考虑这个问题:
在短期内,每个人都会觉得封闭的OpenAI/Anthropic/Google受到更大的影响:
•技术的神秘感已经打开,AI炒作中最重要的奥秘的溢价也被打破了;
•更现实的因素,市场认为,这些封闭源公司的一些潜在客户和市场规模已被盗,GPU投资的回报周期已经更长。
•领导者Openai是最“损失”的人。试图使技术没有引入和半覆盖的梦想,希望获得更多的技术溢价。
但是,在中长期中,拥有丰富的GPU资源的公司仍将受益。一方面,第二个梯队中的元可以迅速跟进新方法,资本支出更有效,元可能是一个伟大的受益人,另一方面,智能改进仍然需要改进,探索智能,DeepSeek开源源会带来每个人都在一起,进入全新的探索需要10次甚至大量的GPU投资。
从第一原则的角度来看,对于AI智能行业,无论是发展智能还是应用智能,它都将不可避免地用物理学消耗庞大的计算能力。这是由基本定律决定的,无法通过技术优化完全避免。
因此,无论是探索情报还是应用智能,即使存在短期疑问,在中长期中对计算能力的需求都会爆炸。这也解释了为什么马斯克从第一原则开始,而Xai坚持扩大簇的群体,而在Xai和Stargate后面,深层逻辑可能是相同的。亚马逊等云供应商宣布将添加资本支出指导。
让我们假设全球AI研究人才水平和认知都是相同的,并且可以使用更多的GPU来进行更多的实验探索?最后,它可能仍然恢复了计算的竞争。
DeepSeek不怕赤脚穿鞋,没有商业要求,并且专注于探索AGI智能技术。开源的作用对于促进AGI过程具有重要意义,AGI过程加剧了竞争并促进开放性,这具有cat鱼效应。
洞察力06
蒸馏可以超越SOTA吗?
有一个不确定的细节。如果DeepSeek使用了前火车阶段的大量蒸馏COT数据,那么今天的效果并不令人惊讶。它仍然是一线巨头肩膀上获得的基本智能,然后开放以采购它。如果在前火车阶段没有大量的蒸馏数据,DeepSeek将从0开始,以实现今天的结果,这将是惊人的。
此外,在基本模型中,蒸馏是否不可能超过SOTA。但是DeepSeek R-1非常强大,并且猜测奖励模型做得很好。如果R-1零路径是可靠的,则有机会超越SOTA。
洞察力07
没有护城河!
Google先前对Openai的评论:没有护城河!这句话在这里也很合适。
DeepSeek这浪潮的聊天机器人用户经历了大量的迁移,这给市场带来了非常重要的灵感:智能技术的进步非常陡峭,而分阶段产品很难形成绝对的障碍。
无论是Chatgpt/Sonnet/困惑,它都刚刚形成了思想和声誉,还是光标和Windsurf等开发人员工具,一旦有更智能的产品,用户都不会对“上一代”智能产品(无论如何)都不会忠诚今天的模型是什么。很难构建一层或应用层的护城河。
DeepSeek这次还验证了一件事:模型是应用程序,DeepSeek没有产品形式的创新,核心是智能 +开源。我忍不住想:在AI时代,任何产品或商业模式中的任何创新都不如智能。它是创新的吗?
洞察力08
DeepSeek应该被接受
这浪的聊天机器人流量更大吗?
从聊天机器人的知名度到今天,DeepSeek团队的反应可以清楚地感受到DeepSeek尚未弄清楚如何使用这种交通浪潮的情况。
是否要捕捉和积极运营这批流量的问题的本质是,可以在一个组织中共存出色的商业公司和出色的研究实验室?
这是对能源和资源分配,组织能力和战略选择的非常考验。如果它是像Byte和meta这样的大型公司,则应遵循他们的第一个反应,并且他们也有一定的组织基础,但是DeepSeek是一个研究实验室组织,进行这种巨大的交通流量的压力将不可避免地非常重要高的。
但是与此同时,我还想认为这浪的聊天机器人将是分阶段的流量吗?聊天机器人是未来智能探索的主线吗?似乎每个智能阶段都有相应的产品表格,而聊天机器人只是已解锁的早期表格之一。
从接下来的3 - 5年的角度来看,对于DeepSeek而言,如果今天不进行聊天机器人流量,这会是一种错过吗?如果有一天有规模经济怎么办?如果最终实施了AGI,它将接管什么承运人?
洞察力09
下一个智能突破的时刻来自哪里?
一方面,第一个梯队的下一代模型非常关键,但是今天我们处于变压器的极限,仍然不确定第一个梯队是否可以提出代际改进的模型。 Openai,Anthropic和Google对发送的模型中有30-50%的回应可能不足以节省情况,因为它们的资源增加了10-30倍。
另一方面,代理的实施更为关键,因为代理需要进行长距离多步推理。如果该模型为5-10%,则领先效应将被大量放大。因此,OpenAI,Anthropic和Google一方面需要实施代理产品。 ,完整的堆栈集成模型 +代理产品,就像Windows + Office一样,其次,我们必须显示更强大的模型,例如由O3完整版和SonNET 4/3.5 OPUS代表的下一代模型。
在技术不确定性下,最有价值的是天才AI研究人员。任何想要探索AGI的组织都必须在下一个范式上投资更多的激进资源,尤其是在当今训练阶段的背景下,该范围已被放弃。拥有良好的才能 +丰富的资源来探索下一个智能的AHA时刻。
洞察10
DeepSeek这一波使我正确
中国人工智能才能更自信,非常令人鼓舞
最后,希望技术没有边界。