发布信息

DeepSeek AI大模型免费开源爆红全球,创始人梁文锋低调背后的成功故事

作者:软荐小编      2025-03-03 10:01:40     137

Tech星球(微信ID:tech618)

文|任雪芸

封面来源|图虫创意

AI 大模型 DeepSeek 因好用、开源且免费这三大特点而在全球范围内迅速走红,它成为了史上突破 3000 万日活跃用户速度最快的 APP,如今各行各业都在经历着被 DeepSeek 所影响和改变的过程。

这家公司在爆火之前,外界对它了解得很少。它很少出现在媒体的报道中,也很少出现在猎头的招聘活动里,还很少出现在同行的调研范围内。并且,它从未像“AI 六小龙”那样在市场上激起过水花。

它的创始人是梁文锋,他为人低调。在网上,关于他的资料极少,只有寥寥数语。能查到他公开演讲的次数也非常少,更是屈指可数。

大模型行业的从业者在谈论 DeepSeek 时也没有特别在意。有一个大模型从业者说,2023 年在猎头推荐里看过,但当时根本没关注。一位投资经理称,过去几年时间,焦点集中在大模型“六小龙”身上,对 DeepSeek 的研究局限于过往的产品上。

可现在则完全不同了,同行、投资机构们都在寻找梁文锋。

准确来说,我们是在 DeepSeek 开源推理模型 DeepSeek-R1 出现之后,开始对这个产品给予格外的重视。上述大模型从业者做出了这样的表述。DeepSeek-R1 开源之后,众多业内人士对 DeepSeek 的技术实力进行了重新审视。

投资机构们此时纷纷开始行动,用尽各种办法去尝试接触更多和 DeepSeek 有关的人员。一家私募投资机构的投资经理表示:“我们当然希望能够见到梁文锋。”

但在爆火之前的状态下,DeepSeek 以及梁文锋依然处于隐藏的状态,置身于这波热潮之中,没有人能够轻易地找到他们的行踪。

一天近百人造访DeepSeek办公地

春节后复工首日,在汇金国际大厦某公司工作的一位员工最直观的感受是“戒备森严”。2 月初,她踏入大厦时,敏锐地察觉到安保状况与以往截然不同,严格程度大幅提升。“后来从安保人员那里得知,原来 DeepSeek 和我们在同一栋楼办公。”

在接下来的一周里,随着 DeepSeek 的热度急剧上升,汇金国际大厦变成了非常热门的“打卡地”。一位大厦的工作人员说,在人员最多的时候,一天前来参观的人有将近一百位。

这些“造访人员”,大多只是留下了失望而归的背影。网上能查到 DeepSeek 的具体办公地址,然而安保人员不会透露其所在的具体楼层,更别想能见到他们的员工了,上述员工这样说道。

在寻找 DeepSeek 和梁文锋的造访人员的过程中,那些久违地嗅到市场机遇的投资机构们也开始发力了。

一位投资经理向 Tech 星球表示,要找到 DeepSeek 的工作人员乃至创始人梁文锋的联系方式并非难事,然而困难之处在于与他们展开沟通。“凭借以往在 AI 行业积攒的人脉,我添加了几位 DeepSeek 的员工,但并未获得太多的反馈。”

一位投资经理表示,过年期间一直在努力尝试联系 DeepSeek,然而最终并未取得任何成果。

一时间,那些曾在不同场合与 DeepSeek 有过交集的人,无论关联多么微小,都成了众人竞相挖掘的对象;那些曾以不同方式与 DeepSeek 有过交集的人,无论关联多么微小,也都成了众人竞相挖掘的对象。

一位曾为 DeepSeek 发出招聘需求的猎头表示,在 DeepSeek 最热门的那几日,有不少人向他询问 DeepSeek 相关的问题,其中有的是打听招聘需求,有的则是打听这家公司的情况。

一位曾接到 DeepSeek 邀约去面试的从业者,在将自己的经历分享给周围朋友之后,有不少“陌生人”添加了他的微信。

外界给予了 DeepSeek 这家企业近似狂热的关注。然而,它从开始到结束都没有向外透露任何期待交流的信号。

春节后复工不久,DeepSeek 通过汇金国际大厦物业向外反馈,婉拒了所有的采访请求,表明会专注于自身的研究与发展。从开始爆火到现在,梁文锋也只是短暂地出现在公众的视野中。

尽管如此,关于 DeepSeek 以及梁文锋过往经历的相关讨论依然十分火热。

节后一个月,我们的工作以 DeepSeek 研究为核心展开。上述投资经理表示,他几乎把梁文锋和 DeepSeek 过往的所有公开资料都看完了。

在社交平台上,关于 DeepSeek 和梁文锋的讨论一直在不断涌现。有的是技术宅在探讨 DeepSeek 模型的架构优化,有的是商业人士在分析其潜在的市场估值,大家的热情始终没有减退。

外界对 DeepSeek 和梁文锋的探寻不断深入,这家之前不太出名的企业显得越发神秘,大家都希望解开围绕在它身上的那些谜团。

投资机构与DeepSeek:融资热潮下的错位博弈

外界有好奇的目光,而一级市场的投资机构们嗅到的是金钱的味道。他们最终的目的是想挤进 DeepSeek 的投资者行列。

金沙江创投主管合伙人朱啸虎,他对 AI 投资的态度因 DeepSeek 而发生了逆转。此前,朱啸虎曾表示不再投资大模型公司,然而 DeepSeek 改变了他原本对通用人工智能(AGI)的怀疑态度。

他在接受腾讯新闻访谈时说,若 DeepSeek 开放融资,他必定会参与投资。他觉得“见证人类 AGI 的诞生”这件事意义极为重大。甚至他还表示,价格已经不是那么重要了,关键在于能够参与到其中。

另一位投资人表示,如果能够参与到 DeepSeek 的投资中,就不会去纠结价格和份额了。

可是,一级市场的投资人们表现得很热切,然而,过去的 DeepSeek 一直没有外部融资的记录,并且在当下,也没有释放出需要融资的信号。

企查查显示,杭州深度求索公司是 DeepSeek 的背后公司。梁文锋直接、间接持有该公司 84.29%的股份,所以他拥有对 DeepSeek 的绝对表决权。

爆火之后,有不少投资人找到了 DeepSeek 负责 IR(投资者关系)的团队。其中一位 PE(私募股权)投资人说,他们一直在和 DeepSeek 进行接触,期望能够获得投资份额,然而 DeepSeek 明确表示:当下并未开放融资。

梁文锋个人的从业履历显示,钱并非阻碍他创业的核心因素。梁文锋旗下的量化对冲基金幻方量化所获得的利润,为他对 DeepSeek 的投入提供了支撑。

幻方量化于 2015 年成立,其最初的主体是浙江九章资产。2016 年,宁波幻方量化得以成立。中基协数据表明,在 2024 年 7 月 31 日这个时间点,浙江九章资产管理规模超过 100 亿元。而截至 2024 年 4 月 26 日,宁波幻方量化的管理规模也达到了 100 亿元以上。

梁文锋投身 DeepSeek 发展,因为有雄厚的资金实力,所以拥有了相对宽松的资金环境。

DeepSeek 凭借自身资金来支撑发展,这种模式以及在市场上热度不断攀升的情况,也使得不少投资人望而却步。

对方多次明确表示不进行融资。同时,鉴于目前 DeepSeek 的热度,它的估值必然超出我们能够承受的定价范围,我们投不起。一位 PE 投资人如此说道。

彭博调研分析师对 DeepSeek 的中位估值进行了预测,按照这个预测,DeepSeek 的估值有可能达到 300 亿美元。并且这个价格几乎等同于当下“AI 六小龙”估值的总和。

梁文锋考虑过融资。在“暗涌 Waves”2023 年对他的专访里,他透露曾主动与多方出资者进行交流,想要引入资金来推动 DeepSeek 的发展。然而,洽谈过程中矛盾凸显出来,风险投资(VC)机构因受退出机制的限制,急于让项目商业化,以便快速回笼资金并获取收益。

梁文锋为 DeepSeek 规划的发展蓝图,其核心是“研究先行”。这种理念存在差异,成为了 DeepSeek 与 VC 之间的巨大阻碍。即便到了今天,这一矛盾也难以轻易化解。

等待下一个DeepSeek

3 月 1 日,DeepSeek 团队的知乎账号发布了首条动态。此动态首次对外公布了 DeepSeek-V3/R1 推理系统的相关信息,包括优化技术细节以及成本利润率等关键内容。

DeepSeek 依据理论计算表明,其 AI 模型的推理服务具有 545%的“成本利润率”。这也就意味着,若投入 1 美元成本,DeepSeek 能够获得 5.45 美元的利润。

但 545%只是一个理论层面的数据。实际上,“夜间折扣”会对这个数据产生影响,“V3 低价策略”也会对其产生影响,“网页/App 免费入口”同样会对这个数据产生影响。

理论上的 545%这个数据,就如同当下的 DeepSeek 所处的最佳状况一样。谁也无法知晓它能否一直保持这样,也不知道它能持续多长时间。

一位从事大模型行业的人告诉 Tech 星球,DeepSeek 所面临的挑战已经到来。他说:“DeepSeek 此次让市场感到震惊,实际上这代表着开源取得了胜利。”

他认为,开源模型要持续推出能与闭源模型比拼的产品是很困难的。同时,开源模型企业无法避开商业化和变现的话题。如果开源模型想要持续发展,就必须找到变现的途径。

不久前,心资本的合伙人吴炳见在社交媒体上有所感慨。他去年曾询问 DeepSeek 的人:“为何你们的模型做得如此之好?”对方回应称,因为他们的老板自己会读论文、写代码并且做招聘,时间投入在哪里,哪里就容易产生效率。

面对下一轮的挑战,DeepSeek 团队不能有丝毫的松懈。他们团队必须打起精神去进行大模型各种技术问题的探索,否则可能会落后。上述从业者这样说道。

对于错过了 DeepSeek 的那些投资人来说,当下是他们开始重新审视那些在过往影响了投资决策的关键因素的时刻。

一位投资人进行反思。看团队方面,梁文锋的团队是具有量化基金背景的团队,他们在做 AI 开源模型,这与以往的经验不相符。从商业模式来看,风险投资倾向于有明确商业路线的模式,然而即便到了今天,也难以清晰地看清 DeepSeek 未来的商业走向。

DeepSeek 爆火了,这给了我们一次重新思考的机会。在他看来,DeepSeek 打破了以往投资的常规认知,并且修炼出了更强的前瞻性与包容性,而这些才是不错过下一个像 DeepSeek 这样的机会所需要的能力。

但无论怎样,DeepSeek 打破了巨头在 AI 领域的叙事。如今,投资人们非常迫切,他们希望在接下来出现像 DeepSeek 这样的事物之前,能够抓住它。

欢迎按指引星标Tech星球

第一时间接收文章更新

相关内容 查看全部