2025 年的春节本应是字节跳动 AI 产品豆包展现高光的时刻。但后来,DeepSeek-R1 开源且用户量呈爆发式增长,还有腾讯元宝“借力打力”,这就打乱了字节原本的步伐。
在这轮 AI 浪潮中,字节跳动原本是个后来者。2023 年的时候,字节跳动才开始在内部会议上对 GPT 进行讨论。在过去的两年里,字节跳动加紧对 AI 进行了大量的投入,其中包括大规模的投流。
这种大力出奇迹的模式使得字节豆包的用户量突破了 7500 万,在去年底顺利跻身到了第一梯队。可是,字节刚刚坐稳顶流的位置,就遭遇了 DeepSeek。
字节开始进行反击。华尔街见闻从知情人士那里得知,豆包已经在小范围内对深度思考模型的不同实验版本进行了测试,这比它原本的规划提前了很多。同时,更多的变化也在暗暗地发生着。3 月 3 日,字节的技术团队宣布,中国首个 AI 原生集成开发环境(AI IDE)Trae 的国内版正式上线了,并且支持切换满血版 DeepSeek R1、V3 模型。
问题在于,面对 DeepSeek 的“技术奇袭”。字节有着工业化流量思维,这种思维能否让它拿到“新时代船票”,这是要打上个问号的。
在上周的民企座谈会上,新质生产力企业 Deepseek 的创始人梁文锋受邀参会,宇树科技的创始人王兴兴也受邀参会,马云受邀参会,马化腾受邀参会。然而,张一鸣却未能入列此次参会名单。此中所蕴含的深意,令人回味悠长。
今日头条、抖音以及 TikTok 这三个平台,字节凭借推荐算法打造出了爆款 APP。并且借着直播电商的东风,字节一举成为了互联网新王。不过,国内用户增长已经到了顶点,同时全球化又遭遇了监管风险,这导致字节的业绩增长被迫放缓,而 AI 则成为了解决问题的关键。
字节被冠以“应用工厂”之称,它能否打造出 AI 时代的超级应用,这决定着公司未来能否继续卫冕王位。而 DeepSeek 的出现意味着,这条路对字节来说远比它想象的更难走。
豆包受阻
豆包正在加快速度去追赶 Open AI 旗下的 GPT。
然而 DeepSeek 迅速走红,打乱了豆包的节奏。QuestMobile 的数据表明,在 2 月 1 日这一天,DeepSeek 的 APP 端日活用户成功突破了 3000 万,它成为了有史以来最快达到 3000 万用户数量的应用。到了 2 月 13 日,腾讯元宝宣布与 DeepSeek-R1 满血版相连接,并且同时对混元模型和 DeepSeek 模型提供支持。2 月 22 日,元宝的排名超过了豆包。它升至了中国区苹果免费 APP 下载排行榜的第二位。
AI 原生 APP 的三强格局原本是豆包、Kimi 和文小言,现在主角变为 DeepSeek、元宝和豆包,并且豆包的增长态势没有前两者那么迅猛。仅仅在两个多月的时间里,AI 头部应用就进行了大的更替,由此可以看出竞争是非常激烈的。
更重要的是,腾讯把微信的生态和 DeepSeek 的技术优势进行了结合。通过这样的方式,腾讯构建起了“社交 + AI”的护城河。与之相比,字节的豆包依然只局限在独立 APP 的形态当中,并且缺乏生态协同所具有的纵深。
字节正在谋划进行反攻。近日,许多用户在使用豆包 APP 时察觉到,所生成的回复里会呈现思维链(Chain-of-Thought)。接近字节的人士称,这是在小范围对深度思考模型进行测试。华尔街见闻从投资机构人士那里得知,字节的推理模型预计在 3 个月之后将会推出。
该人士觉得,DeepSeek R1 上线且开源之后,推理就已然成为 AI 应用里的必备功能,豆包上线推理功能是在预料范围之中的。推理能够像人那般分析问题,其回答也会更具逻辑性。上述投资机构人士称,通用基础模型如同知识库,推理模型如同学霸。通用基础模型记忆力极为超强,它擅长生成流畅的文本,也能够回答常见的问题。然而,它在处理复杂逻辑时容易出现错误。而学霸则会先去理解问题的本质,之后再分步骤去验证逻辑链。
事实上,在此之前,国内大模型就已经具备推理功能。月之暗面是国内发布推理模型的独角兽企业之一。2024 年 11 月,Kimi 正式发布了新一代数学推理模型 k0-math。在多项基准能力测试中,该模型的数学能力能够与全球领先的 OpenAI o1 系列中可公开使用的两个模型:o1-mini 和 o1-preview 相媲美。
Kimi 的创始人杨植麟之前曾向华尔街见闻表明,凭借强化学习、合成数据以及思维链这些新技术,能够提升 AI 在各个领域和场景中的推理能力以及智能水平的上限。更为强大的推理能力,将会有助于每一个用户开启更多具有挑战性的工作任务。
2 月 20 日,阿里巴巴集团的 CEO 吴泳铭在财报会上进行了发言。他表示,阿里会在近期发布以千问 Qwen2.5-MAX 为基础的深度推理模型。5 天之后,阿里的 Qwen 团队正式宣布推出新的推理模型,即深度思考 (QwQ) 。这个新模型是基于 Qwen2.5-Max 构建的,在数学理解、编程以及 AI 智能体等方面表现出色。如今,推理模型已然成为各方竞相争夺的重要领域。
快速补齐推理功能对豆包而言是当务之急,这样能更好地吸引用户的关注和使用,只有做到这一点才有可能改变用户快速向元宝和 DeepSeek 聚拢的趋势。
华尔街见闻从字节的内部人士那里得知,字节实际上很早就留意到了推理模型,只是在那个时候没有对其给予足够的重视。
2 月 13 日,在字节的新一期 All Hands 全员会上。字节的 CEO 梁汝波表明,去年 9 月 Open AI 发布了长链思考模型并引发关注。之后,字节察觉到了技术的重大变化。然而,字节并没有觉得需要立刻将其复现出来。他还直言,如果字节在一开始就对重大问题争先,那么就有机会更早地实现相关目标。
字节并非首次对 AI 反应滞后。在一年前的全员会上,梁汝波曾表明,公司对机会的敏感度比不上创业公司。公司层面的半年度技术回顾,到 2023 年才开始对 GPT 进行讨论,然而业内做得较好的大模型创业公司是在 2018 年至 2021 年创立的。
豆包大模型 1.5Pro 于今年 1 月正式发布。对于推理模型而言,此模型在能力升级的基础上,进一步提升了多模态能力。它采用 MoE 架构,并且通过训练 - 推理一体化设计,去探索模型性能与推理性能之间的极致平衡。
华尔街见闻得知,字节在努力通过大规模的 RL 方法来逐步提升模型的推理能力。在完全不借助其他模型数据的情况下,凭借 RL 算法的突破以及工程方面的优化,充分发挥了 TestTime Scaling 的算力优势,从而完成了 RL Scaling 这一任务,并研发出了 Doubao 深度思考模式。
字节内部人士介绍说,字节有阶段性成果 Doubao - 1.5 - pro - AS1 - Preview 。这个成果在 AIME 上已经超越了 O1 - preview 和 O1 等推理模型。并且随着持续进行 RL ,模型的能力还会不断地提升。
可以确定,豆包全面上线推理功能只是一个时间方面的问题。关键在于能否突破现有的推理能力限制。
对豆包团队而言,真正的难点并非推出推理模型,而是要推出能比肩甚至超越 DeepSeek R1 的推理模型。不然的话,在当下激烈的竞争环境里,豆包将会处于被动应战的态势。
军备竞赛
AI 成为了各方争夺的重要领域,特别是那些拥有资本以及人力资源的大型企业,它们更是在不断地进行投入和布局。
2 月 24 日,阿里巴巴集团的 CEO 吴泳铭作出宣布。他表示,在未来的三年时间里,阿里将会投入超出 3800 亿元的资金。这些资金将被用于建设云和 AI 硬件基础设施。投入的总额要比过去十年的总和还要多。这也创下了中国民营企业在云和 AI 硬件基础设施建设领域中,有史以来最大规模的投资纪录。
字节在阿里之前给出了明确预期,且投入手笔很大。浙商证券报告显示,字节 2024 年资本开支为 800 亿元,2025 年有望达到 1600 亿元。其中约 900 亿元将用于 AI 算力的采购,700 亿元用于 IDC 基建以及光模块、交换机等网络设备。
字节的 AI 方向注重基础模型与应用同时推进。公司努力在科技创新与商业化落地之间寻找一个平衡的支点。
华尔街见闻得知,字节在 2025 年的关键词为“务实的浪漫”。其要将想象转化为现实,与科技公司的定位相比,字节更强调要成为创新科技公司。年初,字节的豆包大模型团队已在内部组建了 AGI 长期研究团队,团队代号为“Seed Edge”,该团队鼓励项目成员去探索周期更长、具有不确定性且大胆的 AGI 研究课题。
字节的相关人士透露,Seed Edge的目标在于探索 AGI 的新途径,并且鼓励跨模态以及跨团队之间的合作。目前,已经初步明确了五大研究方向,其中包含对推理能力边界的探索,对感知能力边界的探索,对软硬一体的下一代模型设计的探索,对下一代 AI 学习范式的探索,以及对下一个 scaling 方向的探索。当然,字节在进行应用转化方面的探索。重点在于聚焦新型交互入口的开发,并且涉足了 AI 眼镜、智能耳机等硬件载体。同时,字节还强调通过规模效应来推动豆包等产品的用户渗透。
据不完全统计,字节在应用端的布局涉及助手、虚拟社交、图像等多种场景,其应用产品的数量超过 20 款。从去年下半年开始,豆包的用户量快速上升,并且率先突破了一亿。即梦在 2024 年 5 月上线,目前每周的活跃用户超过 200 万。近日,即梦还招揽了原零一万物 PopAI 产品的负责人,让其负责移动端业务,并且向剪映的负责人张楠进行汇报。
3 月 3 日值得一提,中国首个 AI 原生集成开发环境(AI IDE)Trae 的国内版正式上线。它配置了 Doubao - 1.5 - pro,并且支持切换满血版 DeepSeek R1、V3 模型。Trae 在代码补全、代码理解、Bug 修复以及基于自然语言生成代码等开发过程的全场景中,都具有非常好的适应性。
如果没有 DeepSeek 突然出现,外界原本将关注焦点放在字节系的 AI 应用上。然而,现实已经有了巨大的变化。DeepSeek 推动中国 AI 产业向前迈进了一大步,同时也将这场 AI 竞赛的难度提升到了一个新的层次,给其他模型公司带来了竞争压力,尤其是在当下正处于优势地位的字节。
算法争议
字节认为,All In AI 一方面是对未来的一种布局,另一方面也是来自现实的一种压力。它曾经取得成功的商业模式,也就是算法分发,正在引发更多的争议和不满。
过去十余年间,张一鸣所打造的字节帝国依靠“数据 - 算法 - 流量”的神奇力量,在移动互联网时代实现了逆袭。这套运转精密的工业化流水线,通过敏捷开发模式能够精准地捕捉用户需求,借助数据来驱动组织的运行,利用内部赛马机制激发创新的活力。
字节所依赖的算法,制造出了数量众多的信息孤岛和信息茧房。同时,在一场场舆论事件里,它也成为了焦点。
去年 11 月 20 日,农夫山泉的创始人钟睒睒在参加活动时向张一鸣喊话,称对方将网络变成了一种技术算法,正在玩弄民众的智商。他呼吁:算法要清楚明白地向公众公布。他还表示,以金钱来奖励和激励流量及其谣言,把网络变成一种技术算法,变成一种玩弄民众智商的游戏,这是不被允许的。
11 月 24 日,中央网络安全和信息化委员会办公室秘书局与工业和信息化部办公厅等部门一同开展“清朗·网络平台算法典型问题治理”专项行动。此行动重点整治以下问题:一是同质化推送营造“信息茧房”;二是违规操纵干预榜单以炒作热点;三是盲目追求利益而侵害新就业形态劳动者权益;四是利用算法实施大数据“杀熟”;五是算法向上向善服务缺失从而侵害用户合法权益。
字节作出了回应。12 月 2 日,抖音集团的副总裁李亮表明:各大平台都在运用算法。算法并非那么复杂且神秘。然而,算法的科普工作做得不到位,透明度欠缺。并且,对于谣言与网暴的识别以及打击力度也不够。这些确实是我们平台公司需要加以强化的方面。
1 月 3 日,抖音宣告要建立安全与信任中心。这一举措旨在切实推动算法和平台治理的透明化。字节首次明确地表明态度,要将算法的秘密予以公开。
抖音方面称,会依托安全与信任中心,着重介绍一些社会所关切的议题,这些议题包含算法原理,还有审核机制,以及打击网暴、谣言等平台的治理工作。
近日,字节开始将平台治理的进展进行披露。在 2024 年,今日头条拦截的不实信息数量超过了 500 万条。同时,抖音生活服务处置的违规短视频数量超过了 74 万条。
算法存在争议,在这背后,字节的短视频业务近年来的增速一直处于持续放缓的状态。字节投资 AI 的底气,主要是源于其持续为公司贡献现金流的主业。而主业面临压力,这无疑加重了字节在布局 AI 方面所面临的风险。
华尔街见闻从字节内部打听到,2024 年抖音电商的 GMV 大概是 3.5 万亿元,其增速已经回到 30%这个量级。为提升电商的竞争力,巨量引擎旗下的电商广告平台巨量千川,在近日将会被整体归入到抖音电商当中,使其成为抖音电商的二级部门。与此同时,分别为这两个部门提供服务的算法团队也被合并到了一起。
TikTok 扛起了全球化大旗,但在美国仍面临着监管压力,其未来的发展存在着极大的不确定性。飞书、朝夕光年以及大力教育等,在经过了上一轮的收缩之后,目前都表现得比较低调,字节甚至都没有在全员会上提及这些业务。
近年来,互联网行业普遍步入了降本增效的阶段。字节整体处于战略聚焦的状态,并且对其他多元业务进行了大规模的收缩。这也是字节为了给 AI 腾出更多资源和空间而不得不采取的举措。
豪赌未来
字节的 AI 战略十分坚定。张一鸣集中了全公司的力量,这是他对未来进行的一场豪赌。
华尔街见闻得知,在字节内部,无论是资金方面还是人力方面,都将 AI 视为第一优先级。张一鸣亲自关注豆包产品,并且会时不时地给出产品方面的建议。
张一鸣去年以千万年薪将阿里通义大模型的原技术负责人周畅招揽过来,这引发了字节和阿里两家公司之间的纷争。到了去年年底,周畅由于违反竞业协议而跳槽到字节,随后阿里对其提起了起诉并要求索赔。在今年年初,字节又招揽了谷歌 DeepMind 的原研究副总裁吴永辉等诸多人才。
去年年底,豆包概念股迅速走红。中科蓝讯、三维通信、掌阅科技等相关公司的涨幅曾一度超过 10%。基于此,字节跳动在 12 月 19 日发布了风险提示,表明资本市场中出现了炒作“豆包概念股”的现象,流传着大量夸大其词甚至是虚构的内容,提醒投资者千万不要轻易相信市场传言。
从估值角度来看,依据美国证券交易委员会(SEC)去年 11 月的文件,投资巨头富达投资把字节的估值调整到了 4100 亿美元,普信集团则将其估值调整至 4500 亿美元,这两个估值都高于 2022 年 7 月的 2750 亿美元低点。在业内人士看来,字节的估值上升体现了投资者对 AI 业务的关注。
不过,字节在拼命追赶 AI 浪潮。同时,字节也面临着财务压力以及时间窗口的紧迫性。在全员会上,字节的 CFO 高准清晰地表明:“公司当前的成本和支出的增速比收入和利润的增速要大。”
显然,DeepSeek 等竞争对手迅速崛起,这压缩了字节的技术窗口期。这迫使公司不得不在有限的时间内实现突破。字节的试错空间正在逐渐变窄。
一位关注人工智能的投资机构人士向华尔街见闻透露,字节拥有短视频等庞大的应用生态,同时还有火山引擎等算力资源。然而,DeepSeek 能够跑出来,主要是因为具备足够的创新定力,而这正是字节需要提升的部分。
2021 年的时候,字节的人数就已经突破了 10 万。公司最为担忧的是组织出现平庸化的情况。在今年的全员会上,字节重点关注的内容之一依然是组织管理,致力于对抗大公司病。今年的提法转变为了“不官僚、不内卷”,目的是减少那些不必要的流程,提升决策的效率。
张一鸣在 13 年前创立了字节跳动。在之后的五年里,他接连推出了今日头条、抖音、TikTok 这三个爆款应用。那时的字节跳动是以创业公司的状态在运行,公司人数仅有万余人。如今,字节跳动已经成为互联网行业的巨头。无论是在早期对 AI 前沿技术的判断方面,还是在对推理模型的反应方面,字节跳动都慢了半拍。
去年年底,昆仑万维的创始人周亚辉在对字节进行复盘时说道,字节在 23 年的 AI 战略方面是不及格的。但这丝毫不会对字节在 24 年的 AI 战略所呈现出的满分表现产生影响。在他的观念里,字节的组织具备极为强大的快速迭代能力。然而,AI 技术的迭代速度极快,DeepSeek 很快就超越了豆包。
字节花费两年时间才在百模大战中脱颖而出,成为 AI 领域的佼佼者。然而,公司尚未获得足够的喘息时间,以 DeepSeek 为代表的 AI 技术创新便迅猛袭来。留给字节和张一鸣的时间,已经变得很少了。