技术推动多元化。
文丨许俊浩
技术革新是当今社会广泛关注的重要命题。
近日举办的 2025 年世界互联网大会亚太峰会,重点对 AI 所带来的前景与挑战进行了探讨。该峰会发布了《以普惠包容的人工智能治理赋能全球可持续发展》这一报告,其目的是强化 AI 治理并推动国际合作,借助普惠包容的 AI 发展来促使数字鸿沟得以弥合。
科技发展不仅仅局限于技术进步这一方面,普惠是其中很重要的一个部分,并且技术透明化是能够通往普惠的一条关键途径。
抖音日前举办了“安全与信任中心开放日”活动,这是推动技术透明化的一个典型例子。在该活动里,抖音的算法工程师等相关工作人员对抖音算法的逻辑以及平台审核流程进行了拆解。推荐算法属于 AI 技术中机器学习的具体应用领域。抖音推荐算法包含多种技术手段,如“协同过滤”算法、Wide&Deep 模型、双塔召回模型等。它能够通过分析和学习用户行为,构建出千人千面的内容推送。即便算法不理解内容,也能精准地捕捉到用户的兴趣,并且以多元化的方式增加平台内容的丰富度和用户的留存率。
抖音一直致力于此方向。2025 年 3 月,抖音设立了“抖音安全与信任中心”网站。该网站面向社会,将算法原理、社区规范、治理体系以及用户服务机制予以公开。
这些动作能让公众进一步理解技术决策的逻辑,有助于在用户与用户之间、用户与平台之间建立信任,凭借平台所倡导的优质多元内容,推动互联网内容更好地发展。
01
茧房起于偏见
推荐算法的本质是信息过滤系统。
当下的人们处于数据和信息爆炸的时代。调研机构 IDC 数据显示,全球在 2024 年产生的数据量达到 159ZB,到 2028 年将会达到 384ZB。需要明确的是,1ZB 等于 10 万亿亿个 Byte。如果用一部约两小时的 4K 电影约 20G 的大小来进行衡量,159ZB 相当于 7.95 万亿部电影,连续播放这些电影大约需要 18 亿年。
互联网时代的信息量远远超过了个人能够处理的极限。所以必然需要平台来对信息进行分类、筛选以及推荐。个性化推荐算法就如同私人管家一样,如今已经在电商、视频、社交等不同的平台上得到了广泛的应用。并且它能够高效且准确地满足各个用户的不同需求。
以抖音为例,其协同过滤算法与 Wide&Deep 模型有结合。协同过滤能够依据不同用户的行为来推荐相似的内容。Wide&Deep 模型则可以发觉内容所具有的稀有特征,并标记出相关性。这两者是可以互补的,从而使得内容推荐变得更为广博多样。
基于内容的协同过滤算法会对用户行为进行分析和比较。比如用户甲观看了 A、C、D 这些内容,用户乙观看了 B、C、D 这些内容,用户丙观看了 C、D、E 这些内容。通过这样的观看行为,算法会判定 C、D 内容具有较高的相似度。如果用户喜欢 C 这个内容,那么在很大概率上也会喜欢 D 这个内容。这样一来,就更便于推出那些受到更多人喜爱的头部内容。
Wide 模型部分和 Deep 模型部分构成了 Wide&Deep 模型。Wide 部分使模型具备较强的记忆能力,能够直接学习并运用历史数据中物品或特征同时出现的频率。Deep 部分让模型拥有泛化能力,即能够对未见过的数据进行推测,例如推测一个喜欢美食的用户可能对厨具测评感兴趣。Wide&Deep 模型发挥作用,同时协同过滤算法也发挥作用,平台能够快速推荐热门内容,并且还能挖掘用户潜在的多样化兴趣,从而让小众内容可以被更多用户关注。
不少人将算法视作“信息茧房”推手,但事实与之相去甚远。
信息茧房这一词汇来源于美国法学教授凯斯·R·桑斯坦在 2006 年出版的《信息乌托邦》。意思是如果人仅仅关注和选择让自己愉悦的内容,那么信息接触面就会逐渐变窄,从而被困在自我编织的茧房中。实际上,当这一概念被提出的时候,并不是针对算法的,并且也没有实证研究以及量化数据来作为支撑。它在当下被广泛应用,更像是互联网用户信息焦虑的一种集中表现。
推荐算法以机器学习为基础,它通过对已有的数据进行数学建模,去寻找规律,会把用户对内容的具体偏好抽象成数学关系。就算是最优秀的算法工程师,也没办法脱离算法技术的各种理论和架构,去简单地解释为何把某个视频推荐给了这些用户而不是那些用户。当每个用户都成为数据里的“点”后,用户无法全面地纵览整体情况,必然很容易就会感觉自己身处黑盒之中。抖音推送的算法变得透明化,其目的就是希望能够打开那神秘的黑盒,让更多的人可以真正地去理解算法的内核。
澳大利亚学者阿克塞尔·布鲁恩斯在 2019 年发表的文章《问题不在技术,笨蛋》中援引了多位学者的实验。该实验表明,社交媒体、搜索引擎等不同网络平台扩充了用户的信息源,让用户接触到的信息多样性比不使用这些平台的用户更高。例如,对 370 万澳大利亚推特用户的调研显示,不同观点的网络用户集群之间并非完全隔离,而是仍然保持着良好的互动。
02
优质深度并举
为促进内容丰富度提升,抖音推荐算法设置了兴趣探索机制。
假如用户对观看音乐类视频有特别的喜爱,那么算法会尝试向用户推送与音乐相关的其他艺术领域的内容,像美术赏析或者舞蹈表演。用户的兴趣点存在大小的差异,例如大部分人主要集中在美食领域观看,而小部分人则在摄影领域观看。在进行算法推荐时,会给像摄影这样的小兴趣点赋予更多的权重,以避免大兴趣点领域内容的过度重复。
算法会特意进行多样化推荐,避免同质化内容使客户产生审美疲劳。若一个喜欢搞笑情景剧的用户,在算法不考虑多样性时,可能会接连被推荐 3 个搞笑情景剧和 2 个其他内容;而在算法设定多样性的情况下,只会被推荐 1 个搞笑情景剧,其余的都为多样化的其他内容。
算法能够贴合用户需求,同时也能助力用户去探索更多的可能。并且,这有助于使小众、深度内容找到真正喜爱它们的用户。
抖音曾尝试直接为知识、历史、科技等深度内容进行加热,据海克财经了解,然而实际效果并不好。因为此举改变了算法的正常逻辑,会对数据循环产生影响,进而导致这些内容的后续推荐受到干扰。此后,抖音转换了思路,针对深度内容进行训练,构建了预估收藏和重复观看概率的模型,使得平台中的深度内容分发效率得以提高。
博主“米三汉”在 2024 年 6 月发布了一条“450 分钟解读红楼梦”的长视频,这很有典型性。到现在为止,这条视频的播放量已经超过 3 亿,点赞量达到了 1291 万,收藏量达到了 773 万。抖音总裁韩尚佑称,2025 年抖音优质内容的曝光量将会增加 300%。
淄博、哈尔滨、天水等城市走红,这能印证算法对于小而美内容的力量。算法挖掘出了本地人习以为常的部分,将其分发给对旅游和地方特色感兴趣的用户,接着这些用户又层层传播,最终形成了“破圈”的回响。
其中天水麻辣烫的走红颇值一提。
2024 年 2 月,博主“一杯梁白开”在抖音平台发布了一则视频,内容是“建议全国普及甘肃麻辣烫”。视频里的麻辣烫汤汁呈现出浓稠的状态,色泽十分诱人。这则视频很快就吸引了众多用户的关注。截至当下,该视频的点赞量已经达到了 141 万。后续“三个叁”以及“橘子公主”等博主前往了天水。在抖音上,热榜出现了“到甘肃吃麻辣烫是什么体验”这样的话题,还有“甘肃天水打响 2024 旅游第一枪”等话题。越来越多的用户开始参与互动。
算法精准匹配以及信息传播裂变高效,使得天水麻辣烫从本地“存在感”不强的小吃变成当地大热文旅 IP,还得到了网友持续关注。官方数据表明,在 2025 年清明假期(4 月 4 日至 4 月 6 日),天水凭借在线旅游订单量进入清明节全国“黑马”旅游目的地行列,全市大部分酒店的入住率接近 100%。
还有成都小众的“三花”民间川剧团,陕西考古研究员讲解的考古知识,以及被网友称作“人间清醒直击灵魂”的作家史铁生的作品等。这些都因推荐算法在抖音上有了新的生命力。以史铁生为例,根据《2024 抖音读书生态报告》,抖音上关于他的相关视频数量累计增长了 192%,视频总时长增长了 415%。
03
力促技术普惠
平台提升内容丰富度更能增强用户粘性。
中国人民大学高瓴人工智能学院发布的《算法向善与个性化推荐发展研究报告》提到,内容类型数量足够多的时候,以及内容类型的分散程度足够高的时候,与用户能够长期留存是呈正相关态势的。清华大学社科院发布的《用户使用、算法推荐与信息茧房研究报告》的数据表明,有 70%的用户对个性化推荐算法持肯定的态度,他们认可算法能够在信息过载的情况下帮助用户解决问题。
在推荐算法的基础上,抖音还进一步扩充了平台机制和功能。
热点热榜方面,它会展示当天的重要新闻事件,在话题内容里汇集事件的最新进展,对不同观点进行平衡,以帮助用户知晓事件的全貌,最大程度地避免信息茧房的产生。
抖音搜索持续保持增长。海克财经了解到,部分知识类、攻略类内容发布 3 个月后,其搜索的平均流量占比能达到 50%以上。平台把搜索与推荐相融合,让优质内容产生长尾效应。同时,用户可通过对内容或账号点击“不感兴趣”,以及在内容管理工具中设置自身内容偏好,来优化个性化推荐内容。
综合而多元的机制为用户提供了更多可能。
图书是这样的。抖音上存在大量关于经典图书和冷门佳作的视频。用户在浏览这些视频的过程中能够培养兴趣,并且可以与出版社以及读书达人建立联系。这使得图书宣传不需要完全依照传统的媒体宣传、线下签售、读者见面会等方式。原本相互独立的读者与作者、读者与读者被算法连接起来,甚至能够跨越时空的界限。这也给图书出版行业提供了新的渠道。
推荐算法让农业技术推广变得高效且便捷。国内中小农户分布较为广泛,他们种植和养殖的种类繁多,所需的技术门类也十分繁杂。原本,科研机构和农业企业在进行技术推广时成本较高。而短视频、直播等形式的出现,使得农业技术推广的覆盖面得以扩大。
博主“梁老师讲农业”拥有 22 万粉丝,他是农业技术推广大军的一员。博主本名梁振清,年纪已八十多岁,是从业 40 年的高级农艺师。他通过抖音传授自己毕生所学的农技知识。在推荐系统的助力下,他的视频能被精准推荐给对三农、乡村、农技感兴趣的用户,用户也能在搜索框中搜索并了解农技相关内容,以扩展相关知识。
需要说明的是,算法本身仅仅是工具,内容平台不可能完全由算法来把控内容。抖音借助人工参与的平台治理,为算法设置了“护栏”,对各类风险内容进行定义和识别,并且结合内外部的反馈,持续对算法进行迭代,以此来保证推送的内容是合法合规的。
推荐算法在日常生活中的渗透率提升了,公众对算法的好奇与疑虑也在不断增长。如今抖音通过进行算法透明化实践,把技术决策的数字面纱揭开了,这样或许能够消除误解,累积信任,推动内容生态发生深层次的变革。算法给出的不只是浏览和互动的数据,还对商业价值、文化生态、社会责任提供了多维支撑。追求正向内容多元化的算法,正在成为技术向上向善的重要注脚。