发布信息

大模型重塑社会文化生态:揭示其革命性文化社会技术本质与影响

作者:软荐小编      2025-04-22 10:01:12     54

大模型正在重塑我们的社会文化生态,然而它的本质常常被误解。《Science》上有一篇最新的文章,该文章揭示出大模型不是自主智能主体,而是一种具有革命性的文化社会技术,就如同语言、印刷以及市场制度一样。它以独特的方式汇聚并且重构了人类的信息,成为了“人类社会人工系统”的新的变化形式。这一重新定位的理论框架引领我们不再局限于“机器接管”与“乌托邦助手”的狭隘辩论,而是将目光投向更现实且紧迫的问题,即大模型将会怎样影响资源分配,怎样影响文化多样性,怎样影响科学进步,以及怎样影响权力结构的重构?

关于人工智能(AI)的争论,大多将关注点放在大模型是否为具备智能和自主能力的主体上。一些人工智能研究人员以及评论家进行了推测,他们认为我们正处在创造通用人工智能(AGI)主体的临近阶段,这一前景既让人兴奋,同时也引发了焦虑。人们同时对大模型的文化和社会影响展开了广泛的讨论。讨论主要集中在两个方面:其一,这些系统在当前使用过程中所产生的直接影响;其二,倘若未来这些系统转变为 AGI 主体,甚至有可能成为超智能 AGI 主体,那么可能带来的潜在影响。然而,将大模型视为智能主体的这种论调从根本上是具有误导性的。

将社会与行为科学的理念与计算机科学的方法相结合,能够有助于我们更精准地理解人工智能系统。大模型不应该主要被当作智能主体,而是应该被视作一种全新的文化和社会技术,这样人们就能够从其他人长期积累的信息里获得益处。

大模型这一新技术具备早期多种技术的重要特性。图像、文字、印刷、视频、互联网搜索等技术是这样,大模型能让人们获取他人创造的信息。当下,大模型主要在语言、视觉以及多模态领域,依托互联网,把早期技术的产出转化为机器可读的形式。但像经济市场、社会机构以及其他社会技术一样,这些系统不但能够广泛地传播信息,还能够以独特的形式对信息进行重新组合、转变以及重新构建。按照西蒙的说法,大模型是“人类社会人工系统(artificial systems of human society)”的一种新的变化形式,通过对信息的处理来达成大规模人群的协调合作。

我们的核心观点在于,这些技术创新会带来文化和社会上的影响,就像其他所有创新一样。并且,我们主张大型模型本身最好被理解为一种特殊类型的文化社会技术。它们与过去的技术类似,比如文字、印刷、市场、官僚体系和代议制民主。基于这一视角,我们能够提出一个独立的问题:这些系统将会带来何种影响?有些本身并非文化或社会性质的新技术,像蒸汽和电力,是能够产生文化影响的。而真正的新型文化技术,例如维基百科,其影响或许较为有限。不过,以往有许多文化和社会技术都对社会产生了极为深远且具有变革性的积极或消极影响,大模型很有可能也会像它们一样。

这些影响与其他重要通用技术(例如蒸汽或电力)带来的影响不一样,也和我们对假设性通用人工智能可能产生影响的预期不同。我们审视历史上的文化社会技术及其影响,就可以更好地理解人工智能模型的潜在风险与发展机遇,而不是仅仅担忧超级智能体的出现。

社会和文化组织

人类从存在起就一直依赖文化传承。首先是语言本身,人类拥有了从他人经验中学习的独特能力,此能力可谓人类进化成功的奥秘。这种学习能力的重大技术变革,引发了剧烈的社会变革。之后出现了图像,接着是文字、印刷、电影和视频。随着信息跨越更广阔空间和时间进行传播的数量越来越多,获取和组织这些信息的新方式随之产生了,涵盖从图书馆到报纸再到互联网搜索等方面。这些发展对人类思想和社会产生了深远影响,不管是积极方面还是消极方面。比如,在十八世纪,印刷技术取得进步,使得新思想能够迅速传播开来,这对启蒙运动和法国大革命起到了重要的作用。在 2000 年左右的时候,几乎所有的文字、图像以及动态影像信息都转变为了数字格式。接着,一场具有标志性的变革发生了。这些信息能够被即时进行传输,并且可以无限地被复制。

人类存在之后,我们始终依赖社会制度来对个体的信息收集以及决策过程进行协调。这些制度本身可被当作一种技术。在现今,市场、民主制度以及官僚体系具有重要地位。经济学家弗里德里希·哈耶克认为,市场的价格机制能够生成关于极为复杂且难以捉摸的经济关系的动态信息。生产者和消费者不用去理解生产过程的复杂性,只需把注意力放在价格上。价格能把大量的细节压缩成一种简单且可用的表示。在民主政体中,选举机制以类似的方式,将分散的民意汇聚成具有集体性质的法律和领导决策。人类学家斯科特指出,民主国家通过构建官僚体系来管理复杂社会,其他形式的国家也通过构建官僚体系来管理复杂社会,这种官僚体系用于构建分类和系统化信息。

在计算机尚未出现之时,市场、民主以及官僚体系都依靠着一种机制,这种机制能够生成一种具有特定性质(不完整、有选择性且不可逆转)但却很有用的表示。这些表示既与个体的知识和决策相关,又超越了个体层面。像价格、选举结果或者国内生产总值(GDP)这类指标,都是对众多个体的知识、价值观、偏好和行为的概括。同时,这些社会技术也能反过来影响个体的知识和决策。

市场、国家或官僚体系的抽象机制,如同文化媒介一般,能够以极为重要的方式对个体生活产生影响,有时还会带来负面效果。比如,中央银行把金融经济的复杂性简化为几个关键变量,从表面上看带来了金融稳定,然而却让住房市场的不稳定性逐渐累积起来,而中央银行对这方面的关注不够,最终引发了 2008 年的全球金融危机[4]。同样,市场或许不能反映像有害碳排放这类“外部性”的信息。通过像碳税这样的手段把这些信息融入到价格体系中或许是有帮助的,不过这需要国家去采取行动。

人类在很大程度上依赖这些文化和社会技术。这些技术能够存在,是因为人类具备独特能力,而这是作为智能主体所特有的。人类以及其他动物能够感知并应对外部世界的变化,构建世界的新模型,依据证据积累修正模型,并且能够设计新的目标。人类个体能够创造出新的信念和价值观,并且可以借助语言或者印刷的途径把这些信念和价值观传达给他人。文化以及社会技术会以一种强有力的方式来传递和组织这些信念与价值观,然而倘若没有这些个体所具备的能力,那么这些技术就无法施展其作用。要是没有创新,模仿也就丧失了其存在的价值[5]。

某些人工智能系统,像机器人领域的那些系统,确实在努力达成类似探索真理的能力。从原理方面来看,在未来的某个时段,人工系统完全有具备这种能力的可能,因为人脑本身就具备这些能力。然而,就当下来说,这类系统与人类的这些能力之间还存在着很大的距离。我们可以讨论当下是否应该对这些潜在的未来人工智能系统感到忧虑,也可以讨论当它们出现时我们该如何去应对,然而这与回答当前以及近期大模型所产生的影响是不一样的。

大模型

大模型在过去几年中取得了显著且出乎意料的进展,它不同于那些更具能动性的系统。这一进展使它成为当前人工智能讨论的焦点。这引发了一种观点,即通过“规模效应(scaling)”,也就是采用现有设计并增加使用的数据量和算力,就能在不久的将来实现通用人工智能(AGI)。大模型从根本上与智能主体是不同的,规模的增大也不会使这一情况发生改变。比如,“幻觉”现象在这些系统里是普遍存在的,原因在于它们没有真伪的概念(即便已经有了一些相应的解决措施),它们仅仅是对文本和图像进行采样以及生成而已。

大模型不是智能主体,而是将文化与社会技术的特性以全新方式融合。它能对人类生产的大量复杂信息进行总结概括。这些系统不仅能像图书馆目录等那样总结信息,还能像市场、国家和官僚机构那样,在规模上以全新方式重新组织和重构这些信息的表示或“模拟”[1]。市场价格是对资源配置和底层信息的一种表示,且这种表示是有损的。政府统计数据和官僚分类也无法完全反映底层人群的特征。大模型同样是其训练数据语料库的“有损 JPEG”[6]。

人类难以对大规模文化和社会技术进行清晰的思考与认识,所以我们倾向于把它们当作具有主体性的存在。故事是一种力量极大的信息传递方式,从篝火旁的传说到小说,再到视频游戏,都是通过创造富有表现力的虚构主体来达成这一目的,并且听众也清楚这些主体并非真实存在。聊天机器人是赫拉克勒斯、阿南西和彼得兔的后续者。同样,人们很容易将市场视为具有能动性的主体,也容易将国家视为具有能动性的主体。甚至,机构能够拥有某种法律人格,公司也能够拥有某种法律人格。

然而,类似主体的交互界面以及拟人化的外表背后,大语言模型(LLM)和大型多模态模型其实是统计模型。它们会处理大量由人类生产的文本语料,把这些语料分解成特定的词语,还会估计长词序列的概率分布。这种方式对语言的表征并非完美,但其中包含了关于其所总结模式的大量丰富信息。

大语言模型具备预测序列中下一个出现词的能力,以此来生成与人类生成的文本相似的内容。大型多模态模型是以类似的这种方式去处理音频、图像以及视频数据的。大模型既抽象出了众多人类文化,又能基于它开发各种新操作。比如,能够通过提示让大语言模型对其训练数据进行复杂转换,像简单的论点可以用华丽的隐喻来表达,华丽的辞藻也能被凝练为朴实的语言。类似的技术还让其他模型能依据提示生成新的图片、歌曲和视频。曾经有一整套海量的文化信息,它过于复杂且混乱,而如今这整套文化信息已变得能够易于进行大规模操作。

实际上,这些最前沿的 AI 系统有两方面依赖。一是依赖于由人类生成和策划的大量文本和图像缓存;二是依赖于其他形式的人类判断和知识。特别地,这些系统依靠来自人类反馈的强化学习(RLHF)或其变体,即有成千上万的工作人员对模型输出进行评分。同时,它们还依赖于提示词工程,人类需要运用背景知识和创造力从模型中提取有用的信息。最新的“思维链(chain of thought)”模型通常也是从与人类用户的对话开启的。

大模型从文本中提取一般统计模式所依靠的是一些相对简单且强大的算法,而这些算法并非它们成功的关键。现代人工智能的基础在于图书馆、互联网,在于成千上万的程序员,也在于日益壮大的国际活跃用户群。请求机器人帮忙撰写求职信,这实际上是一种与众多前求职者、求职信撰写者以及 RLHF 工作人员之间的关系,且这种关系是通过技术来进行中介的。

挑战与机遇

人工智能的话题讨论应当聚焦于这些新文化和社会技术所引发的挑战与机遇。我们现今拥有一种技术,它对于书面文化和图像文化的作用,如同大规模市场对于经济的作用,也如同庞大官僚机构对于社会的作用,甚至能够与印刷曾经对语言产生的影响相媲美。那么,接下来将会发生什么呢?这些系统如同过去经济、组织和信息领域的“通用技术”那般,会对生产力产生影响[7]。它既能对人类劳动起到补充作用,又能使以前只有人类才能完成的任务实现自动化;并且还会影响资源分配,决定“谁获得什么”[8]。

然而,它们会带来更广泛且深远的文化方面的影响。我们不太清楚这些影响会不会像印刷、市场或者官僚机构等早期技术所带来的影响那么大。但是如果把它们当作文化技术来看待,就能够增强它们潜在的影响力。无论是作为引发变革的因素还是变革所带来的结果,这些早期技术在 18 世纪和 19 世纪广泛的社会转型过程中都起到了核心的作用。这些技术,如同大模型一般,都具备对信息进行抽象处理的能力,进而让新型大规模操作能够得以实施。它们引发了一些合理的担忧,比如错误信息和偏见的传播、文化的同质化或者分裂,以及权力和资源分配的变动。新的传播媒体,像印刷和电视的出现,也伴随有对其可能传播错误信息以及强化有害文化力量的合理担忧。市场所采用的分类方案往往带有压迫性的前提假设。

这些技术同时为重新组合信息以及在全球范围内协调数百万人的行动创造了全新的可能性。对于大语言模型在社会、经济和政治影响方面的讨论,延续了对新型文化与社会技术一直以来的担忧和希望。要对这些讨论进行定位,一方面需要认识到新旧论点之间的共性,另一方面也需要勾勒出这些新兴且不断进化的技术的具体特征。

这种将大模型映射至文化社会之中,是社会科学的核心任务之一。工业革命及其影响引发了社会、经济和政治的动荡,社会科学正是在这样的动荡中孕育而生。社会科学家对过去这些技术影响进行研究,能够帮助我们思考人工智能在社会层面上那些不那么明显的积极和消极影响,并且可以探索如何设计新的人工智能系统,以放大其积极效应并减少消极影响。19 世纪和 20 世纪媒体、市场以及官僚技术得以扩展,产生了相应效应,造就了经济领域的输家与赢家,还取代了从文员、打字员到“人工计算机”等整个类别的工作者。如今,大模型也引发了人们对于相关技术可能取代“知识工作者”的担忧。

图源:The Stompin' Ground

除此之外,存在一些不太明显的问题:大模型到底会让文化和社会趋向相同呢,还是会让它们产生分化呢?在历史背景当中去思考这个问题,是特别具有启发意义的。当下的担忧与 19 世纪到 20 世纪关于市场和官僚机构的争论十分相像。韦伯曾担忧经济和官僚“理性化”所导致的麻木与同质化的后果。密尔则认为,市场交换能够让参与者接触到各种各样的生活方式,进而缓和冲突(“温和商业”)。

大模型表现极为出色,它们能够将文本、图像和视频序列的实际概率分布如实重现出来。从本质上来说,它们在训练数据处于最一般的情形时,往往会表现得最为准确;而在训练数据是罕见或全新情境时,可能准确性就会比较差。这种特性有可能让大模型加重韦伯所担忧的那种同质化现象。

一方面,依据它们所归纳的多样化文化视角,大模型或许能够协助我们规划出新的办法。把这些视角加以整合并且保持平衡,也许能给解决复杂问题提供更加细致且有效的途径[11]。我们能够构建与“社会”相似的生态系统,在这个系统里,不同的视角(被编码在不同的大模型中)会相互辩论,甚至会相互交叉融合从而产生混合视角[12];同时,我们还可以识别出人类专业知识领域中存在的空白[13],接着去寻求有效的弥补办法。大模型在抽象化文本和图像的微妙数据模式方面能力惊人,这显示这类技术能发现人类知识和文化各领域的模式,包括单个个体难以觉察的模式。我们或许需要构建新系统,让大模型反映的内容和呈现的人格多样化,以再现类似人类社会的分布和多样性。

这种系统的多样化对于科学进步或许是很重要的。形式科学自身依赖于 17 世纪和 18 世纪新型文化技术的出现。这些新型文化技术包括咖啡馆、快速邮递,还有期刊以及同行评审。人工智能技术有可能使科学进展进一步加快,不过这要取决于我们怎样富有创造性地去使用和重新思考这些技术。大模型通过把众多文本、音频和图像里的不同视角相互联结,有可能让我们发现之前从未有过的联系,进而给科学和社会带来好处。到目前为止,这些技术大多被训练成只是重复常规信息的小助手;但要是我们把它们当作探索未知领域的地图,或许就能够打开新世界的大门。

新的文化和社会技术以一些不那么显著,但更为有趣的方式对经济关系产生着影响。文化技术的发展使得信息生产者与信息分发系统之间产生了根本性的经济张力。两者相互辅助:出版商离不开作家,作家也离不开出版商;然而他们的经济收益却走向相反:信息分发者如果能以低代价获取生产者的信息就能盈利,生产者如果能以低成本将信息分发出去也能盈利。这种相互作用一直是新文化技术的一个特点,数字信息分发的便捷性与高效性已让这一问题变得极为突出,在从地方报纸到学术期刊等各个领域都能体现出来。大模型能够以极快的速度进行处理,其处理能力高效,覆盖范围广泛,能够一次性处理所有可用信息。并且这些模型是集中所有制的。这使得相关问题显得格外严重。权力集中后,系统所有者可能更易在牺牲他人利益的情况下独享效率所带来的好处。

同时存在一些关键的技术问题:大模型系统性的不完善在多大程度上能够被弥补呢?它们在什么时间比基于人类知识工作者的系统的不完善更具优越性或劣势呢?这些技术问题不应该掩盖更为关键的政治问题:哪些参与者具备围绕自身利益进行动员组织的能力?他们又将怎样影响技术与组织能力的结合呢?

技术领域的评论家时常把这些问题进行简化处理,将其变成机器与人类之间的一种单一对抗。这种对抗表现为要么是进步的力量战胜了倒退的倾向,即卢德派倾向;要么是人类成功地抵制了人工技术所带来的非人道的侵蚀。这种看法既没有充分理解在计算机出现之前就已经存在的复杂分配性斗争,也忽略了未来进步可能会采取的多种不同路径,并且每种路径都拥有其独特的技术可能性与选择[8]。

早期的社会和文化技术中,各种制度相继出现,其中包括规范性和监管性制度,这些制度用于调节其影响。从印刷媒体的编辑、同行评审以及诽谤法等,到市场、民主和官僚体系中的选举法、存款保险以及证券交易委员会等,这些制度的效果各不相同,并且需要不断进行修订。然而,这些制衡力量不是自然出现的,而是技术内外部的各方经过共同且持续的努力才形成的。

未来展望

关于通用人工智能(AGI)的叙事,即把大模型当作超智能主体的说法,在科技界内外都得到了推广。乐观的“热衷者”在宣传这一观点,忧虑的“末日论者”也在宣传这一观点。这种叙事误解了这些模型的本质以及它们与过去技术变革之间的关系。更为重要的是,它将人们对这些技术真正带来的问题与机遇的关注进行了有意的转移,同时忽略了历史教给我们的关于如何确保收益大于成本的经验。

当然,如前文所述,未来或许会有更接近智能主体的假设性人工智能系统(hypothetical systems),我们或许会探讨怎样应对这些假设系统。然而,大语言模型并非这样的系统,就如同图书馆借书目录或互联网一样。像目录和互联网一样,大模型只是悠久文化和社会技术历史的一部分。

社会科学对这段历史进行了详细探讨,从而形成了对过去技术剧变的理解。把计算机科学与工程学和社会科学紧密结合起来,有助于我们理解这段历史并运用其中的教训。大模型到底会引发文化趋同还是分裂呢?它们会强化还是破坏人类探索真知的社会制度呢?在重塑政治经济结构的过程中,到底谁会获利,谁会遭受损失呢?这些问题以及其他十分紧迫的问题,在把大模型简单地与人类主体进行类比的讨论里,都不容易被关注到。

改变讨论的范式能带来更好的研究成果。双方若认识到大模型只是新型的文化与社会技术,既不过度也不疏忽,那么社会科学家和计算机科学家之间的合作以及结合各自优势就会容易很多。计算机科学家能够把他们对于这些系统运作机制的深刻理解,和社会科学家对其他大规模系统在过去是如何重塑社会、政治和经济的认知融合在一起,这样既可以完善现有的研究议程,又能够发现新的研究方向。这有助于纠正过去的混乱局面。一方面,计算机科学家常常会过度简化复杂的社会现象;另一方面,社会科学家未能理解这些新技术复杂的运作机制。

这将使人工智能政策讨论摆脱对“机器接管”恐惧的简单聚焦,也摆脱与近未来人人拥有完美、可靠且高效的人工助手这一乌托邦式愿景的对抗。大模型实际政策的影响无疑会有所不同。市场和官僚机构会让某些类型的知识比过去更易获取和处理,这促使政策制定者关注可衡量和可观察到的新事物,却忽视了不那么明显、较混乱的部分。如市场与媒体的历史案例所显示,结果是权力和影响力会倾向于能充分运用这些技术的人,而无法运用的人则会逐渐被边缘化。人工智能使被其使用者以及数据提供者的地位被削弱,同时让人工智能专家和政策制定者的地位得到强化[14]。

首先,工程师和计算机科学家已意识到大模型偏见的问题,并在思考其与伦理和正义的关系,但还应更进一步。其次,要思考这些系统将如何影响“谁获得什么”。再者,要思考它们对社会分化和融合将产生怎样的实际影响。最后,要思考大模型是否能够开发用来增强人类创造力,而非让我们变得迟钝。要找到这些问题的正确答案,需要具备工程学方面的理解,同时也需要有社会科学的洞察。把人工智能辩论的焦点从主体转移到文化和社会技术上,这是构建这种跨学科理解的一个重要的起始步骤[15]。

相关内容 查看全部