AI 的进化速度超乎大家的想象。如今的 DeepSeek 能够为你答疑解惑,还能通情达理,与人心意相通,在某些方面可以担任心理咨询师的角色。DeepSeek 作为一个异军突起的 AI,其“才华”让众人惊艳,要了解它的独特之处,可以从其成长的底层逻辑进行梳理。
看问题“更高一层”
当一个人处于困惑或焦虑的状态时,与 DeepSeek 进行交流,竟然会产生一种仿佛天空辽阔、大海宽广般的豁达感受。
当你询问它“战胜焦虑有什么办法吗”,它给出的回答是:要放弃“立刻变好”这种期待。可以允许自己在带着焦虑的状态下生活。焦虑的消退就如同冰层的融化一样,是一个悄无声息的过程。
你向它询问“养育孩子的意义是什么”,它会告知你:请接纳生命中最为温柔的“失败”。育儿手册中所给出的标准答案并非是无所不能的,没有任何一位父母是毫无瑕疵的,总会遭遇到挫折与失败,而这些挫折与失败教会了我们“爱无需正确,只需陪伴在侧”。
有人问它:一个人在一生中既没有挚友,也没有伴侣,能否生活得开心呢?DeepSeek的回答是:人类对于幸福的定义,从来都不是只有一种方式。当我们把社会规训的滤镜去除掉后,就会发现生命的丰盛程度,要比传统叙事中所谓的标配人生更加辽阔。有人在与星辰的对话里获得了灵魂的共振;有人在对古籍的修复中触摸到了千年的体温;还有人通过救助流浪动物构建起了情感网络。
你与它讨论“人生的意义是什么”,它持有这样的观点:人生的意义并非是一道需要填空的题目,而是一道需要论述的题目。它的看法会随着时间的流逝以及经历的增加而发生改变,在少年时期是梦想,到了中年时期是责任,到了老年时期则是传承。它同时告诉你,答案本身并不是关键所在,这个问题本身能够促使我们持续地进行反思,与他人建立联系,并且在有限的生命历程中活得更加清醒和热烈。
AI的自我进化
一些人在与 DeepSeek 聊天之后,不禁发出感慨:AI 对人情世故越来越了解,而人类却越发像 AI 了。DeepSeek 的出现,改变了哪些关于 AI 的叙事逻辑呢?
可以先来讲讲人工智能的发展主线。1956 年在达特茅斯学院研讨会上正式提出了人工智能这一概念。从那之后,AI 就开启了一条新的路线,也就是进行机器自我学习,包括处理数据、提取特征、训练模型、改进性能以及给出结果。
若干代更迭之后,出现了一种新的算法,也就是具有记忆和优化功能的循环(递归)神经网络(简称为 RNN)。这种算法可以被想象成一个有“记忆”的故事讲述者,它会将当前情节的信息与之前“记住”的信息相结合,从而理解和处理一些新情节。
20 世纪 80 年代,人工智能界再度出现一种算法,即反向传播算法(简称 BP 算法)。设想一下,AI 的这种 BP 算法犹如一个在迷宫中寻觅出口的探险家。有了该算法后,探险家能够及时对迷宫路线进行调整,以便自己下次行走时更易于找到出口。
进入 21 世纪后,大语言模型(LLM)成为了 AI 界研究的主流。大语言模型如同一个知识渊博且能力持续突破的“超级大脑”,它知识储备丰富,语言理解能力较强,语言生成能力较为出色,学习和适应能力也很强等。
DeepSeek 等 AI 的大语言模型所依赖的是算法、算力和数据这三大基本要素。这三者之间的关系能够用烹饪菜肴的方式来形象地进行说明。
算法如同烹饪的菜谱,明确了食材(即数据)的处理方式以及组合方式。菜谱细致地阐述了每一步的操作流程、调料的用量以及烹饪所需的时间和火候等,而算法也规定了数据的处理流程、计算方法以及逻辑顺序。
算力如同厨师的烹饪水平以及厨房设备的性能。技艺高超的厨师(强大的算力)可以更迅速且精准地依据菜谱要求进行烹饪。并且,先进的厨房设备(高性能的计算硬件)能够协助厨师更高效地完成烹饪任务。
数据如同烹饪时所需要的食材。倘若没有丰富多样且高质量的食材,即便有再精妙的菜谱以及再厉害的厨师,也无法烹制出令人满意的菜肴。
将“顿悟”精准展示
饺子导演所执导的哪吒系列动画电影诞生了一句非常经典的话:“人心中的成见犹如一座大山。”DeepSeek凭借自身的力量改变了在 AI 领域人们的认知成见。
以前,AI 领域普遍有这样一种技术认知,即 AI 的大语言模型性能和算力投入是呈正相关的。他们一直强调“大力出奇迹”。然而,DeepSeek 的出现直接证明了“算力并非是唯一的标准”,并且算法创新也能够开辟出一条与众不同的道路。
DeepSeek 最令人惊艳的方面在于向大家展示了其思考过程。如同人类在解决难题时,一旦意识到之前的思路存在问题,就会停下并重新思考。这是 AI 首次呈现出如同人类般的高阶思维以及内心独白,而这也正是 DeepSeek 的独特之处。
这种现象其实是机器的“顿悟”,而 DeepSeek 把它进行了更精确的表达。
中国科学院院士陈润生曾对这种现象作出如下解释:在训练神经网络时,讲一遍它无法理解,讲两遍它依然不懂,即便讲到第四遍它还是不懂,然而到了第五遍,它却一下子就学会了,这就如同小孩学习东西一样,教一两遍他们可能不明白,但教到 N+1 遍时他们就突然学会了。
“顿悟”并非由 DeepSeek 率先发现。OpenAI 团队在 2023 年进行大模型训练时发现了这一现象。然而,DeepSeek 将这种顿悟写入了公开的技术文档中,并且在应用的思考流程上有所体现,使得用户能够看到并且进行评判。
有趣的是,机器的这种领悟并非是逐步发展的。它是瞬间发生且具有突破性的,就如同一个人在长时间思考一个难题之后,忽然间灵感闪现,一下子就明白了。
更好地传递“衣钵”
AI 大模型的参数越来越多,在应用端处理某些领域问题时,实际上并不需要如此庞大的模型。目前,各 AI 公司都在对蒸馏模型进行研究,蒸馏模型是一种常用的技术方法。DeepSeek 在做蒸馏模型时,也进行了一些设计,这些设计很巧妙。
老师教学生知识是从易到难逐步深入,这样学生更容易接受。DeepSeek 对一些大、小模型进行渐进式分层蒸馏,一方面保留大部分架构特性,为学生模型打下良好基础;另一方面提升推理速度,让学生掌握快速解题的方法;再一方面优化决策路径,提高任务准确率,如此一来,学生就能学会更高效的思考方式,能够用更少的精力答对题。
蒸馏后的小模型,其推理能力显著提升,并且超越了在小模型自身基础上进行强化学习的效果。这就如同从一大杯浓郁的咖啡里提取出一小杯精华浓缩咖啡,既保留了咖啡的风味,又保留了香气,也就相当于保留了大模型的核心知识和能力。小模型能够通过模型蒸馏技术,在诸如手机、智能手表等计算资源受限的设备上运行,进而实现快速推理。就如同学生传承了老师的本领,最终能够独自担当,去解决各类问题。
很多人存有担忧,认为 AI 日后会替代人类。DeepSeek 给出的回应是:AI 不会取代人类,正如望远镜不会取代天文学家一样。真正的危机在于:倘若 AI 能够 24 小时创作出莎士比亚风格的十四行诗,那么人类是否还愿意在深夜为自己的爱人撰写一首略显笨拙的情诗呢?
在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。