编辑部 发自 凹非寺
量子位 | 公众号 QbitAI
2025 年,大模型迎来应用爆发的这一年。在越来越多的垂直行业里,开始不断有 AI 落地的经典实践案例涌现出来。
教育领域中,专注于职业教育培训的粉笔,就是其中之一。
就在第三届AIGC产业峰会现场,粉笔CTO陈建华坦言:
这种可能性正在粉笔的亲身实践里,并且逐渐成为能够被量化观察的实例。
为了完整呈现陈建华的思考,在不改变原意的情况下,量子位对演讲内容进行了编辑和整理,希望能给你带来更多的启发。
中国 AIGC 产业峰会由量子位主办,属于 AI 领域的前沿峰会。有 20 余位产业代表参与会议并进行讨论。线下参会的观众超过千人,线上直播的观众达到 320 万多,累计曝光量为 2000 万多。
话题要点
以下为陈建华演讲全文:
学习的本质
大家下午好。很高兴来到量子位 AIGC 产业大会。我要在这里分享我们在 AI 赋能教育领域探索和实践的经验。在座的有些朋友可能对粉笔还不是很熟悉,那我先简单地做一个介绍。
粉笔在 2015 年成立。它是一家专注于职业考试培训的互联网教育公司。其核心业务主要涵盖公务员、事业单位、教师、考编、考证类培训。通过持续进行产品创新和技术探索,构建了“教、学、练、测、评”一体化学习闭环。并且推出了题库、模考、课程、直播、社区、招考等多个深受用户欢迎的功能模块。
在 AI 嵌入落地之前,我们想要简单地谈谈我们对于教育本质的看法。
我们把整个学习的过程分成了四个阶段:
第一个阶段为感知阶段。此阶段实际上是对概念进行死记硬背的过程,在这个阶段会对知识产生初步的理解。
第二个阶段是理解阶段。在这个阶段,开始真正地去理解知识和概念的本质以及内在逻辑,而不是仅仅停留在表面记忆上。
第三个阶段是实践阶段。在这个阶段,要利用已经理解的知识去解决实际的问题。同时,通过不断地进行实践,能够加深对知识的理解。
首先是创造阶段。在这个阶段,随着持续的实践以及不断加深的理解,我们会逐渐构建起属于自己的知识体系。也就是在这个时候,知识才能够转变为自己的知识。
从阶段划分来看,学习是一个循环过程,不断从输入到输出,然后又不断重构输入,它不是一下子就能完成的。
因此,大模型落地教育,我们认为有4个特点。
第一是聚焦学会,而不是只关注答案正确。
在教育领域中,无论是听课还是做题,都仅仅是一个过程。其目标都是为了能够学会相关知识,之后能够在其他地方更出色地做题或者解决问题。
第二点是学习的主动性面临着巨大的挑战。大家都明白学习是很违背人性的,需要战胜自身的惰性以及心理上的障碍,而激发学习的主动性是一项极具挑战性的工作。
第三,所有的培训教育都具备一套教研体系。这套体系能确保培训内容具有科学性,能确保培训内容具有系统性,也能确保培训内容具有有效性。
教育是非常严肃的场景,对准确率要求极高,这最后一点需要额外强调。
教育领域里面有一个“不可能三角”:大规模、高质量、个性化。
三者较难同时具备。例如,大班课做到了规模大且质量高,不过却以牺牲个性化为代价;一对一满足了个性化与高质量的要求,然而却难以在大规模上得以应用。
大模型的出现打破了这个不可能的三角,使这个不可能三角变成了可能。
大模型教育应用的三个阶段
粉笔探索大模型在教育领域的应用分成了三个阶段。
2023 年是第一个阶段,主要聚焦的内容有三个关键词,分别是内部、有限制以及小场景。
我们最初开始尝试解题,那时模型的能力较为有限,导致正确率较低。我们尝试借助大模型进行解析,发现其解析结果可能与我们的教研体系不太相符。然而,在一些偏主观类的场景中,当给出点评框架后,大模型的效果依然非常好。
这个阶段我们认识到,大模型若要在教育场景中得以落地,其推理能力就必须不断提升,而结构化引导是极为重要的。
2024 年 7 月份,我们正式推出了粉笔 AI 老师。这一举措标志着我们从单点场景开始,逐步走向系统化多场景的融合。
粉笔 AI 老师主要将注意力集中在答疑和辅导的场景方面。它支持十大核心场景,同时还支持上百种细分场景。
AI 老师的主要实现方案包含 RAG 和垂域模型。当用户提问后,首先会进行识别操作。接着,利用 RAG 系统来获取与提问场景相对应的数据。最后,通过垂域模型生成与之对应的回答。
教育属于严肃场景,对准确率有较高要求,所以我们在大模型落地时需尽量减少幻觉的出现。凭借我们所积累的高质量知识库数据以及对场景和需求的洞察,利用 RAG 系统能够大幅降低幻觉。
另外,业界对垂域模型存在较大争议。从我们的角度来讲,垂域模型的开发是很有必要的。职业教育的考试有其自身一套全面结构化且具有特色的考察体系。凭借我们独有的高质量数据,以及教员在教学方法和教学经验方面的积累,还有我们对用户学习行为的洞察,开发垂域模型能够让我们用更小的模型、更低的成本,达成更好的效果。
我们的垂域模型在题目答疑的核心场景里,其评分比通用模型经过优化之后要高 0.2 分以上。尤其在言语科目、判断推理科目以及常识科目等方面,它的表现会更好一些。
在我们对AI老师的探索中,也有一些收获:
第一,提问的门槛实际上是比较高的。AI 老师具备了极为良好的辅导和答疑能力,然而我们在实际使用过程中察觉到,用户主动提问的比例远远低于预期。
很多用户不懂得如何进行提问,甚至没有产生提问的意识,因此提问这件事本身就是需要被引导和训练的一种能力。
第二,在学习场景中,LUI(语言交互界面)的对话形式或许不是极为高效的交互模式。对于大多数用户而言,图形界面与对话相结合的混合交互才是更为恰当的方案,并且主动学习需要与被动学习进行深入的结合。
第三是学习方式呈现出高度的多样化。用户的学习行为存在很大的不规范性,个体差异极为显著。在学习时长、学习路径以及学习习惯等方面,都有着非常大的差别。
在经历了前两个阶段的积累之后,粉笔于 2025 年正式推出了 AI 系统班。它基于大模型、数字人以及 TTS 等语音技术,推出了在 AI 时代的全新产品,该产品与传统的系统班有所区别。AI 系统班是一个系统性的课程,整个学习流程由 AI 老师来驱动。
我们为AI系统班定义了四个特性:
一是个性化的学习方案。我们会基于对用户当前水平的精准评估,为每一个学员专门定制学习方案。同时,会随着用户在学习过程中的表现和反馈,持续进行动态优化,从而实现真正意义上的因材施教。
第二点是学习过程更具人文气息。我们不但提供学习任务,还为每一个学习步骤给予清晰的解释与引导,帮助学生去学习并理解为何这样学以及下一步该如何学。这种设计使得整个学习过程更有温度,让学员更能明确方向。
第三是启发式答疑。在答疑过程中,系统通过启发式的方式来引导学员进行思考,不会直接给出答案,这样做是为了促使学员主动去构建自己的知识体系,从而提升对知识理解的深度。与此同时,基于对答题过程中表达方式以及错误模式的综合分析,AI 能够智能地识别出用户的薄弱点,进而实现更具针对性的学习支持。
第四点,传统排课制教学模式与之不同,AI 系统班的灵活性和主动性更强。在大模型的支持下,学员能够依据自身的时间安排进行自由学习,不会被固定的时间表所束缚,切实做到以学生为中心的自驱式学习。
为了达成个性化学习体验这一目标,我们引入了记忆系统。此系统使得大模型既聪明又有记忆。它主要包含三个关键的组成部分:
用户行为记录和画像属于第一部分。通过对用户做题以及听课等各种行为进行记录,同时利用行为习惯和兴趣偏好等多维数据进行建模,由此构建出动态更新的用户画像,而这为个性化推荐和内容生成提供了一个基础。
第二部分为短期记忆,它会依据用户与 AI 老师的短期交互来响应用户的提问。
第三部分为长期记忆。在用户与 AI 老师长期交互期间,会不断抽取学员的核心信息并放入记忆仓,以此帮助系统对用户的学习风格和能力演进形成深度理解,进而制定中长期的学习策略和目标引导。
我们始终坚信,Context 的数量决定了个性化的程度。上下文信息是个性化的基础。只有在充分理解用户当前的状态、历史的轨迹以及学习目标的前提下,大模型才能够为每一个学员生成适合其需求的内容和路径,从而实现因人而异的智慧学习。
我们此前进行了探索,接下来展望未来。在大模型赋能教育领域的实践方面,主要将聚焦于以下两个关键方向:
第一个方向是多维度的个性化升级。
当前个性化主要聚焦于知识水平和学习行为。我们认为个性化的空间不局限于此。未来,我们将探索更多的个性化维度,如学习风格、认知偏好、情绪状态、学习动机等,以使每个学员都能获得更符合自身特质的学习体验。
第二个方向是三维一体的AI老师形态。
我们正在探索构建一种新的 AI 老师形态,这种形态更加立体且具有沉浸感。它融合了文字交互、语音沟通以及白板演示这三种能力,从而形成了可对话、可聆听、可演示的三位一体的 AI 老师形态。
这种多模态的交互方式,能够提升教学的实时性,能够提升教学的响应效率。它更贴近人类真实的教学场景。同时,也能更好地满足不同用户在不同场景下的学习需求,让理解变得更自然,让学习变得更高效。
我们持续深化个性化,构建出更具沉浸感与互动性的 AI 教师形态。我们希望推动教育从智能化迈向智慧化,从而真正实现以人为本的未来学习方式。谢谢大家。
— 完 —