“如果说长文本是《月之暗面》登陆月球的第一步,那么提升模型的深度推理能力就是第二步。” 11月16日是月之暗面Kimi Chat面向全社会开放一周年。值此之际,月之暗面创始人杨志林接受了澎湃科技等媒体采访。他认为,下一步发展AI产品包括AI技术的重要能力应该是更深入的推理能力,能够把短环节的简单问答变成更长环节的组合任务操作。
据报道,月之暗面将在未来一两周内推出新一代数学推理模型 k0-math,对标 OpenAI o1 系列的两个公开模型:o1-mini 和 o1-preview。目前,在中考、高考、考研、MATH(包括入门竞赛题)四项数学基准测试中,k0-math初始模型的成绩超过了o1-mini和o1-preview OpenAI o1 系列的型号。在两个难度较大的竞赛级数学题库OMNI-MATH和AIME基准测试中,k0-math初始模型的表现分别达到了o1-mini最高分的90%和83%。
杨志林表示,数学产品是AI最适合锻炼思维能力的场景,数学模型在教育产品中也具有很大的价值。
自两年前ChatGPT发布以来,通过添加更多数据和计算能力来“扩展”当前模型来不断改进模型的能力,即所谓的Scalinglaw,几乎已经成为业界共识。不过,OpenAI前首席科学家Ilya Sutskever公开表示,扩大预训练的结果已经达到了平台期。 “2010年代是规模扩张的时代,现在人们又回到了好奇和发现的时代。 。每个人都在寻找下一个目标。”
在杨志林看来,人工智能的发展就像摇摆,在两种状态之间来回切换。 “一是算法和数据都准备好了,但算力还不够。”他认为,从Transformer架构的诞生到GPT4,似乎更多的矛盾在于如何扩展规模(Scale),而算法和数据并没有本质的问题。但今天,当规模达到一定程度时,你会发现增加更多的计算能力可能并不能解决问题。核心问题是缺乏高质量的数据。这时需要做的就是改变算法,突破瓶颈。现在这是他的公司和整个行业面临的共同问题。 “好的算法可以释放 Scaling 的潜力,让模型不断变得更好。”他认为强化学习是下一个重要的趋势。
但杨志林也认为,目前预训练还是有空间的,“对于半代到一代的车型,这个空间明年就会释放出来。明年,我认为领先的车型会在预训练方面做到极致。” - 培训,但明年最重要的事情会加强学习,但仍然是规模,只是方式不同。”
针对近期国内一些AI创业公司被收购、人才回流大厂商的现象,杨志林表示,这是必然规律,表明行业发展到了新阶段。 “一开始很多公司都在做,但现在只有几家公司了。”当我们继续做的时候,我们接下来做的事情可能会逐渐变得不一样。我想这是一个必然的规律。 ”
杨智霖还透露,从今年上半年开始,月之暗面开始减少业务,专注于Kimi。 “一开始我们确实尝试过把几种产品放在一起做,但后来发现我们还是要专注于把一种产品做到最好。”最重要的是,削减业务本质上是为了控制人数。我们不希望人数增长太快。我们始终将卡与人的比例保持在最高水平。团队的扩大对于创新来说也是致命的。 “目前,《月之暗面》的核心任务是提高用户留存率。
月之暗面成立于2023年4月,法定代表人杨志林毕业于清华大学。据了解,该公司打造的对话式AI助手产品Kimi上线一年以来,月活用户已达3600万。