发布信息

AI音频技术持续走红:NotebookLM团队负责人离职创业,AI播客功能引爆市场

作者:软荐小编      2024-12-05 16:02:41     188

AI音频的价值正在被不断探索。

12月3日,谷歌最受欢迎的大模产品NotebookLM团队负责人宣布辞职创业,引发关注。其背后的AI播客领域正在持续火爆。

NotebookLM最初是一款AI云笔记软件。让它脱颖而出的是今年10月推出的AI播客功能。只需一个链接或文档,就能在几分钟内将男女英语对话变成类似相声的对话,俗称“AI播客”。 AI大师Andrej Karpathy曾称赞NotebookLM“点亮了LLM的新交互范式”。

在不少网友看来,“NotebookLM是一款非常适合学习的AI应用”。

谷歌NotebookLM带火AI播客,人人可学口语、听课本内容__谷歌NotebookLM带火AI播客,人人可学口语、听课本内容

据 NotebookLM 团队负责人 Raiza Martin 介绍,到目前为止,NotebookLM 拥有数百万用户。

尽管NotebookLM团队离开去创业,但NotebookLM产品将继续在Google发挥作用。据techradar报道,NotebookLM很快就会集成到谷歌大型号Gemini手机中。

与此同时,AI播客也越来越受欢迎。语音AI初创公司ElevenLabs最近推出了类似NotebookLM的AI播客功能;在中国还有一个类似的应用程序,名为“PodLM”,可以将网址、文本或文档转换为中文播客。

可见,在文胜文、文胜图之后,AI音频领域已经火爆,这将极大方便内容创作者、营销者、教育者。对于传统音频平台来说,机遇与挑战并存。

对于教育领域,AI教育播客可以支持多样化的学习方式,提高学习效率;多语言人工智能播客将成为语言习得和练习的新方法;教科书内容也可以提炼成儿童播客。听。

谷歌NotebookLM带火AI播客,人人可学口语、听课本内容__谷歌NotebookLM带火AI播客,人人可学口语、听课本内容

(多智使用NotebookLM提取了本文的核心内容)

AI音频的价值不断被探索

12月3日,NotebookLM团队负责人Raiza Martin透露将辞职,引发热议。这背后是对AI音频领域的聚焦。

Raiza Martin 在她的社交媒体上发帖:

“在 Google 工作了 5.5 年之后,今天是我的最后一天。看到 NotebookLM 从一个想法发展成为为数百万人服务的产品,对我的领导来说是一次难忘的经历。

最棒的是,我在我的创业之旅中找到了联合创始人。 ”

谷歌NotebookLM带火AI播客,人人可学口语、听课本内容_谷歌NotebookLM带火AI播客,人人可学口语、听课本内容_

同样离开并与 Raiza Martin 一起创业的还有 NotebookLM 设计师 Jason Spielman 和核心工程师 Stephen Hughes。

Raiza Martin的新创业项目尚未公布,但根据她回应的信息,仍然与大型模特有关。

NotebookLM于2023年7月上线,最初是一款AI云笔记软件,可以根据用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接、等)、大纲、常见问题解答、学习指南等。

NotebookLM原本在AI笔记方面表现比较平庸。今年10月推出AI播客功能后开始流行。可用于将论文、书籍、故事等转换为AI短音频。

AI音频的价值正在不断被探索。

曾在 Tesla 和 OpenAI 工作、现在正在创办 AI 原生学校的 AI 大师 Andrej Karpathy 曾这样总结:NotebookLM 消除了人们享受大型模型的两大障碍。

首先,聊天有一个门槛。你还需要掌握一些与Chatbot聊天的技巧,并不断提出问题和质疑。

有了NotebookLM,在自动生成的播客中,自然会有一个人为你扮演提问和指导的角色,而用户只需要负责聆听即可。

其次,读书并不容易。听播客比阅读文本容易得多。

可以说,NotebookLM是除了ChatGPT之外的又一个AI范式。

人人都可以做AI播客的时代即将到来

目前,做AI音频的公司越来越多。可以说,人人都可以做AI播客的时代已经到来。

初创公司ElevenLabs被视为NotebookLM最大的竞争对手。

一周前,人工智能初创公司 ElevenLabs 推出了类似 NotebookLM 的功能,允许用户上传不同类型的内容来创建播客。

该功能称为 GenFM,可在该公司的 ElevenLabs Reader iOS 应用程序中使用。目前,GenFM支持32种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语等。

要使用 GenFM,用户首先上传 YouTube 视频、文本或文档。然后,应用程序可以自动选择两种声音来创建播客。该公司指出,有十多种声音可供选择。

值得注意的是,当应用程序准备GenFM生成的播客时,用户还可以添加一些“嗯”和“啊”等情态词,甚至添加笑声和呼吸等元素来强调真实人类对话的状态。

_谷歌NotebookLM带火AI播客,人人可学口语、听课本内容_谷歌NotebookLM带火AI播客,人人可学口语、听课本内容

ElevenLabs成立于2022年,核心团队主要包括谷歌、微软、亚马逊等知名科技公司的前员工。他们在人工智能领域拥有深厚的专业知识和实践经验。该公司目前在世界各地拥有约 40 名远程员工,并计划到 2025 年底将团队规模扩大到 100 人。

2024年1月,ElevenLabs在最新一轮融资中成功筹集8000万美元,估值飙升至11亿美元,正式跻身独角兽行列,并入选福布斯AI 50强。ElevenLab的投资者包括Andreessen Horowitz、Nat弗里德曼、丹尼尔·格罗斯、红杉资本、Smash Capital、SV Angel、BroadLight Capital 和 Credo Ventures。

在中国,还有一个AI播客生成平台——PodLM.ai,可以将文本、文档或网站内容转换为播客音频。其官方网站称其是“NotebookLM 的替代品”。据了解,它是由独立开发商idoubi开发的。目前还处于比较早期的阶段,使用起来还不太流畅,但是优点是支持中文。

谷歌NotebookLM带火AI播客,人人可学口语、听课本内容__谷歌NotebookLM带火AI播客,人人可学口语、听课本内容

开启了“听”的新境界。

本文来自微信公众号,作者:王尚,36氪经授权发布。

相关内容 查看全部