机器之心报道
机器之心编辑部
一家高校的实验室,能走出多少位知名 AI 初创公司的创始人呢?
强化学习领域的大牛、UC 伯克利的教授 Pieter Abbeel 进行了一番简单的统计:在我带过的学生当中,大概只有 12 个。
这些公司都颇具名气,其中有 OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection 等。相信你对它们都有所耳闻。
刚刚,Pieter Abbeel 通过一句话和一张配图,低调地对他引以为傲的学生们进行了宣传:那些获得博士学位的创始人,曾在伯克利实验室度过了一段美好的时光,如今他们开始了创业之路;那些从事博士后研究的创始人,也曾在伯克利实验室度过了一段美好的时光,现在他们也开始了创业之路。
Pieter Abbeel 是一位教授,他在加州大学伯克利分校的电气工程与计算机科学系任职。他还是伯克利机器人学习实验室的主任,以及伯克利人工智能研究实验室的联合主任。
在人工智能和机器人领域有很高声誉的专家 Pieter Abbeel ,他的研究成果给学术界带来了深远的影响。同时,他所教导出来的学生在各个不同的领域都取得了非常卓越的成就。
下面我们来盘点一下,Abbeel 所说的这些优秀学生们。这些学生们后面跟着他们的企业名以及当前的估值。
John Schulman-OpenAl (350B)
John Schulman 是一位著名的科学家,在人工智能领域有重要贡献,尤其在强化学习和大语言模型方面。
2015 年 12 月,Schulman 与奥特曼等人一起创立了 OpenAI,并且在其中扮演着重要角色。他在 OpenAI 负责领导强化学习团队,参与了 GPT 的创建。从 2022 年到 2024 年,他共同领导了后训练团队。2024 年 8 月,Schulman 从 OpenAI 离职。
Schulman 从 OpenAI 离职后,投身到了竞争对手 Anthropic 当中,并且将精力集中在 AI 对齐研究上。可是,他在 Anthropic 仅仅工作了半年的时间,在 2025 年 2 月又一次辞去了职务。
今年 2 月,Schulman 成为了一家初创公司的联合创始人兼首席科学家,这家公司是 Thinking Machines Lab。Thinking Machines Lab 是一家从事人工智能研究和产品开发的公司。CEO 是 OpenAI 的前 CTO Mira Murati,她在 OpenAI 曾负责过研究方面的工作,也负责过产品方面的工作,还负责过安全方面的工作。
谷歌学术页面显示,John Schulman 的学术引用总数已达 10 万多。在这些引用中,引用量最高的研究是他所创造的 PPO 算法《Proximal policy optimization algorithms》。
他在加州大学伯克利分校取得了计算机科学的博士学位,其导师是该校的教授、深度强化学习领域的大牛 Pieter Abbeel。接着,他从事了机器人以及强化学习方面的研究与工作。在这之前,他曾在伯克利有过短暂的神经科学学习经历,并且在加州理工学院学习过物理学。
Aravind Srinivas 拥有 Perplexity(15B)。
Aravind Srinivas 是一位计算机科学家且为印度裔美国人,同时也是一位企业家。他因联合创办了 AI 初创公司 Perplexity AI 而受到广泛的关注。
2018 年,他在 OpenAI 进行实习工作。同时,他参与到强化学习项目的开发当中。并且,他的导师是 John Schulman。
2022 年,Srinivas 与 Denis Yarats 以及 Johnny Ho 等一起创立了 Perplexity AI ,他担任首席执行官。Perplexity AI 致力于构建世界上最值得信赖的问答引擎,其核心产品是一个基于大型语言模型的聊天机器人,能够给出准确的答案和信息来源。
Aravind Srinivas 拥有丰富的工作经历。他曾在谷歌 DeepMind 公司工作过。他也在 OpenAI 等明星公司工作过。
Aravind Srinivas 在印度理工学院马德拉斯分校完成了硕士学位,其专业是电气工程,并且专注于迁移学习以及强化学习的研究。接着,他去到加州大学伯克利分校继续深造,在那里获得了计算机科学的博士学位,其研究方向涵盖了高效深度学习的训练方法以及计算机视觉。
Deepak Pathak-Skild (4B)
Skild AI 是一家初创公司,专注于机器人技术和人工智能应用。它于 2023 年 5 月成立,由 Deepak Pathak 和 Abhinav Gupta 创立。该公司致力于构建通用机器人智能。
Skild AI 开发了一款名为 Skild Brain 的可扩展机器人基础模型,此模型成为各类机器人在不同场景和任务中的通用大脑。该模型能够适配不同的硬件平台与环境,涵盖从建筑工地到工厂,以及家庭等诸多场景。去年 7 月,Skild AI 完成了 3 亿美元的 A 轮融资,其估值达到了 15 亿美元。2025 年 1 月有消息传出。软银正在进行谈判。软银准备向 Skild AI 投资 5 亿美元。Skild AI 的估值约为 40 亿美元。
我们回到 Deepak Pathak 自身。Deepak Pathak 博士毕业于加州大学伯克利分校,其导师是 Alyosha Efros 教授和 Trevor Darrell 教授。他主要将精力集中在计算机视觉、机器学习以及机器人技术的交叉领域进行研究。
Deepak Pathak 之前在 meta AI 研究部门担任了一年的研究员。同时,他还在加州大学伯克利分校以访问博士后的身份与 Pieter Abbeel 进行了合作。
Chelsea Finn 和 Sergey Levine 共同参与了(2.4B)相关的工作。Chelsea Finn 参与其中,Sergey Levine 也参与其中,共同面对(2.4B)的情况。Chelsea Finn 在(2.4B)领域有其贡献,Sergey Levine 同样在(2.4B)领域有其贡献。
Physical Intelligence 是一家美国初创公司,它专注于开发基础模型和学习算法,目标是为当今的机器人以及未来的物理驱动设备提供动力。 这家公司简称 PI 或 π。
Chelsea Finn 是斯坦福大学的一位助理教授,其专业为计算机科学和电气工程。同时,他还是 Pl 的联合创始人。
Chelsea Finn 之前在加州大学伯克利分校取得了计算机科学博士学位,同时在麻省理工学院拿到了电气工程和计算机科学学士学位。并且她还曾有过在谷歌大脑团队工作的经历。
Sergey Levine 被视作强化学习领域的重要领军人物之一,其谷歌学术的引用量已超过 17 万。他还是 PI 的联合创办人。
Sergey Levine 目前是加州大学伯克利分校电气工程与计算机科学系的副教授。他专注于一些算法,这些算法能够让自主智能体通过学习来获得复杂行为。尤其专注于能够让任何自主系统学习并解决任何任务的通用方法。这类方法的应用涵盖了机器人技术,以及其他需要自主决策的领域。
Sergey Levine 在 2009 年取得了斯坦福大学的硕士学位。2014 年,他获得了斯坦福大学的博士学位。2016 年,他加入了加州大学伯克利分校的电气工程与计算机科学系。他的研究涵盖了自动驾驶、机器人、计算机视觉以及图形学。他的研究包含开发深度强化学习算法。
Roshan Rao 处于进化规模(估计为 x00M)。
Roshan Rao 是 EvolutionaryScale 的联合创始人之一,同时也是该公司的研究科学家。他致力于对蛋白质的进化模型进行研究。在此之前,他曾在 meta AI 工作。他还在加州大学伯克利分校获得了博士学位,其导师是 John Canny 和 Pieter Abbeel。
EvolutionaryScale 是一家不以盈利为目的的公司。其使命在于通过与科学界展开合作,并且开展开放、安全且负责任的研究,开发人工智能,以理解生物学,从而为人类健康和社会带来福祉。自诞生之后,ESM 项目始终致力于通过代码与模型的发布来推动科学的开放性,并且该团队承诺会持续坚守这一理念。该公司于 2023 年 7 月成立。它已经完成了 1.42 亿美元的种子轮融资。并且已经与亚马逊(Amazon)公司以及英伟达(NVIDIA)公司达成了合作。
2024 年夏天,EvolutionaryScale 推出了 ESM3。ESM3 是一款面向蛋白质语言的大模型。它成功在自然进化未曾涉足的区域设计出了功能性蛋白。同期,该研究的预印版本上线了。
该研究在 2025 年 1 月 16 日于《Science》发布,其题目为「Simulating 500 million years of evolution with a language model」,时间间隔为半年。
Aditya Grover 所研发的 Inception Al (x00M est.) 。
Aditya Grover 是加州大学洛杉矶分校的一位计算机科学助理教授。他领导着机器智能(MINT)小组。该小组致力于开发能够在有限监督下进行交互和推理的人工智能系统。
他在加入 UCLA 之前,曾有过这样的经历:在 FAIR 担任研究科学家,同时也在 meta 的核心机器学习团队担任研究科学家。他此前在加州大学伯克利分校度过了博士后生涯,其导师是 Pieter Abbeel;在斯坦福大学完成了博士学位,导师是 Stefano Ermon,Stefano Ermon 是扩散模型的发明者之一;在印度理工学院德里分校完成了学士学位,联合导师是 Mausam 和 Parag Singla。
Stefano Ermon 是 Aditya Grover 博士期间的导师,他在去年夏天创立了 Inception,并且邀请了 Aditya Grover 以及康奈尔大学教授 Volodymyr Kuleshov 共同领导该公司。
不久前,Inception 发布了首个商业级的扩散大型语言模型(dLLM)Mercury,它在英伟达 H100 上能够以每秒超过 1000 token 的速度进行运行,其性能与现有的经过速度优化的 LLM 不相上下。Inception 从 MidJourney 和 Sora 等图像和视频生成系统中获得灵感,为 Mercury 引入了一种新的语言生成方式。这种新方法与现有的 LLM 相比,运行效率明显更高,速度更快且成本更低,还能将推理成本降低 10 倍。
Peter Chen、Rocky Duan 和 Tianhao Zhang 共同参与(625M)。
左一至左四:陈曦、Pieter Abbeel、段岩、张天浩
Covariant 是一家人工智能与机器人公司,位于美国湾区。它致力于构建先进的人工智能模型,让机器人具备观察、推理以及应对周围世界的能力,以此来支持多种不同的仓库自动化任务。
公司于 2017 年成立,最初名为 Embodied Intelligence。它是由 Pieter Abbeel、Peter Chen(陈曦)、Rocky Duan(段岩)以及 Tianhao Zhang(张天浩)共同创立的。段岩担任首席技术官。
2008 年起,Abbeel 担任加州大学伯克利分校机器人学习实验室主任,并且是该校教授。他的三位创始人都是他在这所大学的学生。Pieter Abbeel 与陈曦、段岩曾在 OpenAI 担任研究员,当时 OpenAI 解散了机器人团队。张天浩曾是微软研究员。
两位创始人基于实验室的研究,花费两年多时间设计出了 Covariant Brain。它是一款由人工智能驱动的软件,能够为机械臂提供动力,让机械臂在仓库中执行劳动。2018 年,该公司开始收集全球仓库中 30 种机械臂的数据,这些机械臂都依靠 Covariant Brain 运行。该公司之后建立了一个数据库,这个数据库包含着数十亿个现实世界机器人的信息。
2024 年 9 月,亚马逊宣布聘用 Pieter Abbeel、Peter Chen 以及 Rocky Duan 等约四分之一的 Covariant 员工。此举旨在帮助推动 Covariant 技术在亚马逊运营中的开发与实施。同时,亚马逊还签署了使用 Covariant 机器人基础模型的非独家许可。
Misha Laskin 的反思,其数值为 555M 。
Misha Laskin 在左边,Ioannis Antonoglou 在右边。
Misha Laskin 在 2022 年到 2024 年期间担任 Google DeepMind 的研究科学家。在此之前,他在加州大学伯克利分校从事博士后工作。他是芝加哥大学的理论物理学博士。他曾参与开发谷歌 Gemini 大语言模型系列的训练工作流程。
他不久前宣布成立了一家公司,名为 Reflection AI。这家公司的目的是开发超级智能。该公司一亮相,就宣布获得了 1.3 亿美元的融资,其估值更是高达 5.55 亿美元。
Misha 担任 CEO,公司的联合创始人 Ioannis 是谷歌 DeepMind 的创始工程师,他是 AlphaGo 的幕后功臣,并且从事了 Gemini 的训练后系统工作。其他团队成员均为曾在 DeepMind、OpenAI 以及其他前沿实验室发挥重要作用的人员。他们有的是研究人员,有的是工程师。这些成员参与构建了过去十年间一些最为先进的人工智能系统,其中包括 AlphaGo 和 Gemini 等。
Reflection 的愿景是构建超级智能代理,以执行所有的知识工作。这一愿景建立在两个核心信念之上。
1. 自主编码是迈向超级智能的关键一步。
现实世界的评估是最重要的,而不是仅仅局限于基准。
Jonathan Ho-ldeogram,其市值约为 500M。
Jonathan Ho 在 2020 年获得博士学位。他曾与 Ajay Jain 以及 Pieter Abbeel 一起提出了去噪扩散概率模型(Denoising diffusion probabilistic models,DDRM)。
他曾在谷歌担任过研究科学家。2022 年 12 月,他共同创立了 Ideogram 。Ideogram 开发文本生成图像模型。该公司利用深度学习技术,能将自然语言描述(也就是提示词)转化为数字图像。Ideogram 与其他文本生成图像模型有所不同,它的独特之处在于能在生成的图像里准确呈现可读的文字内容,正因如此,它在创建包含文本元素的图像,像标志、海报等方面表现得很出色。
2024 年 8 月,公司发布了 Ideogram 2.0 模型。此模型提供了多种风格,包括现实主义、设计、3D 和动漫等。并且进一步提升了在图像中生成文本的能力。
Ideogram 自创立起,完成了多轮融资。其中在 2023 年 8 月进行了 1650 万美元的种子轮融资,此轮融资由 a16z 和 Index Ventures 担任领投方;并且在 Ideogram 1.0 发布之后,还获得了由顶尖风险投资公司 a16z 领投的 8000 万美元 A 轮融资。
Ajay Jain-Genmo
2023 年,Ajay Jain 获得了博士学位。在博士学习阶段,他的研究涵盖了机器学习领域,其中特别涉及深度生成模型和表示学习。同时,他也对计算机系统进行了研究,学习了强化学习、无监督学习、计算机视觉、自然语言处理(NLP)、优化以及近似算法和系统等方面的知识。
他创建了 DDPM 和 DreamFusion。他们的工作为诸多现代扩散模型奠定了基础,这些模型包括 Stable Diffusion 和 DALL-E 2。
他曾在 Google Brain 任职,构建出了首个文本到 3D 的生成模型。2022 年 12 月,他与他人一同创立了 Genmo AI 并担任其首席技术官,Genmo AI 是一家专门致力于视频生成的 AI 公司。
尤其在遵循用户详细指令方面表现良好。
Ariun Singh-Gradescope
Arjun Singh 于 2016 年博士毕业。
2014 年,Arjun Singh 创立了 Gradescope。Pieter Abbeel 也参与了创立。Sergey Karayev(另一位博士)同样参与了创立。Gradescope 是一款利用人工智能辅助教师评分的工具。
图源显示:从左到右的顺序分别是 Gradescope 的联合创始人 Pieter Abbeel、Arjun Singh 以及 Sergey Karayev。
Crunchbase 的信息显示,Gradescope 完成了多轮融资。这些投资方包含 Khosla Ventures、Reach Capital 以及 Gradient Ventures 等知名机构。然而,具体的融资金额以及轮次并未被公开披露出来。
2018 年这一年值得注意,Gradescope 被 Turnitin 所收购。之后,Gradescope 持续作为 Turnitin 旗下的产品而进行运营,其致力于给教育工作者提供高效的批改以及反馈工具。
Philipp Wu 和 Fred Shentu 处于隐身状态。
Philipp Wu 目前是 Pieter Abbeel 的博士生,时间范围是 2021 年 8 月至 2026 年 5 月。他的研究兴趣聚焦于现实世界的通用机器人,其研究涵盖了强化学习、无监督学习与机器人技术的交叉融合领域。
他在 Pieter Abbeel 负责的机器人学习实验室工作。他的工作内容有创建低成本的机械臂,这只机械臂对人类安全且有 7 自由度,被称作“Blue”。其应用包含辅助家庭护理、进行深度强化学习、实施模仿学习以及进行抓取。他研发了一个机器人动力学模型,同时还研发了一个机器人运动学模型。并且,他研发了一个名为“Gazebo”的模拟器,用于测试控制算法。此外还有其他一些相关研发。
Yide(Fred)Shentu 目前是 Pieter Abbeel 的博士生。他本科阶段也在加州大学伯克利分校就读。他的主修专业有物理,还有数学和计算机科学。本科期间,他在 BAIR(伯克利人工智能研究实验室)担任过研究助理。本科毕业后,他曾在机器人公司 Covariant AI 担任过创始工程师这一职务。本科毕业后,他还曾在机器人公司 Covariant AI 担任过研究科学家这一职务。
目前,关于 stealth 的信息不多。