刚刚加入拟人化六个月的Openai,约翰·舒尔曼(John Schulman)很快就选择离开!
以前,舒尔曼在Openai工作了9年。
去年八月,他选择离开Openai并加入拟人化。
当时,在给他以前的同事的一封信中,他说,他选择这个选择的原因是“加深他对AI的关注,在职业生涯中开设新的篇章,并重返技术工作,可以由他自己完成。”
既然他刚刚加入了拟人化的半年,他突然选择离开。
拟人化:表示遗憾
人类首席科学官贾里德·卡普兰(Jared Kaplan)在一份声明中说:“我们为约翰的离开感到遗憾,但充分支持他寻求新的机会并祝他一切顺利。”
有人说舒尔曼的离开是对人类的打击。他不仅是加强学习的先驱,而且还是Chatgpt背后的核心发展建筑师。
2024年8月,当时的OpenAI“训练后”团队负责人约翰·舒尔曼(John Schulman)正式宣布他进入Twitter上的竞争对手人类。
当时,这个消息引起了巨大的震惊。
原因不仅是舒尔曼(Schulman)是Openai最受欢迎的技术领导者之一,导致该团队为Chatgpt的突破性结果做出了重要贡献。
他对离开的时间也非常敏感。当时,离开Openai的高管和其他高管(包括CTO MIRA MURATI)在内的高管也几乎同时离开了。
作为回应,山姆·奥特曼(Sam Altman)甚至庄严地使用“囊字母”来发布答复。
Chatgpt建筑师,PPO
舒尔曼(Schulman)和Openai在完成研究生学习后正式加入Openai。
到目前为止,他在Openai工作了9年。值得一提的是,这是舒尔曼(Schulman)除实习外唯一工作的公司。
以前,他负责对齐团队,然后他开始领导“训练后”团队,以微调在Chatgpt和Openai API中部署的模型。
约翰·舒尔曼(John Schulman)在加州理工学院的本科生学习物理学,然后去加州大学伯克利分校学习神经科学博士学位。
当时,他对人工智能也有些感兴趣,但是他没有像神经科学那样看到任何可以遵循的途径。
在他参与伯克利的实验室轮换项目之前,他与Pieter Abbeel合作开到了直升机和机器人技术上,并决定搬到EEC(电子工程和计算机科学)。
舒尔曼(Schulman)与Openai相关了很长时间。作为Chatgpt建筑师,他在2015年仍在学习博士学位时加入Openai,成为共同创始人之一。
在一次采访中,舒尔曼解释了为什么他加入Openai:
“我想对人工智能进行研究。我认为Openai具有非常雄心勃勃的任务,并致力于建立通用人工智能。”
“尽管谈论AGI似乎有点疯狂,但我认为开始思考它是合理的,我希望在一个地方谈论AGI是可以接受的。”
此外,根据Schulman的说法,Openai将人类反馈强化学习(RLHF)引入Chatgpt的想法可以追溯到2017年,当时Jan Leike和Dario Amodei发表的一篇论文以及其他人提到了这种方法。
纸张地址:
此外,在2017年,舒尔曼还提出了他在OpenAI任职期间与他的团队首次与团队的近端战略优化(PPO)算法,其变体PPO-CLIP成为OpenAI使用的主要算法。
纸张地址:
Openai安全团队致力于这项工作,因为他们希望该模型适合人类的偏好,真正倾听人类的意见,并尝试做人类想做的事情。
在GPT-3培训时,舒尔曼看到了整个研究方向的潜力,并决定加入趋势。
在许多访谈中,舒尔曼对人工智能的下一个尖端领域表达了他的看法:当AI不断改善更艰巨的任务时,人类应该做什么?在哪些任务中,人类可以在大型模型的帮助下具有更大的影响力并做更多的工作。
此外,舒尔曼(Schulman)在其个人博客上发表的《机器学习研究指南指南》最初是为2017年的OpenAI研究员编写的。充满了实用信息,值得一看。
文章地址:
参考: