发布信息

谷歌官方宣布 Keras 之父 François Chollet 正式离职,回顾其在谷歌的 9 年零 3 个月

作者:软荐小编      2024-11-15 16:02:29     145

金磊来自奥飞寺

量子比特 |公众号QbitAI

刚刚,谷歌官方宣布了一个重磅消息:

凯拉斯之父弗朗索瓦·乔莱正式辞职。

谷歌员工离职率__谷歌跳槽

这篇文章由谷歌两位VP(其中包括谷歌新聘的华人比尔·贾)共同撰写,表达了对这位在谷歌工作了9年零3个月的AI大佬的工作和辞职的认可。后悔。

从内容上来看,谷歌首先肯定了深度学习框架Keras目前所取得的成就——

它已成为人工智能发展的基石,拥有超过200万用户,简化了复杂的工作流程,让尖端技术触手可及。

而且这项技术已经被广泛应用,从 Waymo 的自动驾驶到 YouTube、Netflix 和 Spotify 的推荐。

不过,虽然 François 已经辞职,但他承诺将继续参与 Keras 未来的开发,并将继续支持 JAX、TensorFlow 和 PyTorch 的工作。

Google 的 Keras 团队将继续与 François 的开源社区合作。

谷歌跳槽__谷歌员工离职率

至于弗朗索瓦的最新动向,谷歌和他本人目前尚未透露。

网友们对弗朗索瓦的辞职展开了热烈讨论。

例如,从 Keras 目前的发展状况来看,有人认为它在 Google 已经不再流行了:

我在某处读到过,未来 TensorFlow 可能不会积极开发,Google 内部会转向 JAX; TensorFlow 几乎输给了 PyTorch。

谷歌跳槽_谷歌员工离职率_

对于Google在官宣中对Keras的评价,有网友表示:

2018 年,情况确实如此;但现在,PyTorch 比 TensorFlow 更受欢迎,很大一部分原因与 LLM 有关。

_谷歌跳槽_谷歌员工离职率

从弗朗索瓦的个人动向来看,有网友猜测他可能是被Anthropic挖角了……

谷歌员工离职率__谷歌跳槽

Keras:专为人类设计的深度学习

Keras 的历史可以追溯到 2015 年,是 François 发布的开源神经网络库。

其最初目的是提供高级深度学习API,以简化深度学习模型的构建和实验过程。

因为在Keras出现之前,深度学习开发通常需要直接使用底层库(如Theano),用户需要编写大量复杂的代码来构建基本的神经网络模型。

Keras的出现可以说改变了这种状况。

它通过模块化和直观的API极大地简化了深度学习的构建过程,大大降低了进入深度学习领域的门槛。

正如它的官方定位一样:

专为人类设计的深度学习。

谷歌员工离职率_谷歌跳槽_

Keras 最初是一个独立于特定计算引擎的高级库,支持 Theano、Microsoft CNTK 和 TensorFlow 作为其底层后端。

技术上,Keras采用模块化设计,用户可以通过组合不同类型的层(如全连接层、卷积层、循环层)来快速构建复杂的模型。

模型的训练、验证和测试过程都是通过统一的接口实现的,开发过程可以说非常顺利。

Keras 为线性堆叠模型层提供了 Sequential API,后来又引入了Functional API 以支持构建复杂的非线性网络结构和多输入多输出模型。

这些特性使得Keras不仅适合简单的原型设计,也能够应对实际生产中的复杂需求。

谷歌跳槽__谷歌员工离职率

但随着TensorFlow的快速发展,两者之间的关系也越来越密切。

到 2017 年,Keras 被 Google 选为 TensorFlow 的官方高级 API。

2019 年 TensorFlow 2.0 发布后,Keras 完全集成到 TensorFlow 中,并成为其默认的模型构建工具。

这标志着 Keras 从独立的高级库转变为 TensorFlow 的一部分。

这样做肯定有好处。

首先,Keras可以无缝调用TensorFlow的底层函数,提供更高的性能和可扩展性。

其次,TensorFlow提供了GPU加速、TPU支持、分布式训练等高性能特性,集成的Keras也可以轻松利用这些特性。

这一改造不仅增强了Keras的功能,也使其更适合生产环境中的大规模应用。

_谷歌员工离职率_谷歌跳槽

但随着集成的推进,Keras 作为独立库的作用逐渐淡化,tf.keras 成为 TensorFlow 的官方高层 API 和深度学习社区的标准选择之一。

此外,作为深度学习框架演进的缩影,TensorFlow和PyTorch之间的竞争也在一定程度上影响了Keras的发展。

PyTorch 由 Facebook AI Research 于 2016 年推出。

它的核心优势在于动态计算图,可以让代码执行更加灵活。开发人员可以像编写普通Python代码一样构建和调试模型。

相比之下,早期的TensorFlow使用的是静态计算图(Static Computational Graph)。虽然其执行效率更高,但在模型开发阶段的灵活性和调试便利性方面不如PyTorch。

这种技术差异使得 PyTorch 在研究人员中特别受欢迎,特别是对于实验和快速迭代等工作。

为了缩小与 PyTorch 的灵活性差距,TensorFlow 2.0 引入了类似的动态图函数,通过 Eager Execution 和 tf.function 提供更灵活的开发体验。

这种演变使 TensorFlow 能够保持 PyTorch 式的开发灵活性,同时保持高性能优化。

但此举似乎并没有完全缩小与 PyTorch 的用户体验差距。

谷歌员工离职率__谷歌跳槽

当然,Keras也在不断迭代和优化。

例如,去年年底,Keras 发布了 3.0 版本,被誉为机器学习的游戏规则改变者。

它不仅支持TensorFlow、PyTorch、Jax三大框架作为后端,还可以在它们之间无缝切换,甚至混合使用。

弗朗索瓦当时在他的社交账户上概述了这样做的四大好处,包括:

谷歌跳槽__谷歌员工离职率

但即便如此,Cohere 机器学习总监 Nils Reimers 也向 Keras 敲响了警钟:

希望历史不要重演。

Reimers 认为,Keras 最初是从支持单一后端(Theano)开始的,后来逐渐添加了 Tensorflow、MXNet 和 CNTK 等多个后端。

这引发了一系列问题:

随着时间的推移,这些问题变得越来越严重:有些模块只能在 Theano 上运行良好,有些模块只能在 Tensorflow 上运行,有些模块可以在 MXNet 上推断但无法训练......

我希望这次多后端表现更好,但这绝对仍然是一个挑战。

20世纪80年代出生的法国AI大师

说起Keras之父,François Chollet这个名字在AI圈子里可以说是家喻户晓的名字。

他出生于1989年10月20日,从简历来看,2012年获得巴黎综合理工学院工程硕士学位后,他没有选择继续深造,而是前往美国工作。

François 曾分别在 FreshPlanet 和 Thunder 担任软件工程师和机器学习架构师;最终于 2015 年加入 Google,至今仍留任。

谷歌跳槽_谷歌员工离职率_

在与国外知名采访博主Lex Fridman的交流中,François还回顾了Keras诞生的故事。

2014年,当时最流行的深度学习库是用C++编写的Caffe(贾扬清出品)。当时,Caffe 比 Theano 更流行。

到了年底,弗朗索瓦突然对循环神经网络产生了兴趣。

当时这还是一个比较小众的领域,所以他开始寻找合适的工具来探索。

在参加 Kaggle 比赛时,François 尝试了 Torch7 和 Theano 等工具,也使用了 Caffe,但当时 Caffe 并没有提供理想的循环神经网络解决方案,比如缺乏可重用的开源 LSTM 实现。

从那时起,François 就有了自己构建一个框架的想法。

他最初的想法是主要关注用 Python 编写的 LSTM 和 RNN 的实现。

在此期间一个非常重要的决定是模型将通过Python代码来定义。

这可以说与当时的主流思维相悖,因为像Caffe、Theano这样的库通常使用YAML等静态配置文件来定义模型。

但实际上,有些库使用代码来定义模型,例如 Torch7(但不是 Python)。

在François之前的工作实践中,scikit-learn这个开源深度学习库深得他的心,因此他从中获得了很多启发。

用他的话说,Keras 几乎就是神经网络的 scikit-learn。

_谷歌跳槽_谷歌员工离职率

有趣的是,Keras 这个名字是 François 在发布当天临时决定的。

而弗朗索瓦也坦言:

几个月后我加入了 Google,这实际上与 Keras 没有任何关系。

我加入了一个专注于图像分类和计算机视觉的研究团队,所以我在谷歌的最初工作主要是做计算机视觉研究。

当我刚加入 Google 时,我接触到了 TensorFlow 的早期内部版本,它吸引我的是它是 Theano 的改进版本。那一刻,我意识到我必须将 Keras 移植到这个新的 TensorFlow 上。

然后,就是 Keras 和 TensorFlow 集成的故事。

_谷歌员工离职率_谷歌跳槽

至于弗朗索瓦除了辞职之外的最后一次公开视频,则是一次采访。

在这次采访中,他表示打算用100万美元参与AGI竞赛。

至于原因,是因为他觉得现有的AI技术,尤其是LLM,主要依赖于记忆和模仿人类数据中的模式,在新情境下的新推理和技能习得方面表现不佳。

事实上,早在 2019 年,François 就提出了 ARC-AGI——衡量 AGI 能否有效获取新技能并解决开放式问题的唯一评估标准。

目前,最好的人工智能系统在 ARC 基准测试中得分为 34%,而包括儿童在内的人类轻松得分为 85%。

因此,ARC奖鼓励开源合作,以提高新想法的产生率,增加发现AGI的机会,并确保这些新想法得到广泛传播。

_谷歌跳槽_谷歌员工离职率

至于弗朗索瓦下一步的举动,量子位将持续关注。

参考链接:

[1]

[2]

[3]

[4]%C3%A7ois_Chollet

[5]

[6]

相关内容 查看全部