作者 徐丽思
鑫源
智东西网11月22日报道,今日,2024年度IDEA大会在深圳召开。本次由国家工程院外籍院士沉向阳发起的人工智能盛会,以粤港澳大湾区为窗口,深入探讨国家大模型计算等热点话题全球视角下的电力趋势、体现智能、AI+编程、人工智能科学和低空经济。
作为IDEA研究院创始主席,沉向阳发表了近三个小时的主题演讲,期间发布了IDEA研究院多项创新成果,包括通用视觉模型、营销创造模型、经济模型、运营决策等。制造模型、投资大模型、化工领域专家大模型、低空管理与服务操作系统等。在体现智能方面,IDEA研究院宣布与腾讯、美团、比亚迪等合作。
在人工智能的发展过程中,顺向阳认为,算力、算法和数据是最重要的。他直言,英伟达是近十年来人工智能行业最令人惊叹、最成功的公司。 “NVIDIA突然从做硬件、芯片的乙方转型为甲方,今天能拿到NVIDIA的卡,可以说是成功了一半。”
顺向阳现场透露,明天黄仁勋将前往香港科技大学接受荣誉博士学位,他现在计划与黄仁勋讨论一些关于技术、领导力和创业的故事,特别是关于计算能力发展并讨论未来十年。 2018年能否像过去十年那样实现百万倍的增长?
▲沉向阳现场宣布明天将与黄仁勋对话
他还强调,体现智能是下一个重大机遇。如今的多模态模型实际上并没有真正理解物理世界,而要走向世界模型,必须依靠机器人。机器人最终会走进千家万户,走进千家万户,这是一件令人兴奋的事情。
据了解,IDEA大会将于2021年首次举办,汇聚产学研企领袖,着力打造一个汇聚数字经济各方力量的国际化平台。它是粤港澳大湾区最具影响力的科技盛会之一。
1.“谈论卡片会伤害感情,但没有卡片就没有感情。”
“我最近一直在说的一句话是‘谈卡伤情,无卡则无情。’”沉向阳表示,人工智能要发展,需要大量高性能的支撑。显卡。您可以将其视为信用卡。 ,获得100张卡需要投资30至4000万元。
沉向阳表示,近年来,人工智能的蓬勃发展让整个行业充满期待。在其发展过程中,算力、算法、数据“三块”至关重要。
我们先看计算能力。计算行业过去四十、五十年,计算能力的不断提升是关键。英特尔提出的摩尔定律表明,计算能力每18个月就会翻一番。然而,随着人工智能尤其是深度学习的发展,对计算能力的需求更高。
沉向阳觉得英伟达已经成为人工智能领域最令人惊叹、最成功的公司。从硬件芯片制造商到行业龙头,出货量大幅增长,产品供不应求。比如2023年H100的出货量巨大,国内企业和美国的采购量就非常可观。马斯克还构建了一个包含 100,000 个 H100 卡的集群。
大型模型的发展是算力需求增长的重要原因。大型模型的参数数量从数百亿到数千亿甚至数万亿不等。随着模型变大,训练要求更高,数据量也需要增加。对计算能力的需求与参数成平方关系。
从增长倍数来看,如果一年增长十倍,十年后的增长倍数将是惊人的。从摩尔定律到黄定律,黄定律是基于模型训练的计算能力需求的概念。摩尔定律在18个月内翻倍,在十年内翻倍100倍,在一年内翻四倍,在十年内翻四倍。这解释了过去十年NVIDIA市值增长300倍的原因。
对于未来十年算力需求的增长情况,顺向阳表示,目前还不确定。不过明天,黄仁勋将前往香港科技大学接受荣誉博士学位。随后,双方将进行对话,讨论技术、领导力和创业故事。对了,他还会问他未来十年是否有100万。成倍增长。
在算法方面,顺向阳提到,自2017年Transformer架构出现以来,人工智能、深度学习和大模型基本都是走这条路线,通过数据堆和算力不断发展。 GPT-4之后,虽然GPT-5尚未推出,但OpenAI不断带来新的技术突破,例如多模态GPT-4o和新的推理学习能力o1。在算法领域,人们不断创造新的算法来实现突破,其中方法范式的转变尤其值得思考。
过去几个月,国内一些企业和初创企业在o1道路上取得了不错的进展。其算法的突破思路在于,之前大家关注的GPT系列主要是预训练,预测“下一个token”,通过数据的智能压缩快速给出答案。新范式的改变是增强学习,它更像人类的思维过程,有后训练、后推理的过程。
强化学习并不是什么新鲜事,很多人都用过,尤其是AlphaGo就是用这种方法下围棋的。现在它的新特点是它的玩法更加通用,不像以前,一套系统只能解决一个问题。就像o1不仅可以处理数据和编程,还涵盖物理、化学等多个领域。在算法方面,预计未来几年 SRL 将会取得惊人的发展。
关于数据,沉向阳提到,大模型的蓬勃发展不仅体现在参数大,还体现在数据量大。
以 GPT 为例。 GPT-3出现时使用的是2T数据。据说GPT-4用的是12T。持续训练后,使用了20T左右。这是目前互联网上可以获得的相对干净的数据量,大约是20万亿。 GPT-5 尚未发布。如果真是这样,他认为数据量很可能会达到200T。在互联网上很难找到这么多数据,因此需要合成数据来训练未来的模型。
顺向阳举了一个例子来说明1T数据的含义:大约相当于500万本书,20万张高清照片,或者500万篇论文。人类历史上的书籍总数约为21亿个代币,微博有38亿个代币,Facebook约有140T数据。然而,社交媒体上的数据质量并不高。一个人从小学到大学真正学到的知识大约是0.00018T。一个人在大学学习后所学到的知识相当于1000本书。
ChatGPT等人工智能主要利用互联网数据。互联网发展40年来,公众在网上发布了大量信息,可以说是为人工智能的训练做好了准备。此外,无论训练哪种语言的人工智能,底层的高质量数据大多是英语,人工智能时代英语的重要性可能会增加。
2、发布通用视觉大模型DINO-X,并与腾讯、美团、比亚迪进行实体智能合作
计算机视觉技术具有广泛的现实应用场景。但过去主流的小模型解决方案难以应对碎片化、多变的长尾需求,限制了技术落地的规模。
自2022年起,IDEA团队从目标检测开始,创建了DINO系列大型视觉模型,具有出色的准确性、通用性和泛化能力。本次大会发布了该系列最新的DINO-X通用视觉模型,具有真实物体级理解能力,实现开放世界目标检测。无需用户提示即可直接检测所有内容。
同时,IDEA团队还推出了行业平台架构。通过庞大的模型库,结合通用识别技术,模型可以边用边学,无需重新训练,支持多种B端应用需求。
顺向阳强调,计算机视觉也将是机器人和具身智能发展的重要方向。机器人最终将走进每个工厂、每个家庭。
IDEA研究院宣布在具身智能领域达成三项合作:与腾讯合作,在深圳市福田区、河套深港科技创新合作区共建福田实验室,专注于人居环境具身智能技术;并与美国合作一组探索无人机视觉智能技术;与比亚迪合作拓展工业机器人智能化应用。
活动期间,IDEA团队还分享了其正在进行的人工智能辅助失明研究。
对于低空经济领域的快速腾飞,沉向阳总结了低空经济发展的四个关键因素:
一是应用为王;二是政府主导,需要程序、法规、政策支持;三是技术是基础;四是安全第一。安全、效率和成本非常重要。这些事情做好了,才能支撑大规模的航班。
会上,IDEA推出低空管理与服务操作系统OpenSILAS 1.0 Alpha版本,并携手17家行业合作伙伴发起OpenSILAS创新联盟,旨在打造开放共享、技术领先的系统和平台,建立由实际系统支持的标准体系。 。
3、合成数据可节省80%以上成本,大型模型可在金融运营投资中落地
大模型能力的出现,离不开互联网时代海量数据的积累。沉向阳表示,现在数据存储供不应求,利用合成数据来训练未来模型的需求变得越来越迫切。
朝这个方向,IDEA团队开发了IDEA Data Maker,利用自主研发的上下文图技术来解决以往文本数据合成方案缺乏多样性等问题。它还可以使用图表作为指南,引入合成数据的“指导手册”。用于合成的引导上下文采样。
实验结果表明,IDEA团队的解决方案能够不断提升大型模型的能力,并超越当前的最佳实践(SOTA);在代币消耗方面,平均成本节省85.7%。目前该技术的内测平台已开放,并通过API提供服务。
在拓展新领域的同时,大规模的模型价值创造也在进行中。会上,IDEA发布了多个垂直行业应用落地进展,包括:学术大模型和AI科研神器ReadPaper、营销创造大模型,以及经济大模型、运营决策大模型、投资大模型等。经济和金融领域的模型。 。
▲经济型大型车型
▲运营决策大模型
4、多个大型化工专家模型已开发,12月将开放AI编程工具链
在基础研究越来越受到重视的当下,AI for Science是科技创新创业的重要方向。今年的诺贝尔物理奖和化学奖使这场科学革命成为人们关注的焦点。好的人工智能工具可以帮助科学家更快更好地做出科学发现。
IDEA团队选择化学领域,从预测能力和数据能力入手,进行研究和产业化实践。
在预测方面,IDEA开发了多个化学领域专家大型模型,其分子属性预测和化学反应预测能力处于行业领先水平;数据方面,IDEA开发了化学文献多模态大模型,并与景泰科技联合发布专利数据挖掘平台PatSight,将医药领域专利化合物数据挖掘时间从几周缩短至一小时。
除了科学研究之外,人工智能正在重塑技术范式的另一个领域是编程语言。
“世界上编程语言那么多,小语言,大语言,还有中文。基本上没有一种语言是真正被所有人使用的,它是中国人发明创造的。我们有机会改变这种现象”。沉向阳说道。
在本次大会上,IDEA研究院MoonBit团队展示了其在AI编码方面的最新成果。
MoonBit是专为云计算和边缘计算设计的AI云原生编程语言和工具链。它具有完整的多后端支持和跨平台能力,可以直接在硬件上运行,并且支持RISC-V。 MoonBit的开源开发平台将于12月正式开放。
据了解,MoonBit去年底开源,当时只有几百名用户。今年3月,用户数量达到3000人。不到半年时间增长了十倍,目前拥有近3万用户。预计到2025年底MoonBit将拥有10万用户,力争2026年底达到100万用户,成为粤港澳大湾区现象级编程语言。
结论:人工智能发展,从促进经济增长到增加人类福祉
近十几年来,人工智能的发展速度令人惊叹。人类引以为傲的许多能力已经逐渐被人工智能逼近甚至超越。
更令人惊讶的是,如今人工智能的能力不再是单纯的单点能力的提升,而是通用人工智能整体能力的提升,对社会的影响也变得更加深远。
沉向阳认为,从人类社会长远发展来看,技术创新带来巨大飞跃。工业时代全球GDP年均增长率约为1%-2%,信息时代为3%-4%。到了人工智能时代,这个数字会是多少?
在他看来,未来人工智能和机器人的数量将大幅增加,带来生产效率的巨大提升,GDP也可能增长百分之十以上。
然而,人工智能的发展能否从促进经济增长转变为人类最大福祉?这是探索AI道路上必须思考的问题。