发布信息

国内首款云端人工智能芯片发布理论峰值速度达128万亿次定点运算

作者:软荐小编      2023-08-10 22:04:17     203

智能芯片人工智能领域大规模数据中心和服务器的核心芯片。 5月3日,中国科学技术大学发布国外首款云端人工智能芯片,理论峰值速率每秒128万亿次定点计算,达到世界先进水平,将广泛应用于智能手机、智能耳机、智能相机、智能驾驶等领域。

智能芯片是前沿技术和社会关注的热点,也是人工智能技术发展中不可逾越的关键一环。 可以说,无论多么先进的算法,如果要最终应用,都必须通过芯片来实现。

功耗测试软件下载_功耗测试软件c6_软件功耗测试

5月3日,全球新一代人工智能芯片发布会在北京召开。 中科院旗下寒武纪科技公司发布了我国自主研发的寒武纪MLU100云智能芯片及板卡产品、寒武纪1M终端智能处理器IP产品。 。 这是国外首款云人工智能芯片,理论峰值速率每秒128万亿次定点计算,达到世界先进水平。

智能芯片实现新突破

作为本次发布会的焦点,首次亮相的寒武纪MLU100云端智能芯片是我国首款云端AI芯片。

中科院测算所研究员、寒武纪创始人兼CEO陈天石表示,云智能芯片是人工智能领域大规模数据中心和服务器的核心芯片。 云端智能芯片规模更大、结构更复杂。 它们与终端芯片最大的区别在于其更强的计算能力。

MLU100云智能芯片采用最新寒武纪MLUv01架构和台积电16nm先进工艺,可工作在平衡模式(1GHz显存)和高性能模式(1.3GHz显存),平衡模式下等效理论峰值速率达到第二次128万亿次定点运算,高性能模式下等效理论峰值速率可达每秒166.4万亿次定点运算,但典型板级帧率仅为80瓦,峰值帧率不超过110瓦。

“三年来,从两款测试芯片的研发到今天云智能芯片的最终亮相,我们始终在谋划‘从端到云’。” 陈天石表示,MLU100基于软硬件协同,提高显存带宽利用率,无论从性能比还是帧率比来看,寒武纪都将在智能芯片领域树立新的典范。

与寒武纪系列终端处理器一样,MLU100云芯片延续了寒武纪产品出色的通用性,可支持千万级用户大规模商用测试,并搭载各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景(如大数据量、多任务、多模态、低时延、高吞吐量)的云智能处理需求。

软件功耗测试_功耗测试软件下载_功耗测试软件c6

据悉,新发布的寒武纪1M处理器是该公司的第三代IP产品,延续了前两代产品(寒武纪1H/1A)的优秀完成度,单个处理器核心可支持多个,进一步支持经典机器学习算法和本地训练,为视觉、语音、自然语言处理和各种经典机器学习任务提供灵活高效的估计平台。 将广泛应用于智能手机、智能耳机、智能相机、智能驾驶等不同领域。

“从端到云”协同开发

寒武纪科技有限公司脱胎于中国科学院测算与估算研究所。 2016年,发布全球首款商用深度学习专用处理器寒武纪1A处理器。 它的诞生打破了多项记录,并入围第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。 目前,寒武纪处理器也已应用到国内某知名手机近期发布的旗舰机型上,实现了集成应用。

近年来,人工智能产业的快速发展推动了芯片市场的快速下滑,也带动了人工智能估算从终端向云端的延伸。陈天石表示,寒武纪践行“设备”理念-云协作”技术。 此次发布的MLU100云芯片不仅可以独立完成各种复杂的云端智能任务,还可以配合寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端协同完成复杂的智能处理基于统一智能生态的任务

陈天石强调,端侧智能处理能够尽快响应用户需求,以特别低的帧率、成本和延迟帮助用户理解图像、视频、语音和文本。 同时,云端的智能处理可以汇聚多个终端的信息。 由于终端数据量有限,机器学习模型只能根据单个用户的数据进行微调。 为此,端云协同的智能处理模式将发挥在数据上的巨大优势,借助海量数据,可以训练出强大的人工智能模型。

“过去,芯片厂商大多专注于端,比如芯片大亨ARM,或者云,比如英特尔。将三者结合起来的公司很少,因为端云的任务生态差异较大。这种局面将被彻底打破,由于终端和云端的任务是融为一体的,所以编程和使用的生态也是一致的,寒武纪作为通用机器学习芯片厂商,就是要把终端和云端结合起来,共同推动智能芯片生态发展。”陈天石表示。

中国科学院武汉分院副院长、中科院教授张旭表示,从过去用于手机等终端的智能芯片,到下一个层面的云端人工智能芯片,它可以让人们在手机等终端上的应用上升到未来。 云等领域的应用越来越广泛,所以这是一个开创性的突破。

软件功耗测试_功耗测试软件下载_功耗测试软件c6

目前软件功耗测试,不少科技公司都加紧了人工智能芯片的研发,包括智能手机、无人驾驶、云计算等领域。 据相关机构预测,到2021年,人​​工智能芯片市场规模将超过110亿欧元,而2016年这一数字仅为36亿欧元。

“寒武纪的初衷是让智能处理器为全世界所用。” 陈天石告诉记者,寒武纪将秉持学术界开放协作的精神,以处理器IP授权的形式与全球同行共享。 寒武纪最新技术成果使全球客户能够快速设计和生产具有人工智能处理能力的芯片产品。

共同打造人工智能生态链

发布会上,部分寒武纪产业合作伙伴公开展示了基于寒武纪芯片的应用解决方案。 联想集团中层总工程师佟福耀在发布会上推出了基于寒武纪MLU100智能处理卡的ThinkSystem SR650软件功耗测试,打破了37项服务器基准测试的世界纪录。

“在新产品方面,我们搭载了寒武纪芯片,将帮助各行各业在人工智能、VR、高性能估算的开发以及行业解决方案的实施方面发挥作用。” 佟扶摇说道。

除此之外,芯片成果还将应用于智能语音领域。 “在传统处理器上完成一小时语音数据的智能应用处理需要一万小时,交大讯飞仍在跟踪人工智能专用芯片的前沿进展。” 上海讯飞总裁苏程介绍,寒武纪智能处理器在智能语音处理方面取得了优异的成绩,其耗煤效率比竞争对手云GPU解决方案高出五倍以上。 其强大的处理能力使得手机本地端能够处理更复杂的机器学习算法,使得本地语音识别的准确率领先传统处理器9.8%,显着提升用户体验。

曙光中级总工程师任景阳在发布会上同步推出了基于寒武纪MLU100智能处理卡的服务器产品系列“PHAERON”。 性能更强,可支持2-10张寒武纪MLU处理卡。 灵活应对不同智能应用负载。 以升级版PHAERON-10为例,单台服务器可集成10个寒武纪人工智能处理单元,为人工智能训练应用提供832T半精度浮点计算能力,为推理应用提供1.66P整数计算能力。 场景能效提升30倍以上。

“下一步,曙光与寒武纪的合作将不仅限于整机领域,还将从顶尖科研延伸到高端应用,共同塑造下游应用产业,共同打造人工智能智能生态链。” 任景阳透露,中科曙光还将发布人工智能管理平台SothisAI,实现与寒武纪芯片和开发环境的无缝连接和深度融合。

你的最爱

软件功耗测试_功耗测试软件c6_功耗测试软件下载

结尾

功耗测试软件c6_软件功耗测试_功耗测试软件下载

功耗测试软件c6_软件功耗测试_功耗测试软件下载

长按指纹>识别图中二维码>

新媒体编辑吴兵

中国网财经官方陌陌(ID:zgwcjzx)

相关内容 查看全部