发布信息

英特尔发布具身智能大小脑融合方案,单系统设计兼顾精度与泛化能力

作者:软荐小编      2025-04-23 21:02:20     129

_英特尔智能加速技术监视器下载_矿池算力和全网算力

智东西

作者 ZeR0

编辑 漠影

4 月 22 日,智东西有相关报道。近日,在 2025 英特尔具身智能解决方案推介会上,英特尔把其具身智能大小脑融合方案正式发布了(该方案下称具身智能方案)。

该方案是以英特尔酷睿 Ultra 处理器为基础的,同时还有全新的具身智能软件开发套件和 AI 加速框架。凭借其创新性的模块化设计,既可以兼顾操作精度,又能够具备智能泛化能力,并且性价比十分出色,能够满足不同领域的需求。

现在具身智能产品处于小批量生产的阶段。不同的应用场景对 IO 接口有着不同的需求,对传感器也有不同的需求,对算力同样有不同的需求。如何打造出一个能够快速适应不同需求的灵活计算平台,这是一个关键的挑战。

许多具身智能方案采用双系统来实现。英特尔推出的具身智能应用解决方案采用一体化单系统设计。这种设计能够以较低的总成本,实现高效灵活的工作负载分配。

该方案在硬件方面搭配了英特尔酷睿 Ultra CPU 核心板。英特尔酷睿 Ultra 200H CPU 能够提供 90 TOPS 的性能,而其下一代 Panther Lake 的算力则可以达到 180 TOPS。

其硬件方案采用模块化设计。它能够针对不同的具身智能应用场景进行灵活搭配。其中包括支持 MxM 嵌入式显卡插槽,这样可以扩展接入英特尔锐炫独立显卡。还有摄像头转接板,通过它可以接入多路 MIPI/GMSL 嵌入式摄像头,从而扩展感知能力。另外有独立的 IO 载板,可用于扩展各类接口。

软件方面,该具身智能方案具备全栈式软件平台。此平台包含底层的 BSP 等,还有算法模型、加速库以及参考示例等,并且附有相关文档和开发教程。同时,它还提供实时调优的 BKC 、RT Linux 内核以及优化的 EtherCAT IgH 主站协议栈示例,目的是为了能更好地对实时运动控制提供支持。

英特尔在算法方面,对 CPU 进行了传统运动规划和视觉算法的优化。同时,利用 iGPU 和 NPU 加速了基于深度学习以及大模型的感知和操作。

有各种软件工具,其中包含实时性能调优工具以及 Debug 工具,这些工具能够帮助降低学习成本和开发部署成本。

英特尔的产品组合很丰富。它提供了从入门级开始的 AI 算力,这种算力能达到 1000TOPS 以上。同时,也有从低到高的 CPU 算力产品组合。并且在开发工具等方面实现了统一。这些产品可用于构建涵盖各种类型的具身智能解决方案。

_矿池算力和全网算力_英特尔智能加速技术监视器下载

酷睿很适合做本体运控小脑。云端或边缘侧大脑能够接入酷睿、至强、锐炫独立显卡。无论是对传统机器人进行智能化改造,还是实现人形机器人的大小脑融合,亦或是把传统运控小脑升级为 AI 运控小脑,都可以借助酷睿 Ultra 来达成。

浙江人形机器人创新中心已以英特尔酷睿处理器为基础,打造出“领航者 2 号 NAVIAI”人形机器人。此机器人实现了多项技术突破,包括可泛化的高精准视觉伺服,以及多行为联合学习的长序列行为规划和视力融合的操作行为学习等。凭借这些技术突破,它既能够在工业场景中执行复杂任务,又可以在服务场景中完成人机交互和辅助等任务。

一、具身智能需要单系统方案:低成本、低延迟、低功耗

具身智能从人工设计算法逐渐转变为数据驱动的模型,具身智能计算负载需求的发展趋势发生了变化,从以 CPU 为主进行计算发展到 CPU 和 GPU 并重,甚至需要云端算力的辅助。在不同的场景以及不同的应用需求之下,不同的架构都有各自的优势和性价比。

英特尔技术专家介绍称,目前主流的计算架构为大小脑融合架构。其中小脑部分主要是以 x86 为基础,包含英特尔的 12 代酷睿、13 代酷睿,以及凌动 N97、N305 等,通过小板子来实现功耗和尺寸的优化。而大脑部分的主流方案则是以其他厂商的产品为主。这两个系统会通过网络进行通信,从而最终实现双系统方案。

市面上没有单系统能同时提供 CPU 和 GPU 算力,所以很多时候只能采用双系统方案来处理现有问题。这种架构带来了诸多设计挑战,导致研发和维护等成本提升,对整个计算平台的功耗、尺寸以及结构优化都有很大的限制,无法像单系统那样进行极致优化。

另外,两个系统是通过网络来进行通信的。在这种情况下,无论是双系统的时间同步,还是它们之间的信息交互,都会面临带宽限制以及存在延迟的情况。

因此业界需要采用更好的单系统方案解决这些问题。

英特尔酷睿 Ultra 产品线将 CPU、GPU、NPU 封装于一个 SoC 之中。这样一来,低功耗的 SoC 能够提供强劲的 CPU 算力和 AI 算力。并且,这满足了具身智能在绝大多数场景的需求。

英特尔智能加速技术监视器下载__矿池算力和全网算力

不同系统之间通过共享内存进行通信。无论是网络通信,还是 CPU 内存与独显显存之间的通信,共享内存方式都更为稳定且速度更快。

此外,单系统方案能够显著降低整体的计算成本。酷睿 Ultra 在能效方面,支持 28W 到 65W 的功率范围,这样用户就能根据实际需求来匹配功率,从而实现更好的功效和续航。单系统与 ODM 设计相配合,还可以实现更加小巧的尺寸,以及具备更灵活的接口。

二、以大小脑融合为亮点,处理具身智能复杂任务

英特尔具身智能方案的亮点在于大小脑融合。它能够让感知、交互、任务规划以及运动控制在同一个系统里实现高效的整合。

英特尔酷睿 Ultra 处理器是其中的算力中枢,它通过 CPU 以及集成的英特尔锐炫 GPU 与 NPU 协同工作。凭借高性能异构算力和高精度实时性能,它能够支持具身智能的多样化负载稳定运行,并且还能大幅提升具身智能系统的整体效率和响应能力。

英特尔智能加速技术监视器下载_矿池算力和全网算力_

其中,CPU 能够支持具身智能方案进行复杂的运动控制。集成的英特尔锐炫 GPU 可以处理具身智能处理中的环境感知、任务识别、任务规划、大语言模型(LLM)、视觉语言模型(VLM)和端到端模型等复杂任务。NPU 承载着语音识别、实时视觉处理、传感器数据分析等需要长时间运行的 AI 任务。

英特尔中国网络与边缘技术与产品总监王景佳分享称,酷睿 Ultra 系列处理器的架构是符合当下异构计算趋势的。它既适用于 AI PC 消费类的场景,同时也为具身智能场景提供了理想的解决方案。

英特尔持续在显卡市场进行投入。王景佳表示,英特尔锐炫 B 系列显卡在去年底发布,该显卡在市场上获得了广泛的好评。对于具身智能场景来说,它或许是性价比或性能功耗比最为优秀的产品。

英特尔技术专家分享称,酷睿 Ultra 处理器能够持续提供强劲的 x86 算力,并且可以实现实时的运动控制。其 CPU 采用大小核架构,拥有多达 16 个 CPU 核心,运行主频最高能达到 5.1GHz。在 AI 工作负载下,它的实时确定性能够达到 20 微秒抖动,从而为运动控制提供更好的确定性保障。

新推出的英特尔酷睿 Ultra 200H 系列处理器方案,其总 AI 算力达到了 90 TOPS。英特尔基于 Intel 18A 的下一代 Panther Lake,其总算力将会超过 180 TOPS。

NPU 的能耗表现很出色,它能够在 2W 的功耗情况下提供 13 TOPS 的 AI 推理能力。

_英特尔智能加速技术监视器下载_矿池算力和全网算力

集成显卡 GPU 部分单独可具备 77 TOPS 的算力。它能够支持各类视觉模型。它能够支持大语言模型。它能够支持端到端大模型。通过 OpenVINO 和 IPEX-LLM,它可以对传统的卷积神经网络模型进行优化。通过 OpenVINO 和 IPEX-LLM,它可以对大模型进行优化。

英特尔对集成显卡(iGPU)进行了具身智能相关算法的测试。像机器人在物体检测中常用的 YOLO v8 算法,在 2048×2048 这样的高分辨率下,以 FP16 的网络精度来进行测试,其推理效率能够达到 108 FPS。

使用该集成显卡来运行 6 - 9B 参数规模的小尺寸大语言模型时,首个 token 生成时间能达到约 800 毫秒,后续的平均 token 生成时间在 50 - 80 毫秒,其效率是很高的。

英特尔具身智能方案搭载了英特尔锐炫 B 系列显卡(Battlemage),且为最新一代。此独立显卡的核心是 Xe2 架构,与上一代产品相比,效率提升较为显著。每个 Xe 核心的性能提升达到了 70%,每瓦性能也提升了 50%。

_矿池算力和全网算力_英特尔智能加速技术监视器下载

英特尔在该方案中选用的是锐炫 B570。这款显卡拥有 18 个 Xe 核心。每个 Xe 核心都配备了 8 个 AI 计算单元。总计有 144 个 AI 计算单元。其整体 AI 算力能够达到 200+ TOPS。进而进一步拓展了 AI 能力。

英特尔对独立显卡进行了众多大语言模型推理测试。拿 6B - 9B 参数规模的大模型来说,在锐炫 B 系列显卡上,首个 token 的生成大概需要 100 毫秒,后续 token 的生成大概在 10 到 15 毫秒之间,这些时间可用于具身智能应用中的人机交互、内容生成以及借助大语言模型进行动作编排。

VLA 大模型一般包含三个部分。其一,有一个运行频率大概为 10Hz 的慢思考视觉语言大模型。其二,存在一个运行频率为 200Hz 的动作大模型。其三,还有一个需要实时处理总线信息以及模型运动控制的实时系统。2B - 7B VLM 大模型适宜在酷睿 Ultra 内置的锐炫 GPU 上运行,而在 NPU 上则适合运行诸如 ACT 算法等。

三、提供具身智能软件开发套件,缩短评估和开发时间

英特尔推出了具身智能软件开发套件。该套件通过一系列工具和平台来实现特定功能。这些工具包括 OpenVINO 工具套件、英特尔 oneAPI 工具包、Intel Extension for PyTorch-LLM(IPEX)、英特尔工业边缘控制平台(ECI),还有基于开源机器人操作系统的库、中间件和示例应用程序。借助这些,能够使代码实现一次开发多平台部署,缩短评估和开发时间,加快客户应用程序的部署以及算法和应用的运行。

英特尔智能加速技术监视器下载_矿池算力和全网算力_

英特尔具身智能软件开发套件

英特尔在软件框架和加速器之上开发了一系列参考用例。其中有视觉伺服,还有模仿学习,以及优化运动控制,另外还有基于大模型的运动规划。这些参考实践代码的目的是帮助开发者更好地理解怎样基于软件平台来实现各种具身智能应用。

英特尔提供跨平台的 AI 模型优化工具,同时还提供端到端流程加速方案,这样做的目的是简化方案的搭建过程,并且能够加快产品上市的速度。

该软件开发套件可以把不同类型的工作负载平均地分配到 CPU 上进行运行,也能把工作负载分配到 NPU 上进行运行,还能把工作负载分配到集成显卡上进行运行,甚至能把工作负载分配到独立显卡上进行运行,以此实现协同运行,进而更充分地利用整体的计算资源。

传统的运动规划库以及 MPC 运动控制算法,由于其软件特性的缘故,在 CPU 上能够获取更高的运行效率,所以能够将它们调度到 CPU 上进行运行。而 CNN 视觉模型在 iGPU 或者 NPU 上或许运行效率会更高,故而可以把它调度到 NPU 上运行。对于那些需要更多 AI 算力的大模型,就可以将其分配到集成显卡或者独立显卡上运行。通过这种方式,整个系统能够得到更高效的利用。

在使用方面,英特尔具身智能软件开发套件的目的是最大程度地减少用户的使用成本。它会把 SDK 的大部分软件包进行打包,将英特尔提供的代码库添加到 APT 源中。接着,用户可以通过安装 Deb 包和下载源码的方式,利用英特尔在线 APT 代码库进行下载和部署。并且,该软件包支持 Ubuntu 22.04 LTS 版本。

用户可以通过在线文档教程快速开始入门,从而获取相关信息以及下载原文件。

四、与本体生态伙伴深度合作,探索具身智能全链路协同

英特尔在持续推动具身智能软硬件创新,同时与本地生态伙伴展开深度合作,去探索从技术研发到场景落地的全链路协同模式,进而构建起协同共进的产业生态格局。

信步科技推出的具身智能硬件开发平台是 HB03,它搭载了英特尔酷睿 Ultra 200 系列处理器以及英特尔锐炫 B570 显卡,能够给予强大且灵活的算力,同时也能实现极强的控制实时性。

英特尔智能加速技术监视器下载_矿池算力和全网算力_

信步 HB03 平台采用紧凑结构,拥有扩展接口,并且进行了工业级可靠性设计。它具备性能更强的特点,尺寸也更小,可靠性更高,还能灵活配置。这些优势为具身智能“大小脑”的融合构建了有力的硬件支撑。

HB03有4个显著优势:

采用英特尔酷睿Ultra 200系列处理器,具备96 TOPS算力;以板贴内存方式,提升了可靠性,且意在达成CPU与内存间更高的数据带宽;96 TOPS的本体算力加上英特尔显卡,使整个HB03最高能支持300 TOPS算力。

_英特尔智能加速技术监视器下载_矿池算力和全网算力

HB03 存在两个型号,其中一个型号支持显卡,其算力可达 300 TOPS,厚度为 78 毫米;另一个型号不带显卡,本体算力为 96 TOPS,厚度仅为 53 毫米。不同的型号能够与不同尺寸、不同形态的具身机器人相适配。

对所有对外接口采用了加固设计,这样做更可靠。这种加固设计解决了传统 USB 标准接口和 RJ45 水晶头在运动过程中容易脱落的问题,也解决了线缆过粗、不易整理等问题。

采用模块化开发理念,更加灵活。屏幕上展示的所有接口都能够自由定制,也可以灵活配置,有助于用户快速实现项目落地以及产品销售。

HB03 能够支持宽电压输入,其最高耐压输入能够达到 75V。它可以直接连接到电池模组上,这样就无需额外去配置 200W 的电压模块,从而使得使用更加便捷且可靠。在散热方面,采用了将 CPU 和 GPU 分别放置在两侧的设计,以此来解决热量集聚的问题。并且,每个单元都运用了铜管和涡轮风扇进行散热,以便尽可能地将热量导出。

结语:用高性价比的软硬全家桶来助力具身智能实现规模化应用落地,同时也助力具身智能实现场景化应用落地。

具身智能产业发展得很快,它正在促使算力基础设施的需求发生变化。英特尔的具身智能方案具有独特之处,凭借大小脑融合架构的创新,实现了功耗、成本和算力的平衡,从而为高效构建具身智能系统提供了一个性价比很高的选择。

英特尔市场营销集团副总裁、中国区 OEM & ODM 销售事业部总经理郭威表示:“人形机器人所代表的具身智能行业正迎来极为热烈的发展热潮。不过,系统架构存在非一致性的问题,解决方案在泛化能力方面有所不足,场景适配也具有复杂性等挑战,这些正在对其大规模商业化的进程产生制约。”基于此,英特尔与生态伙伴携手合作,以大小脑融合的形式,打造出更高效且更智能的解决方案。通过基础通用大模型与硬件技术的协同突破,以及开放生态所产生的加速效应,推动具身智能朝着实践应用场景不断迈进。

未来,英特尔打算持续加强技术创新。英特尔将与生态伙伴一起,拓展在医疗、教育、养老等关键领域的应用场景。英特尔要共建开放、协同的具身智能生态体系。这样能让具身智能真正给千行百业赋予力量。也能为社会的高效运转和可持续发展提供帮助。

相关内容 查看全部