发布信息

芝能智芯解读:IBM Z17大型机融入AI能力,深度剖析其为企业提供的AI计算方案

作者:软荐小编      2025-04-13 21:02:23     198

芝能智芯出品

IBM 推出了其最新一代的大型机 IBM z17 。IBM Z 系列在关键任务负载方面一直有着安全性和可靠性的传统,而 IBM z17 延续了这一传统。它通过全新设计的 Telum II 处理器和 Spyre AI 加速器卡,把人工智能(AI)能力深深融入到了系统架构中。

IBM z17 的目的在于应对企业对于生成式 AI(GenAI)、大型语言模型(LLM)以及预测性 AI 不断增长的需求。它能够提供比前代 z16 高出 7.5 倍的 AI 性能,并且在交易处理、欺诈检测和业务洞察等领域展现出非常卓越的潜力。

我们从三个维度进行剖析,分别是技术架构、功能实现和应用场景创新。IBM z17 通过硬件与软件的协同创新,能够为企业提供 AI 计算解决方案,此方案高效、安全且节能。它在“AI 定义企业”的新时代里,重塑了大型机的价值。

IBM z17 的推出具有多方面的意义。它在技术方面实现了突破,同时也是对客户需求深度响应的一种体现。其市场表现令人期待。

Part 1

IBM z17技术架构

Telum II处理器:AI与高性能计算的核心

IBM z17 的核心是 Telum II 处理器。这款芯片在 2024 年的 Hot Chips 大会上首次展示。它由三星采用 5 纳米工艺进行制造。相较于为 z16 设计的前代 Telum 处理器,实现了明显的性能提升。

硬件规格升级方面

Telum II 为八核设计,其主频相较于上一代从 5GHz 提升到了 5.5GHz,这使得单线程性能得到了增强。每个核心配备了 36MB 的二级缓存(L2),缓存容量得以扩展,并且还有一个额外的 DPU 专用缓存,总计有十个 36MB 的 L2 缓存。

虚拟三级缓存(L3)增至 360MB,虚拟四级缓存(L4)增至 2.88GB。整体缓存容量比前代增加了 40%,这使得数据访问效率得到了显著提升。

并且它内置了第二代片上 AI 加速器,这个加速器能够支持每秒 24 万亿次运算(TOPS)。同时,新增了对 INT8 数据类型的支持,这优化了 AI 推理性能,使得它能够与高负载的企业任务并行运行。

片上 DPU 有创新之处。Telum II 首次集成了数据处理单元(DPU)。这个 DPU 含有四个处理集群。每个集群都配备了八个可编程微控制器。并且还配备了一个管理 IO 加速器。其目的是减轻主处理器在数据密集型 AI 任务中的负担。

总计 192 个 PCIe 插槽大幅扩展了系统 IO 容量。

液体冷却技术将传统的蒸馏水升级为新型冷却液,采用液体冷却方案。这样做可以简化维护,同时提升散热效率。这种设计支持双芯片模块(DCM)的高密度部署,能够确保系统在高负载下保持稳定。

Spyre AI加速器卡:扩展AI能力的利器

Spyre AI 加速器卡是 z17 的一个重要亮点。它通过 PCIe 插槽被集成到系统里。这种方式为生成式 AI 和 LLM 提供了专用的计算资源。并且每张 Spyre 卡能够配备最多 32 个核心。

它的架构和 Telum II 的 AI 加速器相似,功耗是 75W,内存容量达到 128GB。系统能够支持最多 48 张 Spyre 卡,并且以 8 卡为一组进行集群运行。8 卡组合能够提供 1TB 内存和 256 个加速器核心,从而显著增强了 AI 处理能力。

在设计目标方面,Spyre 卡是专门为处理复杂的 AI 模型(如 LLM)而设计的。它支持模型微调以及训练任务,这使得企业能够将数据保留在本地,以满足高安全性的需求。并且它能够与 Telum II 协同工作,实现了“集成 AI”的理念,也就是通过多模型的组合来提升预测的准确性,减少误报率。

在应用场景方面,Spyre 卡于金融领域能够支持实时欺诈检测,在企业管理方面则可用于文档总结以及代码生成等 GenAI 任务。

此外,z17 的主板采用了复杂的 PCB 结构,其层数超过 50 层。这样做是为了提升信号的完整性和可靠性。同时,该主板还支持高密度内存模块的部署。

Telum II 借助对称多处理(SMP)电缆连接器,能够实现多芯片互联,最高可支持 32 个处理器协同工作,从而形成强大的计算集群。并且,z17 通过对现代数据访问方法以及 NoSQL 数据库的集成,优化了在混合云环境下的数据处理能力,为 AI 应用提供了更广泛的数据来源。

Part 2

AI推理的功能实现

IBM z17 把 AI 推理能力嵌入到了交易处理流程中,从而显著提升了实时响应的能力。

Telum II 的 AI 加速器每天能够执行的推理操作超过 4500 亿次。它的延迟很低,仅为 1 毫秒。与 z16 相比,它提升了 50%的 AI 推理吞吐量。在欺诈检测场景中,它能够对 100%的实时交易进行评估,从而大幅降低了漏检率。

z17将预测性 AI 与 GenAI 的优势相结合,比如在保险行业里,它能从 DB2 数据库中提取出结构化的索赔数据,并且通过 LLM 来分析诸如索赔原因这样的非结构化文本,然后将这些输入到预测模型中,以实现对结果的优化。Spyre 卡进一步拓展了生成式 AI 的能力,能够支持诸如聊天机器人管理、医学图像分析等复杂任务。

在软件生态赋能方面

z/OS 3.2 操作系统计划在 2025 年第三季度发布。它将全面支持硬件加速 AI,以此来提供运营 AI 洞察并优化系统管理。同时,新增对 NoSQL 数据库和混合云数据处理的原生支持,使 AI 能够挖掘更多的企业数据,从而生成预测性业务洞察。

watsonx Code Assistant for Z 能够为开发者提供代码自动补全的功能,还能提供优化建议以提升开发效率。watsonx Assistant for Z 被集成到 Z Operations Unite 中,利用实时系统数据来提供 AI 驱动的事件检测和解决方案。

IBM Z Operations Unite 会在 2025 年 5 月发布。它会整合运行日志,以 OpenTelemetry 格式呈现。利用 AI 能够加速异常检测,从而缩短问题解决的时间。并且它可以与 IBM Concert 协同工作,实现智能运营。

在安全与弹性全面升级方面,

集成 HashiCorp 的 Vault 技术,以此来支撑混合云环境下的凭证和密钥管理,从而确保关键负载的安全;IBM Threat Detection for z/OS 运用 Telum II 和自然语言处理技术,能够实时发现和分类敏感数据,进而检测潜在威胁。

从而保障任务关键型负载的敏捷性和安全性。

IBM Technology Lifecycle Services 在开发与支持体系方面,能够提供定制化的支持,以此来优化系统性能,同时还可以减少中断风险。

IBM 与客户保持紧密合作,同时与研究院及软件团队也紧密合作。z17 的开发历经了五年时间,在此期间提交了 300 多项专利。这些都充分体现了以客户需求为导向的研发策略。

小结

IBM z17 推出了。这标志着大型机开始从传统交易处理平台向 AI 驱动计算平台转型。通过 Telum II 处理器和 Spyre AI 加速器卡的协同创新,z17 在技术架构方面实现了高性能与高可靠性的完美结合。并且通过功能实现的深度优化,满足了企业在 AI 推理、生成式 AI 和数据安全方面的多样化需求。

实时欺诈检测有 z17 提供的用例,文档总结也有 z17 提供的用例,混合云数据处理同样有 z17 提供的用例,z17 为金融、保险、零售等行业提供了超过 250 个 AI 用例。

相关内容 查看全部