金磊 来自 拉斯维加斯
量子比特 |公众号QbitAI
刚刚,云计算龙头公司亚马逊云科技在大模型这件事上大放异彩——
亚马逊首席执行官安迪·贾西 (Andy Jassy) 亲自在 re:Invent24 上登台,发布了他的全新 AI 多模态系列大型模型,名为 Amazon Nova。
而且涵盖了文字对话、图像生成、视频生成,甚至直接透露了一个小目标:
未来,我们不仅需要 Speech to Speech,还需要 Any-to-Any!
总体来说,Amazon Nova系列的所有型号都是按照功能和尺寸来划分的。
我们先来看看新版新锐基础款的“文字对话篇”,一共包含四种杯型:
现场,Andy还展示了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上的成绩。
从结果中不难看出,它在检索增强生成(RAG)、函数调用和代理应用中具有良好的性能。
据悉,前三款已上线亚马逊云技术的“样板工厂”Amazon Bedrock,而Premier版本将于2025年第一季度推出。
目前,一些实际测试已经被泄露,比如Amazon Nova Pro的提示:
用 100 字写出该文档的摘要。然后,构建决策树。
写一篇 100 字的摘要。然后,构建决策树。
点击一下,结果出来了:
另一个例子是要求 Amazon Nova Pro 理解以下合并视频:
它给出的答案是:
视频从海洋岩石海岸的景色开始,然后过渡到沙滩上休息的大贝壳的特写。
视频从海洋上的岩石海岸开始,然后过渡到海滩上一个大贝壳的特写。
接下来是“非文本生成篇”,一共包括两篇文章。
Amazon Nova Canvas 专注于图像生成。用官方的话来说,它已经达到了“State-of-the-art”(最先进)的水平:
至于视频生成模型,称为Amazon Nova Reel。给定一张图片和一句话,你可以让它动起来:
而安迪接下来的话,却让现场气氛变得不安起来。
刚才我们提到,Andy已经说过,Amazon Nova将呈现的情况是一切皆可生成。
值得细细品味的一点是,在生成式AI时代,亚马逊云科技此前发布的自研大型模型并不是最引人注目的。
虽然之前已经发布了 Amazon Titan 大模型,但形态仅限于文本,更多精力集中在 Amazon Bedrock 和 Amazon Q 等平台和应用程序上。
但这一次,亚马逊云技术一反常态,以厚积薄发全面覆盖主流形态,甚至说出“Any-toAny”以示野心。
为什么会这样呢?
纵观整个发布会,通过亚马逊云技术CEO马特·加曼的全程介绍,答案或许可以概括为——
实力一直都有,但现在客户有了要求。
△Matt Garman首次作为CEO参与re:Invent
这应该如何理解呢?我们继续往下看。
算力再次升级,价格也非常美丽。
我们先看实力。
作为云计算领域的领导者,计算能力是亚马逊云技术的特色之一。
与传统云服务厂商不同,其自主研发和优化的专用芯片和数据中心,包括Graviton、Nitro等专有服务器主机,为实时计算提供支持。
此次基础设施的一系列更新,从芯片到服务器,可分为三大板块——
计算、存储和数据库。
在计算层面,亚马逊云技术率先宣布Amazon EC2 Trn2实例正式上线。
EC2 Trn2实例采用第二代Trainium芯片(Trainium2),与上一代Trn1实例相比,性能显着提升。具体来说:
此外,Trn2 实例的成本效益比当前基于 GPU 的 EC2 P5e 和 P5en 实例高出 30-40%。
每个 Trn2 实例包含 16 个 Trainium2 芯片、192 个 vCPU、2 TiB 内存和 3.2 Tbps Elastic Fabric Adapter (EFA) v3 网络带宽,与上一代相比,延迟最多减少 35%。
为了应对更高的性能要求,亚马逊云技术还推出了Trn2 UltraServer。
这是一种新型的超大规模计算产品。每个UltraServer包含64个Trainium2芯片,并通过高带宽、低延迟的Neuronlink互连实现卓越的性能。
这使得 Trn2 UltraServer 成为训练超大规模基础模型(如生成式 AI、LLM 等)的理想选择。
Neuronlink 是亚马逊云技术的专有网络互连技术。它可以将多个Trainium服务器组合成一个逻辑单服务器,连接带宽高达2TB/s,延迟仅为1微秒。
其设计特别适合分布式深度学习任务,网络通信的优化有助于显着缩短训练时间并提高资源利用率。
用官方的话来说:
这正是训练具有数万亿参数的大规模人工智能模型所需的超级计算平台。它非常强大。
现场,苹果也前来声援亚马逊。机器学习和人工智能高级总监 Benoit Dupin 表示:
苹果将使用亚马逊云技术的Trainium2芯片。
此外,在芯片层面,亚马逊云技术发布了AWS Trainium3芯片的预览版,预计将于2025年正式推出。
据悉,Trainium3将采用3纳米工艺制造,提供Trainium2两倍的计算能力,能源效率提高40%。
计算(Compute)之后,还有存储(Storage)上的更新。
我们都知道,在数据分析和大数据领域,处理和查询大规模数据集的能力至关重要。
然而,传统的数据查询方式在处理海量数据时往往会导致性能瓶颈和管理复杂性,影响公司数据驱动的决策能力。
为此,亚马逊云技术专门推出了Amazon S3 Tables。
Amazon S3 Tables 提供了一种专为表格数据设计的新存储方法,并支持使用 Amazon Athena、Amazon EMR 和 Apache Spark 等流行查询引擎进行轻松查询。
S3 的表存储桶是其第三种存储桶类型,与现有的通用存储桶和目录存储桶并列。将表存储桶视为用于存储具有不同模式的 Iceberg 表的分析仓库。
与自管理表存储相比,S3 Tables 可以实现高达 3 倍的查询性能提升和每秒 10 倍的事务处理能力,同时提供完全托管服务的运行效率。
此外,元数据也变得越来越重要。例如,手机里有很多照片。正是因为元数据用于存储数据,所以现在可以使用自然语言快速找到照片。
基于这样的需求,亚马逊云技术推出了Amazon S3元数据的预览版。
Amazon S3 元数据提供了一种自动化、易于查询的元数据管理方法。这些元数据几乎实时更新,帮助用户组织、识别和使用S3数据进行业务分析、实时推理应用等。
它支持对象元数据,包括系统定义的详细信息(例如大小和对象来源)以及自定义元数据,允许用户使用标签向对象添加产品 SKU、交易 ID 或内容评级等信息。
这些元数据也存储在 S3 表中。
在计算和存储之后,还有基础设施的第三大部分——数据库。
有趣的一点是,Matt在现场分享了一张“OR”或“AND”图,代表了企业在选择数据库时经常遇到的艰难抉择——跨区域一致性、高可用性、低延迟,往往只有3选2 。
亚马逊云科技这次给出的答案是:可以。
这就是 Amazon Aurora DSQL,一种新型无服务器分布式数据库,旨在解决传统数据库的可扩展性和性能挑战。
Aurora DSQL 将传统关系数据库的强一致性与 NoSQL 数据库的分布式可扩展性相结合,提供以下关键优势:
以上就是亚马逊云技术此次在基础设施方面的努力。
新的构建模块——推理
如果说基础设施的三大板块被视为三个构建块,那么亚马逊云技术在模型层和应用层添加了第四个构建块——推理。
推理是生成式人工智能工作流程的核心,是指将经过训练的模型应用于新数据来预测、生成或推理。
马特在会议上强调:
推理在人工智能模型的应用中变得尤为重要,尤其是在处理大型语言模型等复杂模型时。推理需要极高的计算能力和低延迟响应。
Amazon Bedrock作为亚马逊云技术模型层的AI平台服务,首先在推理上与我们上述的基础设施保持同步。
也就是说,Inferentia和Trainium芯片为推理提供了硬件优化,用户可以通过Amazon Bedrock方便地访问这些资源。
至于Amazon Bedrock本身,这次也得到了很多能力的升级。
第一个是模型蒸馏,它可以自动为特定用例创建蒸馏模型。
主要通过从大型基础模型(教师模型)生成响应并使用这些响应来微调较小的基础模型(学生模型),实现知识转移,提高小型模型的准确性,同时减少延迟和成本。
二是多主体协作。
在需要多个代理来处理复杂任务的场景中,管理这些代理变得具有挑战性,特别是随着任务复杂性的增加。
使用开源解决方案的开发人员可能会发现自己需要手动实现复杂的操作,例如代理编排、会话处理和内存管理。
这也是亚马逊云技术在Amazon Bedrock上启动多代理协作的起点。具体特点如下:
最后,也是更重要的是,能够防止由大型语言模型幻觉引起的事实错误——自动推理检查,这是 Amazon Bedrock Guardrails 的一项新功能。
这一新的保障措施旨在确保法学硕士通过数学验证生成的答案的准确性,并防止幻觉引起的事实错误。
自动推理检查使用基于数学和逻辑的算法验证和推理过程来验证模型生成的信息,确保输出与已知事实一致,而不是基于虚构或不一致的数据。
与机器学习 (ML) 不同,自动推理提供有关系统行为的数学保证。
据悉,亚马逊云技术已在存储、网络、虚拟化、身份和密码学等关键服务领域使用了自动推理。例如,自动推理用于形式化验证密码实现的正确性并提高性能和开发速度。
在性能方面,Bedrock还推出了低延迟优化推理,让用户在使用最先进的大型模型的同时,也能享受到卓越的推理性能。
值得一提的是,Llama 405B和Llama 70B的低延迟优化版本在亚马逊云技术上展现出了超越其他云提供商的出色性能。
还有应用层等更新
对于开发者和企业来说,亚马逊云技术在应用层的代表作就是Amazon Q。
针对越来越多企业寻求从本地数据中心迁移到云端的痛点,亚马逊云技术在 Amazon Q Developer 上推出了多项新功能。
其中最引人注目的一项是 Windows .NET 应用程序的转换。该功能使企业能够更快地将.NET应用程序迁移到AWS,同时还显着降低迁移成本。
Amazon Q 为 .NET 应用程序提供了自动化迁移工具,可以识别应用程序中可能存在的不兼容问题,生成迁移计划,并自动调整源代码以确保平稳过渡到云。这种自动化迁移极大地提高了工作效率并减少了人为干预。
通过将应用程序从 Windows 迁移到 Linux,企业可以节省高昂的 Windows 许可费用并降低 TCO(总拥有成本)。
Matt 指出,使用 Amazon Q 的企业可以节省高达 40% 的许可成本。
而且迁移速度比传统手动迁移快四倍,大大降低了系统迁移的停机时间和风险。
除了Windows应用程序的迁移之外,亚马逊云技术还推出了Amazon Q Developer Transformation for VMware Workloads功能,该功能专为在VMware上运行的企业工作负载而设计。
通过这个工具,亚马逊云技术可以帮助企业将本地VMware环境迁移到云平台。
除了应用层之外,还有Amazon SageMaker等结合AI和分析的产品。
作为一个能够帮助企业加速AI应用的开发、训练和部署的数据科学平台,今天正式进入“下一代”。
新一代SageMaker的核心是SageMaker Unified Studio。
这是一个单一的数据和 AI 开发环境,集成了 Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA) 和现有 SageMaker Studio 的工具和功能。
第二个是Amazon SageMaker Lakehouse,它可以统一Amazon S3数据湖、Amazon Redshift数据仓库以及第三方和联合数据源。
亚马逊云技术的“AI脚步”
看完这篇re:Invent的全部内容和能力,亚马逊云技术在生成式AI时代的发展路径其实已经比较清晰了——
从客户的真实业务需求出发。
以上内容的更新都是基于“客户的服务出现了哪些问题”,包括计算、存储、数据库方面的瓶颈,包括客户对模型的选择,包括应用迁移服务等。
了解了其背后的务实逻辑后,就不难理解为什么亚马逊云技术选择在这个时间点发布一系列多模态大模型,或者说是出于客户需求。
这个需求具体来说就是客户对车型的选择。毕竟“没有一种模式能够主宰世界”,而且每种模式都有自己擅长的领域。
但亚马逊云技术所做的是利用其在基础设施、工具/模型和应用程序方面的深厚知识和实力,为客户提供额外的“快、好、经济”的选择。
回顾亚马逊云技术诞生之初,这一点似乎从未改变过。
正如马特在会议上回忆的那样:
2006年亚马逊云技术推出时,初创公司是第一批用户,他们总是非常积极地采用新技术,并能够提供有价值的反馈。
这一反馈进一步推动了亚马逊云技术的发展,有助于了解如何更好地支持创业。
因此,Matt也在大会上宣布了一个重磅消息:
到2025年将为全球初创企业提供10亿美元的财务支持!
还有一件事
此次re:Invent共有6万人参与,快来感受这份热情和这份感觉吧~
参考链接:
[1]
[2]
[3]