发布信息

亚马逊发布通用人工智能智能体Nova Act及SDK,开放研究预览版

作者:软荐小编      2025-04-02 10:03:22     155

4 月 1 日消息,亚马逊在当地时间周一正式推出了其通用人工智能智能体——Nova Act。此智能体拥有操控网络浏览器以及能够自主去执行简单网络任务的能力。亚马逊推出了配套的 Nova Act 软件开发工具包(SDK)。此工具包的目的是帮助开发者利用 Nova Act 来构建智能体应用原型。与此同时,这一举措得以实施。

亚马逊操作页面__亚马逊电商浏览器

据 IT 之家得知,Nova Act 是亚马逊在旧金山新成立的 AGI(通用人工智能)实验室研发出来的。该技术将来会为期待已久的生成式 AI 增强版语音助手 Alexa + 提供关键的功能支持。然而,亚马逊方面宣称,从今天开始开放的版本属于“研究预览版”,其功能还需要进一步完善。

开发者能够通过新设立的专属网站 nova.amazon.com 来获取 Nova Act 工具包。这个网站也是亚马逊展示其旗下各类 Nova 基础模型的平台。

Nova Act 被推出了。这标志着亚马逊正式开始参与到 AI 智能体技术的竞争当中。其目的是凭借自身研发的通用 AI 智能体技术,去和 OpenAI 的 Operator 以及 Anthropic 的 Computer Use 等产品进行竞争。当前,多家领先科技公司都认为,有那种能够代替用户浏览网页以及执行任务的 AI 智能体,会让现有的 AI 聊天机器人的实用性得到极大提升。虽然亚马逊不是最先开发这类技术的公司,但是凭借它庞大的 Alexa 用户基础,Nova Act 在未来可能具有最广泛的应用潜力。

亚马逊介绍,开发者使用 Nova Act SDK 后,能够为用户把一些基础性网络操作进行自动化处理。比如从餐饮品牌 Sweetgreen 订购沙拉,或者在线预订餐厅晚餐。该工具包提供了一系列工具,能让 AI 智能体去浏览网页、填写表单以及在日历上选择日期等。

亚马逊声称,在性能方面,在公司内部进行的多项测试里,Nova Act 的表现比 OpenAI 的同类智能体好,也比 Anthropic 的同类智能体好。以 ScreenSpot Web Text 测试为例,该测试用于衡量 AI 智能体与屏幕文本的交互能力。Nova Act 的得分是 94%,OpenAI 的 CUA 得分为 88%,Anthropic 的 Claude 3.7 Sonnet 得分为 90%,Nova Act 的得分超过了 OpenAI 的 CUA 和 Anthropic 的 Claude 3.7 Sonnet。然而需要注意的是,亚马逊没有公布 Nova Act 在诸如 WebVoyager 这类行业更常用的智能体评估基准上的测试结果。

亚马逊上述 AGI 实验室对外发布了首个公开产品,即 Nova Act。该实验室由前 OpenAI 研究员 David Luan 与 Pieter Abbeel 共同领导。去年,这两位专家被亚马逊聘用去主导其 AI 智能体研发工作,在此之前,他们分别创立了 AI 初创公司 Adept 和 Covariant。

Luan 在接受 TechCrunch 采访时解释了一个以 AGI 为目标的实验室为何会开发订购沙拉的 AI 智能体。他认为智能体是构建超智能 AI 系统的关键一步。他把 AGI 定义为能够在计算机上帮助你完成人类所能做的任何事情的 AI 系统。Luan 表示,其团队设计的 Nova Act SDK 的目的是能够可靠地自动化执行简短且简单的任务,并且为开发者提供了可以精确定义在智能体工作流程中何时需要人类介入的工具。他期望借此帮助开发者构建更可靠的智能体应用,即便这些应用不一定是完全自主运行的。

目前,OpenAI 等公司的早期 AI 智能体面临重大挑战,在跨不同领域应用时可靠性不足。TechCrunch 等媒体测试显示,这些系统运行缓慢,难以长时间独立工作,还容易犯人类通常不会犯的错误。亚马逊是否已找到克服这些难题的有效办法呢?还是其 Nova Act 智能体也会被同样的缺陷所困呢?市场正拭目以待。

相关内容 查看全部