Openai的聪明身体来了。
1月23日,当地时间,人工智能(AI)巨头Openai发布了一个名为Operator的智能(代理)。
Openai将其描述为一个智能机构,可以在Internet上为用户执行任务。它是“可以独立工作的人工智能 - 您将其任务付出,并且将执行。”
在演示期间,用户只需要输入需求,操作员就可以完成餐厅预订,每日购买和预订门票等任务。用户可以实时查看进度并随时进行干预。在遇到诸如付款信息和家庭地址之类的隐私信息时,运营商还将积极暂停用户接管。
操作员智能体操演示(00:24)
OpenAI首席执行官Sam Altman在现场广播中说,操作员的发布是OpenAI的进入3级的开始,并且将在接下来的几周和几个月内推出更聪明的机构。
早些时候,Openai发布了从AI到AGI(通用人工智能)的五个级别,即1级,聊天机器人,AI可以在对话中与人们互动。第2级:推理,AI AI,AI科学技术解决了人类水平的问题;第3级:代理(智能),AI可以执行一些动作任务作为系统;第4级:创新者(创新者),AI可以发展创新的AI;第5级:组织(组织者)AI可以完成组织的工作。
根据官方介绍,操作员通过官方介绍提供了一种名为“计算机使用代理(CUA)”的新模型。通过加强学习,可以将具有高级推理功能的GPT-4O视觉能力组合在一起,以便可以“参见”(通过屏幕截图)和与浏览器(使用鼠标和键盘允许的所有操作)启用操作员(通过屏幕截图)启用操作员。它可以在网络上采取行动,而无需通过自定义API集成(应用程序接口)。如果您遇到困难或犯错误,操作员还可以将其推理功能用于自我纠正。如果需要,可以将控制返回给用户。
但是,Ultraman还强调,操作员目前只是研究预览,并且存在局限性。
CUA过程结构
Openai表示,由于该模型可以首次在Internet上操作,因此已经执行了大量内部测试和外部红色团队测试,以确保安全使用操作员。根据官方网站信息,目前操作在创建诸如幻灯片或管理日历之类的复杂接口方面存在问题,并且可能存在诸如误解命令或偏离用户要求和用户滥用的问题。
同时,为了确保安全和迭代,将大规模促进操作员。目前,只有每月支付200美元的美国专业用户才能开放。将来,它将根据用户反馈改进和改进。并将这些功能整合到chatgpt中。
Openai说:“一旦我们对其安全性和可用性充满信心,我们就可以发布大型无缝的真实时间和异步任务执行功能”,并计划尽快宣传操作员模型CUA,以便开发人员可以构建自己的计算机以智能构建自己的计算机;并将继续提高运营商更长,更复杂的工作流的处理能力。
根据《华尔街日报》的报道,OpenAI首席运营官Brad LightCap在接受采访时说,操作员可以帮助用户节省在家和工作中的时间。在这些领域,日常任务可以自动化“巨大的机会”。
值得注意的是,在运营商发布的前一天,国内大型模型公司的智能频谱AI还宣布了最新的Smart GLM-PC v1.1。
根据报道,GLM-PC基于智慧频谱多模型Cogagent,该模型启动了深入思考模式以增加逻辑推理和代码生成功能,还支持Windows系统。能够根据用户的任务需求制定详细的任务计划解决方案,全面分析目标和可用资源,生成路线图,并自动将大型任务分解为可管理的子任务;计划完成后,无需手动干预即可逐步促进任务的完成;在执行过程中,还可以根据新的环境信息进行实时调整,反射校正和自我纠正,并且该解决方案将不断优化。
Openai的竞争对手人类人类之前还启动了“计算机使用”功能,使其智能机构可以使用计算机来完成像人类一样复杂的任务。 Anthropic表示,它可以通过任何软件和实时互联网浏览,选择按钮,输入文本,浏览网站并执行任务来解释计算机屏幕上的内容。
就在今年年初,主要的模型制造商就采取了行动,而2025年为智慧聚会的战斗将注定要更加激烈。