发布信息

OpenAI发布AI代理工具Operator:ChatGPT Pro用户可体验全新AI生产力里程碑

作者:软荐小编      2025-01-24 14:01:11     138

American Startup Openai突然在周四举行了实时广播,并发布了第一个AI代理工具的漫长的市场,这意味着操作员(意思是操作员),该工具可以代表用户执行基于Web的操作。

简单地说明操作员可以使用像人类这样的网络浏览器。

与聊天机器人“问句子和答案”不同,AI代理可以根据设置的设置在有限的人类监督下完成任务。它通常也被视为AI生产率的下一个里程碑。在通用人工智能(AGI)的Openai的五个步骤中,AI代理是聊天机器人和推理机器人后的第三步,也是新的一步。

山姆·奥特曼(Sam Altman)介绍,从周四开始,美国Chatgpt Pro用户(每月支付200美元)将能够使用“研究预览版”运营商。将来,它将扩展到更多领域的Pro用户,几个月后,Chatgpt Plus用户也可以使用它。同时,将在接下来的几周和几个月内发布更多的AI代理。

_怎么用代理打开网页_浏览器网页代理

什么是操作员?

操作员是由一种名为CUA(计算机使用代理)的新模型驱动的,结合了GPT-4O的视觉能力,以及通过增强学习来实现的高级推理。操作员可以“查看”网页(屏幕截图),并使用鼠标和键盘允许的所有操作与网页进行交互。如果您在操作中遇到困难,则该模型将调用纠正自身的推理能力。如果问题仍然无法解决问题,则控制控制权将退还给人类。

怎么用代理打开网页__浏览器网页代理

要了解这一新事物,您必须依靠新鲜和生动的案例。

操作员的界面类似于聊天机器人Chatgpt。最大的区别是调用“ AI代理”来完成用户的命令。

在示范案例中,要求运营商预订一家餐厅。用户只需要在对话框中输入“今晚19点的XX酒店”,然后AI代理将自己打开网页,输入预订网站,搜索餐厅并完成预订。

_怎么用代理打开网页_浏览器网页代理

如果已经预订了用户所需的时间,AI会问:“ 19:00的桌子完成了,而桌子在19:45还在那里,您想订购吗?”

在另一种情况下,用户将购物清单上传到了杂货店,例如“鸡蛋,菠菜和蘑菇”,该杂货要求运营商购买蔬菜网站进行操作。然后,AI将打开浏览器,一一搜索列表并加入购物车。

怎么用代理打开网页_浏览器网页代理_

完成任务后,操作员将告诉用户需要多少钱以及骑手交付的时间,然后将浏览器的控制权归还给人类。

浏览器网页代理__怎么用代理打开网页

OpenAI还提醒用户,尽管运营商已经是市场上最强大的AI代理,但它仍然比人类差得多。例如,在使用浏览器的基准测试中,OpenAI CUA模型可以获得58.1%的分数,但人类的水平可以达到78%。因此,这项新技术仍然可能犯错,但在接下来的几个月中,它将继续改善。

浏览器网页代理__怎么用代理打开网页

_怎么用代理打开网页_浏览器网页代理

大量信息和准确的解释,全部在Sina Finance应用程序中

相关内容 查看全部