1月23日,当地时间,OpenAI发布了AI情报运营商,该操作员可以独立使用网站购物和订购餐厅。 1月23日,北京时间,国内明星AI公司的智能光谱还推出了一个新的多模式智能车身新版本的GLM-PC,该版本可以操作计算机,该计算机可以自动购物,查询航班和购买门票。
“ 2025将是智能机构将扮演角色的一年。现在,每个人都主要使用chatgpt来回答问题。您问一个问题,并给出答案。但是到2025年,Chatgpt将在真实的现实世界中开始世界为您做的事情。
Openai首席产品官Kevin Weil在达沃斯世界经济论坛上接受了采访。 (03:02)
操作员自主完成网站购物和订购餐厅
聊天机器人可以回答问题,写诗并生成图像,但是Smart(Agent)可以在Internet上使用其他软件。人工智能研究人员称此类技术AI智能。
“运营商可以像您和我一样浏览网站并在网站上采取行动。” OpenAI产品与工程主任Yash Kumar说。
这次推出的操作员是由一种名为“计算机使用代理”(CUA)的新模型激励的。 CUA将GPT-4O的视觉能力与增强学习的高级推理相结合。训练后,它可以与图形用户界面进行交互。
操作从人们如何使用电子桌,购物网站和其他在线服务中学习。确定这些数据中的模式后,操作员可以代表用户使用类似的服务。外观类似于聊天机器人,例如chatgpt。用户在小窗口中输入请求。系统将响应。操作员打开Web浏览器并访问特定网站。
根据《纽约时报》的说法,操作员可能会犯错,但在某些情况下可以纠正错误。操作员不是完全自主的,有时用户需要提供其他请求和建议。用户必须为在线订购平台等网站提供其私人用户名和密码。
从星期四开始,每月200美元的200美元订阅费可以使用运营商。 OpenAI计划通过其他付费服务提供该工具,并最终将其纳入免费版Chatgpt。库马尔还承认,与其他聊天机器人(例如Chatgpt)相比,操作员仍然是一项实验技术,但他说,在未来几个月中,它将继续改善。
Openai表示,它正在与Doordash,American Lakeaway送货服务平台,Instacart,American Gobery分销平台,Opentable,Uber Application Uber和美国旅游服务网站Priceline等公司合作,以确保运营商尊重已建立的规范,同时满足现实世界。需要。
在2025年,多智能系统将降落在申请侧
在2025年人工智能的十大技术趋势的预测中提到的北京齐尤恩人工智能研究所在2025年更强调的是Agentic AI的代理商中更加强调的是,在2025年将更多的智能。 High是了解业务流程的多智能系统位于应用程序方面。
目前,国内外的大型模特公司已经赌注了AI Smart。去年年底,Google根据Google的Big Model Gemini 2.0推出了智能水手,可以浏览电子桌,购物网站等,以帮助用户填写虚拟购物车。
在中国,智能频谱AI公司北京时间于1月23日推出了一个新的多模式智能新版本的GLM-PC,该版本可以操作计算机。它以代码的形式命令工作流程和工具调用,从而加强了深度思考模式和深入思考模式的计划和推理。反射能力可以稳定并有效地应对复杂的场景和任务。
GLM-PC可以像人类一样可以“观察”和“操作”计算机,以帮助用户完成各种类型的计算机任务。以产品信息为例,GLM-PC可以在图片中自动提取产品数据,将其存储以表现出色,并将产品自动添加到Taobao购物车中,从而获得一站式购物过程。在帮助用户处理小红皮书上的“春节电影”信息时,GLM-PC可以快速查找并提取相关数据,并将代码写入计算机上。如果生成的代码生成的错误,则可以根据错误消息自行自行自我。它还可以迅速询问用户的飞行信息,筛选最经济的门票,并同时设立飞行日历,以实现一项停滞的服务,以进行飞行查询和购买票证。
智能运动团队的技术人员告诉Surging Technology,他希望该情报能够在2025年更好地嵌入现有的工作流程和生活流程,每个人都可以得到24小时的全日制秘书。
大型国内模型公司Minimax认为,2025年将是快速发展情报的关键年。无论是单个智能系统还是多智能身体系统,更长的上下文都需要支持连续内存和大量通信。该公司推出的Minimax-01系列模型是满足这一需求,并迈出了建立复杂的智能基本功能的第一步。
前首席科学家兼安全超级智能公司的共同创始人伊利亚·萨特克弗(Ilya Sutskever)预测,下一代模型将在下一代模型中“实现代理”。这将是富有成效的,并具有更深的理解和自我意识。人工智能将像人类一样理解。