AI 智能体迎来了新的参与者!Grok 3 推出了 DeeperSearch 功能,这一功能提升了 DeepSearch 的搜索能力,能够更加深入地分析复杂的主题。在免费放开 Deep Research 功能之后,Gemini 2.0 公布了研究智能体的 6 大使用技巧。2025 年度的 Agent 大战开始了!
2025 年发生了 Agent 大战。Deep Research 的“研究智能体”率先开始行动。
谷歌 Gemini 第一个登场,接着 OpenAI 和 Perplexity 等也陆续推出了它们各自的同名功能。
Grok 是个例外。与 Grok 3 一同发布的是“DeepSearch”。这里没有“Research”,只有“Search”。
昨天,有趣的是,Grok 推出了全新的功能。这个功能是「DeeperSearch」,并且悄无声息地推出了。
在 Grok 网页中,点击 DeepSearch 的小箭头,这样的话,免费用户也能够使用 DeeperSearch。
DeeperSearch 和 Deep Research 进行比较,不能说二者完全相同,至少在 AI 领域的表现就如同 Cosplay 一样,有着相似之处却又不完全一样。
GrokDeeperSearch
Gemini Deep Research
现在借助 AI 的 Deep Research 或者 DeeperSearch,能够去探索复杂的主题,并且可以以全面且详细的报告形式将研究成果呈现出来。
接下来,让我们深入了解一下怎样才能更高效地使用 Deep Research 或 DeeperSearch 的技巧吧。
DeeperSearch试用
Grok 是 X 内置的 AI 模型。DeeperSearch 对过去 48 小时 X 上的热点 AI 资讯进行了搜索。搜索效果的确不错。
不过,不是每次体验都很流畅。
Casper Hansen 从事 NLP 研究,他表示:“Grok DeeperSearch 创造了新的纪录。在进行纯搜索和思考时,时长达到了 16 分钟。”
搞笑的是,在思考过程里,DeeperSearch 很像是人的自言自语。例如会说:“我在想,搜索****可能会太模糊。”
现场开盒匿名网友
从事预测研究的 Sam Atis 直接向 Grok 的 DeeperSearch 提出了以下问题:
你能否找出 Sam Atis 是谁呢?我想知晓撰写 Samstack.io 的那个人的真实身份。
同样的问题,Grok 的 DeeperSearch 能够认出 Sam Atis 的真实身份,然而 DeepSearch 却没有得到正确答案。
DeeperSearch 查出了他之前工作过的一个地方,这个地方是一家非常小的 NPO。接着,它检查了那里所有工作人员的背景,发现这些背景与他在 UCL 学习政治学的事实是相符的。
Sam Atis 测试了一个问题,即“你能找到[人物]的 Reddit 账号吗?”,这里的[人物]是针对他所认识的人,并且测试结果非常成功。
DeeperSearch 从一篇文章中正确推断出了匿名账户的真实身份,尽管它与 Reddit 账号之间没有明显联系。
这让 Sam Atis 产生了这样的猜测:不久之后,使用化名的那些作者将不再安全,有很多人都能够被 LLM 识别出来了。
如果真的在乎个人隐私,这的确令人担心。
AI也被问烦了
网友 Nathan Clement 向 DeeperSearch 询问了关于智能体协议 MCP 的问题,这个问题使得 Grok 3 陷入了沉默。
Grok 3 对提问进行了分析,分析时间长达 5 分钟 47 秒。在这个过程中,它找到了 10 个网页。然而,它并没有生成报告中的任何一句话,而是直接显示无法完成回复。
Nathan Clement 猜测,有可能是 DeeperSearch 被 MCP 问题给问得有些厌烦了。
实测:速度有些慢
打开 Grok 3 的 DeeperSearch 功能,然后发送提示,内容为:总结一下深度研究功能的进展。
DeeperSearch 对 46 个信息来源进行了查询,其中包括 10 个网站,整个查询过程耗时 37 分钟 37 秒,最终完成了相关报告。
然而,Grok 3只总结了OpenAI的深度研究功能进展。
全球范围内,谷歌 Gemini 首次推出了 Deep Research 功能,且该功能在持续更新;而 xAI 的类似功能并未被纳入考量。
毫无疑问,关键引用全是OpenAI的消息。
DeeperSearch:不只是搜索
Denis Labelle 热衷于 xAI,他在 X 上分享了能够充分利用 DeeperSearch 的经验。
DeeperSearch增强了下列3项功能:
具备广泛的查询处理能力,能够收集关于 Grok 3 高级功能的全面信息,并且表现得很完美。
个性化洞察:能够根据查询意图调整回复内容。
实时进行集成操作,能够获取到最新的数据,例如可以随时知晓关于 Grok 3 的相关讨论的最新情况。
1. 从一般查询入手,进行初步研究
DeeperSearch 运用先进的算法,能够迅速地给出多种且符合上下文的搜索结果。
如何操作:提出关于Grok 3功能的高层次问题。
示例:「Grok 3的主要高级功能有哪些?」
你会获得关于 DeeperSearch 的详细概述,也会获得关于 Think 模式的详细概述,还会获得关于实时数据集成的详细概述。
2. 利用Think功能进行深入分析
提炼Grok 3的高级功能要点。
评估信息的可靠性。
查找明确需要进一步探索的领域。
操作步骤:
运行一个名为 DeeperSearch 的查询,查询的内容是:“Grok 3 的高级功能有哪些?”
切换到 Think 模式:总结 Grok 3 的高级功能;指出可能缺失的细节。
根据生成的结果,优化你的下一步查询
3. 设计精准提示词,获取深入见解
明确你的需求,聚焦特定信息
请求分析,而不仅仅是事实罗列
表达清晰、简洁
示例:
研究它怎样应对复杂的关于高级特性的查询。
评估 Grok 3 的实时数据集成功能对增强其高级特性所起到的作用。
4. 使用透明度功能验证结果
理解逻辑:查看AI如何解读Grok 3的高级功能
发现错误:识别潜在的偏见或不准确之处
建立信任:确认输出结果的可靠性
操作步骤:
获得结果之后,切换“思考”(think)这个选项,从而查看 AI 的推理步骤。
检查关于Grok 3功能声明的一致性
如有必要,调整你的问题
5. 采用迭代式工作流程
DeeperSearch 模式是从对 Grok 3 高级功能的一般性查询开始的。
Think模式:分析结果并找出遗漏之处
再次切换到 DeeperSearch 模式,会对查询进行优化,并且深入挖掘信息。
重复上述过程,直到满意为止。
示例:
「Grok 3的高级功能有哪些?」
「响应列出了功能,但缺乏对局限性的详细说明。遗漏了什么?」
Grok 3 的高级功能有哪些局限性呢?比如 DeeperSearch 有哪些局限性?
高效prompt推荐
分析 Grok 3 的 DeeperSearch 功能是怎样增强它的高级功能集的。
评估 Grok 3 的 Think 模式在其高级功能方面的有效性。
评估 Grok 3 作为高级功能的实时数据集成功能的劣势。
分析 Grok 3 的 DeeperSearch 在详细阐述其高级功能时的准确程度。
确定 Grok 3 的高级功能是怎样的,比如 DeeperSearch,以及这些高级功能如何对 AI 研究提供支持。
总结 Grok 3 的透明性功能,例如 Thoughts 开关,在其高级功能方面所具有的优势。
「预测Grok 3的高级功能基于当前能力可能如何发展。」
分析 Grok 3 的 DeeperSearch 具有的潜力,它将成为未来版本中领先的高级功能。
谷歌Deep Research的6大技巧
Gemini 的高级产品经理 Aarush 曾有过为孩子寻找合适夏令营的想法。通常,这需要打开很多个浏览器标签页,然后把所有重要信息整理到一个文档里。
Aarush 想到开发一个 AI 系统,这个系统能够研究所有相关信息,还能创建报告。Mukund 是一名软件工程师,他也有这样的想法。
团队经过几周进行了原型设计,之后他们做到了。以下这 6 个是使用的小技巧。
Gemini 深度研究现在对所有人开放了,并且增添了新的功能,那就是音频概述功能。
先看这任务需不需要深度研究
如果你要做一件事,需要花费大量的时间去浏览网页,并且还得打开很多的标签页,那么深度研究就会显得特别有作用。
Deep Research 能够帮助你从对某个主题一无所知的状态,转变为对其能够透彻了解的程度,它是你的得力助手。
但要是想马上得到一个简单快速的答案,可能用不着深度研究。
比如说,想要对“金融科技”是什么有个简单的了解,直接运用 Gemini 所具备的默认聊天功能就可以了。
如果你是个风险投资人,要与一家金融科技初创公司见面,并且希望快速了解行业最新趋势,那么在这种情况下,深度研究就能够发挥很大的作用。
从简单直白的问题问起
虽说叫「深度」研究,但不意味着一开始提问就得绞尽脑汁。
别想太复杂。你随时都可以修改问题。在开始进行深度研究并开始干活之前,它会把研究计划展示给你看。如果觉得不合适,还能够按照自己的想法进行调整。
只要选择“编辑计划”选项,用通俗易懂的话告知它需要添加的内容,或者更改研究方向就可以了。
不必非得是提问高手,只要明确说出最终目标即可,例如“我想给 10 岁的孩子在纽约找一个超棒的夏令营”,之后的深度研究就会为你完成。
顺着报告内容追问细节
拿到报告后,或许能发现一些特别的细节,此时 Aarush 建议继续追问。
在聊天窗口中输入问题后,深度研究的情况如下:如果有之前的研究,就会马上给出答案;如果没有之前的研究,就会去网上找找更多信息。
在报告生成之后,能够让深度研究增添新内容,并且会立即更新报告。
比如,要求它在报告中添加夏令营费用的信息,深度研究就会去寻找相关信息,接着将其添加到报告里。
看看相关链接
Gemini 在忙于研究和写报告的时候,界面上存在两个选项,一个是“显示思考过程”,另一个是“浏览过的网站”。
点击“显示思考过程”后,就能够看到它写出报告的一步步过程。
这两个选项都会将深度研究所用到的网站列出。其中,“浏览过的网站”会把网站罗列出来,然而却不会讲述具体的研究过程。
在等待报告的时候,如果有哪个网站吸引了你,那么你只需点击一下,就可以在新的标签页中将其打开。
这是发现新网站的一个好办法。如果自己去寻找,或许根本就无法发现这些网站。
用深度研究解决身边的问题
深度研究特别擅长本地化搜索,能帮你找到周边的信息。
如果想要对自己居住的社区有更多的了解,或者想要找本地商家来完成一个较为复杂的家庭项目,那么不妨去进行深度研究。
还有一个较为实用的场景,即让它来策划活动。例如举办晚餐聚会或者生日派对,通过深度研究来探寻本地资源。
生成音频报告,或者导出文档
因为本周的更新,现在能给报告生成音频概述了。
音频概述功能最初是在 NotebookLM 中被推出的。用户能够聆听两个 AI 主持人进行讨论以及对上传的信息进行解读。
现在深度研究也有这功能啦!
报告完成之后,在其右上角可以看到一个切换按钮,这个按钮有好几个选项,其中一个选项是能够生成音频概述。
它会像播客一样,把报告内容给你讲一遍。
这样一来,听音频的时候可以同时做其他事情,并且出门在外也能够听。如果您觉得听比看更容易理解,那么这个功能是非常适合您的。
在网页上能听,在手机上也能听。分享很方便,下载也很方便。还能够把报告导成文档。
Mukund 表示,他要是觉得这份报告特别好,就想自己再改改,之后把它发给别人,让别人也提提意见。
在将报告导成文档时,对于深度研究所引用的所有资料,这些资料都会被列在参考文献部分。
如果想要把东西打印出来进行查看,亦或是在上面进行书写和绘画,那是完全可以的。对于那些习惯于在纸质文件上做标记的人而言,这着实非常实用!
参考资料:
本文源自微信公众号“新智元”,作者是新智元,36 氪获得授权后进行了发布。