“随着 Gemini 家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。”近期,谷歌又朝着打造世界上最实用个人 AI 助手这一目标迈出了重要一步:低调发布了 Deep Research 功能。
Deep Research 能够接收研究提示词、制定研究计划并为用户提供微调选项,之后执行全自动研究。它会扫描数十到数百个信息来源以获取关于查询的信息内容,而后生成关于结果的详尽报告。整个过程需要几分钟,大家可以在 Gemini 运行的过程中先去忙别的。在执行完成之后,生成的报告则可导出为 Google Docs 文档。
这也是 Gemini 强大推理能力的重要首秀,反映出谷歌打造 AI 智能体解决方案的决心与探索。
传统的在线研究工作往往困难重重。设想一下,身为一名研究生,您可能正在为即将到来的机器人演示做准备。您希望了解自动驾驶汽车传感器的发展趋势、检索不同技术的对接方式以及未来的发展方向。像这样的项目往往要耗费数小时进行研究,打开大量页面选项卡并交叉引用其中内容……很多人在过程当中往往会彻底迷失,绝望地翻找刚刚才看到过的链接或者段落。
Deep Research 的作用就是在用户监督之下替人完成这些令人头痛的工作。
在输入问题之后,它会创建一个多步骤的研究计划以供修改或者批准。在批准之后,Deep Research 就会代表用户深入分析来自网络的相关信息。
只需要几分钟的时间,Gemini 就能不断完善其分析结果,以用户熟悉的方式浏览网页:搜索、查找有趣信息,而后根据看到的内容再进行后续搜索。Deep Research 会多轮重复整个过程,并在最终完成后生成一份综合性的发现报告,可供用户导出为 Google Docs 文档格式。
成果文件的内容包含原始来源链接,以供用户后续随时返回相关网站 / 企业 / 组织进行查验。更重要的是,如果还有其他扩展性问题想要了解或者希望进一步完善报告,用户可以直接向 Gemini 提问。“总之,短短几分钟内我们就能完成以往至少耗费数个小时的研究过程。”谷歌表示。
今年早些时候,谷歌分享了将更多智能体功能融入产品的发展愿景,而 Deep Research 正是 Gemini 中首个将这一愿景变为现实的功能。
谷歌打造出一套新的智能体系统,该系统运用谷歌在网络搜索方面的专业知识指导 Gemini 大模型进行浏览与研究。新功能与 Gemini 模型的高级推理能力以及高达 1M 的 token 上下文窗口相结合,最终形成了快速创作实用性强、可读性好的综述性报告的强大能力。
Deep Research 目前已经在桌面及移动 Web 端的 Gemini Advanced(初始只支持英语版本)中推出,且计划在 2025 年初登录移动端应用。目前,谷歌正在更多区域推出这一功能。
根据谷歌在越南和泰国发布的官方博文,Gemini 2.0 Flash Experimental、Gemini 2.0 Experimental Advanced 以及带有 Deep Research 的 Gemini 1.5 现已在区域内推出,允许更多用户访问到 Gemini 家族的这几款最新产品。
Gemini 2.0 Flash Experimental 与 2.0 Experimental Advanced 属于当前生产级版本 1.5 Pro 与 1.5 Flash 的更新版本。根据谷歌的描述,这两款产品分别面向“复杂任务”与“日常协助”场景——从本质上讲,Flash 属于运行速度更快的轻量级模型,而 Pro 在提示词执行方面则表现得更为彻底。
带有 Deep Research 的 Gemini 1.5 则是目前唯一能够执行 AI 深度研究功能的 Gemini 版本。Gemini 1.5 与 Deep Research 现已在包括美国在内的多个区域面向 Gemini Advanced 用户推出,但用户只能在 Gemini Web 应用中访问 Deep Research——iOS 与 Android 版应用程序尚不支持此项功能。如果大家需要在手机端使用 Deep Research,则可以通过 Gemini 的移动 Web 应用进行访问。
Deep Research 发布后,一时间好评如潮。
沃顿商学院生成人工智能实验室联席主任 Ethan Mollick 称赞道,“谷歌新推出的 Deep Research 功能感觉是迄今为止最符合‘谷歌风格’的人工智能应用之一,而且令人印象深刻。我已经使用了一段时间,它几乎可以针对任何主题都提供非常好的初步报告。不过,学术资源的付费墙带来了一些限制。”
AI