Deep Research
构建具备认知与推理能力的智能研究体
Deep Research 是一套基于大语言模型的智能研究框架,围绕一个研究主题,支持结构化、多阶段、可验证的深入探索流程。
借助 MCP(Model Context Protocol)协议,模型可动态接入多源知识、记录推理路径,并输出高质量结构化成果。
核心能力
- 🔌 支持多源上下文接入:网页、数据库、搜索引擎、笔记系统等;
- 🔄 全链路推理记录与演化:每一步都有依据、可复现;
- 📊 结构化研究结果输出:支持 JSON、Markdown、图表、网页;
- 📚 插件化扩展机制:适配不同领域、数据源与研究范式。
工作流概览
1. 研究任务定义
- 用户输入研究主题或问题;
- 系统调用大模型生成结构化研究子任务;
- 步骤示例:信息收集 → 概念对比 → 案例分析 → 洞察总结。
2. 多源信息接入(MCP 插件)
插件名称 | 类型 | 功能描述 |
---|---|---|
Fetch | 网页抽取 | HTML → Markdown,结构化获取网页内容 |
Playwright | 网页交互 | 对网页进行点击、滚动、表单提交等操作 |
Tavily | 搜索增强 | 实时搜索互联网内容,支持领域过滤和重试机制 |
Notebook API | 云笔记系统 | 记录、编辑和检索研究过程中的笔记与总结 |
Pages Deploy | 报告发布 | 生成公开可访问的网页版本研究报告 |
3. 推理链记录与追踪
每一步调研过程均可被结构化记录,包括:
- 输入与模型响应;
- 信息来源与引用地址;
- 关键推理逻辑与结论判断;
- 中断/失败链路,支持自动回溯修正。
{
"step": 2,
"input": "分析 MoE 在推荐系统中的挑战",
"source": "https://arxiv.org/abs/2302.06642",
"output": "主要挑战包括路由器不稳定、冷启动问题及资源冗余...",
"reasoning": "结合三篇论文内容,得出共同痛点"
}
4. 输出研究成果
- 支持 Markdown / JSON / 报表 / 图表等结构化格式;
- 可通过 Pages Deploy 插件一键发布为网页;
- 支持同步到笔记系统或长期知识库;
- 所有结果可回溯、可审计、可迭代。
示例场景:研究“MoE 模型在推荐系统中的可行性”
步骤 | 行动 | 使用插件 | 输出类型 |
---|---|---|---|
1 | 查询 MoE 定义与原理 | Tavily Search | 文档列表与摘要 |
2 | 获取 MoE 在推荐系统的应用案例 | Fetch + Notebook | 案例分析对比表 |
3 | 阅读代表性论文并记录结论 | Playwright + Notebook | 总结 + 关键公式 |
4 | 分析成本、精度、落地挑战等维度 | Notebook + JSON | 表格 + 评分 |
5 | 输出结论并生成在线报告 | Pages Deploy | 网页链接 |
与其他技术对比
能力点 | RAG | Toolformer | Deep Research (MCP) |
---|---|---|---|
上下文获取 | 文本向量检索 | 函数调用辅助 | 多源结构化上下文 |
推理链建模能力 | 弱 | 简单函数轨迹 | 强,完整思维链跟踪与修复 |
插件可扩展性 | 不支持 | 较弱 | 强,支持自定义与社区插件接入 |
研究记忆持久化 | 无 | 无 | 内置 Notebook API 支持长期记忆 |
输出结构化程度 | 限于回答文本 | 限于函数调用结构 | 支持结构化结果(表格、图表、JSON) |
Deep Research 实现(Argo)
使用 LangGraph 实现 Deep Research 的典型流程
1. 生成调研计划
大模型根据输入的研究主题或问题,生成结构化的调研子任务和执行步骤,包括信息收集、分析比较、观点总结等阶段。
2. 人工审核与反馈
用户对自动生成的计划进行审阅与调整,可增删步骤、修改优先级或补充关键关注点,确保研究流程贴合实际需求。
3. 启动自动调研流程
LangGraph 按照最终确认的计划,驱动智能代理通过 MCP 插件访问多源信息(如网页、数据库、笔记系统等),逐步完成每个子任务并记录推理过程。
4. 生成结构化研究报告
聚合各阶段结果,输出包含摘要、数据分析、引用来源与结论洞察的完整报告,支持以 Markdown、JSON 或网页等格式呈现。
Deep Research 使用
以下从AI产品经理角度,生成AI产品日报
1. 生成计划
这一步会根据用户给定的System Prompt,做出相应规划,用户可查看并编辑计 划
2. 开始执行
这一步 Deep Research 会开始执行,按照上述的计划一步步执行,并展示中间结果,如果没有确切的信息源,模型会通过 Tavily 工具搜索并总结
每执行完一步,左边的计划表会实时同步计划执行的情况,用 ✅ 反馈进度
3. 报告生成
总结
Deep Research 不是简单的信息检索工具,而是具备“研究型认知能力”的智能体。
通过 MCP 标准协议、LangGraph 流程编排与丰富插件支持,Deep Research 让每一个人都能构建属于自己的“研究副驾”。