传统搜索的终章?信息检索正走向“Agentic Deep Research”新时代
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
OpenAI
这些迹象共同揭示:人们不再满足于搜索关键词+翻网页,而是希望AI能主动调研、分析、整合、最终给出结论。传统搜索的时代,正在发生一场系统性的变革。
范式演进:从WebSearch到AgenticDeepResearch
研究与社区热度:范式跃迁的强劲动能
学术层面DeepResearcher、Search-R1、R1-Searcher等论文在2025年密集发布,重点探讨推理-检索协同与强化学习代理。
开源生态DeepSearcher、DeerFlow、ODS、WebThinker……多款项目数周内斩获千星;论文统计显示DeepResearch相关库的star曲线显著高于传统RAG项目。
方法论精要:三大技术支柱
ReasoningLLM:奠基性推理能力
DeepSeek-R1、OpenAIO1等模型通过多阶段微调与RL提升了数理推理、任务分解和自省能力,是DeepResearch能够实现的核心基础。它们能够在没有检索的情况下先行制定查询计划,为后续搜索提供结构化指令。
学会“search”的LLM代理:强化学习驱动
单靠模板Prompt与监督微调不足以应对开放环境;RL在封闭API或真实Web环境中提供试错信号。从ReAct->WebGPT->Search-R1/R1-Searcher:将“检索正确率+解释透明度”写入奖励函数。DeepResearcher:在真实浏览器环境中学习点击、滚动、提问等操作,逐步逼近人类研究流程。模型不依赖静态提示,而是能自主探索外部世界、动态调整策略。
Test-TimeScalingLawforDeepResearch
论文提出的TTSLaw假设:推理深度(内部知识推理)与检索轮次(外部知识探索)在给定token预算内存在可预测的线性增益与权衡。如任务偏事实:应投入更多token于检索;对应任务偏逻辑:应留足链式推理空间。为未来系统设计提供“预算分配指南”,也为云端部署节省成本。
未来展望:面向下一代AgenticDeepResearch
可信的Human-in-loop系统:后续系统需把人类反馈融入关键检索-推理环节,引入细粒度的访问控制、证据核查与交互式校正界面,从而在保证自动化效率的同时,实现输出过程的可解释、可追溯与责任分担。
垂直领域专家级深研:医学、法律、生命科学等高门槛场景要求专业数据库构建和领域范式对齐。未来代理需对接分散的领域资料库,适配专业推理范式(如法律判例推理、医学假设验证),以生成高可信度的专家级研究结果。
结构化-组织型深研系统:将检索与推理过程中的中间产物显式转化为图结构,有助于在长上下文内保持信息一致性,并为多智能体协同提供高效的消息传递通道。这既提升单代理的逻辑连贯性,也为多代理协作奠定数据基础。
从文本到多模态的信息融合:真正的人类研究能力依赖跨文本、图像、视频及结构化数据的综合分析。未来工作需解决跨模态语义对齐、冲突信息消解和大规模异构数据检索三大难题,为深研代理注入视觉-语言-多模态一体化认知能力。
高效Test-TimeScaling与资源自管理:随着推理深度与检索广度的持续扩张,落地必须在固定token预算内自适应分配计算资源。研究方向包括:小模型能力迁移、潜在推理压缩、检索预算动态调度,力求在性能与成本之间取得可量化的最优平衡
推荐阅读
•动手设计AIAgents:(编排、记忆、插件、workflow、协作)
•DeepSeekR1+Agent的下半场
•单智能体(Agent):企业员工AI助理
•Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1. 2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。