大模型发展新趋势:Agent和MCP(文末送国内首本MCP图书)


大模型发展新趋势:Agent和MCP(文末送国内首本MCP图书)

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

基座模型的快速迭代和大模型价格下降带动了AI产业的繁荣,底层基模的能力边界、工具调用和数据的可连接性、数据的价值挖掘共同决定了Agent的最终呈现效果。
本文将从Agent和MCP的角度,分析下为未来大模型应用开发的趋势和主要的形式,并在文末给大家介绍国内首本MCP图书。
Agent是一个能够自主决策并采取行动的软件系统,它能够观察环境、使用工具,并以目标为导向执行任务。Agent具备以下几个关键特征:
自主性:可以在无人工干预的情况下运行,独立做出决策。
目标驱动:具备主动性,即使没有明确指令,也会推理如何完成任务。
环境感知:能够处理外部输入,如用户请求、传感器数据或数据库信息。
可扩展性:可以整合不同的工具(API、数据库、计算模块等),提升执行能力。
适应性:能根据任务需求调整行为,优化执行路径。
工作流静态,智能体更为动态。根据Anthropic的区分,当任务明确定义,需要可预测性和一致性时,选择工作流。当任务需要灵活性和模型驱动的动态决策时,选择智能体。
特性
工作流(Workflow)
智能体(Agent)
通过预定义流程编排LLM和工具的系统
LLM动态决定自己的处理过程和工具使用的系统
稳定、准确、可预测
解决没有固定流程的开放性问题
为准确性牺牲了解决问题的延迟
无明确局限性(根据描述未提及)
Agent的架构模块的划分主要包含了:感知、记忆、规划、行动四个核心的要素,同时包括定义(管理Agent角色特性)、学习(预训练、小样本学习)、认知与意识(思考、整体认知)等特色模块。
感知:接收输入信息,这个信息可以是用户输入或者是通过传感器在环境中获取信息;
记忆:长期记忆存储与上下文管理,用于处理复杂任务;
规划:任务分解、子任务生成及自我反思;
行动(工具使用):通过API或外部工具增强Agent的能力(如搜索、文件操作,代码执行等)。
规划模块以LLM的推理规划能力为核心。LLM作为Agent的核心决策引擎,它决定Agent如何分析信息、精准的拆解任务、动态推理、做出选择、执行。在此过程中通常会用到各种Prompt框架、多Agent协同、模型微调等方法,来提高LLM推理规划能力。
工具使用模块主要用于扩展Agent访问外部世界的能力。Agent通过访问API、数据库等外部接口,使其能够执行检索、计算、数据存储等操作。通过工具使用,Agent不仅能与外部世界进行实时交互,获取最新信息,还能在特定领域发挥专业优势。
2024年11月,Claude的母公司Anthropic推出了模型上下文协议(MCP),MCP是一种开放协议,提供连接LLM与所需的上下文的一种标准化方式,可以实现LLM应用与外部数据源和工具的无缝集成。
传统开发模式中,大模型调用外部服务需要经历复杂的技术链路:自然语言理解——业务逻辑解析——API调用——结果处理,每个环节都可能产生信息损耗,造成映射模糊、能力黑洞、风险敞口等问题。
MCP统一不同大模型和不同服务之间的协议,MCP主要由Host、MCPClient、MCPServer等组件构成:
Host:内置了MCPClient的应用程序,可以是APP、Agent、Web应用、桌面应用等等形态;
MCPClient:大模型与MCPServer之间的桥梁;
MCPServer:负责处理来自MCPClient的请求,并调用各种资源,返回相应的结果或数据。
工具的调用从最初的fuctioncall到后续的GUI再到目前的MCP,大模型工具获取的能力在不断完善。
MCP主机(位于左侧)是AI驱动的应用程序,例如ClaudeDesktop、一个集成开发环境(IDE)或其他充当代理的工具。主机连接到多个MCP服务器,每个服务器都暴露了一个不同的工具或资源。
MCP服务器就像一个智能适配器,用于连接工具或应用程序。它知道如何将来自AI的请求(例如“获取今天的销售报告”)翻译成该工具能够理解的命令。例如:
一个GitHubMCP服务器可能会将“列出我的开放拉取请求”转换为一条GitHubAPI调用。
一个文件MCP服务器可能会将“将这个总结保存为文本文件”写入到你的桌面。
一个YouTubeMCP服务器可以按需转录视频链接。
在另一端,MCP客户端位于AI助手或应用程序内部(例如Claude或Cursor)。当AI想要使用某个工具时,它会通过这个客户端与对应的服务器进行通信。例如:
Cursor可以使用客户端与你的本地开发环境进行交互。
Claude可能会使用它来访问文件或从电子表格中读取数据。
客户端负责处理所有的来回通信——发送请求、接收结果并将它们传递给AI。
MCP协议是保持一切同步的关键。它定义了客户端和服务器之间的通信方式——消息的格式、动作的描述方式以及结果的返回方式。它非常灵活:
可以在本地运行(例如在你的AI和计算机应用程序之间)
可以通过互联网运行(例如在你的AI和在线工具之间)
使用像JSON这样的结构化格式,以保持一切清晰和一致
由于这种共享协议的存在,AI代理可以连接到一个全新的工具——即使是它从未见过的工具——并且仍然能够理解如何使用它。
如今MCP正成为AI落地的关键基建。但想要真正掌握其设计思想、避坑实践与企业级部署方案,仍需系统化学习——首本MCP深度解析专著《MCP原理与实战:高效AIAgent智能体开发》现已上市!
掌握MCP=掌握AI应用标准化提效密码,企业智能化落地速度翻倍!
9大AI场景,50个实战案例,详细讲解资源、工具、提示模板与双传输层的实现机制。
以Python与Node. js双栈为例,从零开始编写天气与邮件服务器,并在ClaudeDesktop、Cursor、CopilotStudio中完成MCP客户端接入与链路调试,演示如何在30分钟内让大模型读取私有数据、触发真实操作。
#留言领取MCP图书#
#学习大模型&讨论Kaggle#
△长按添加竞赛小助手
每天大模型、算法竞赛、干货资讯
与36000+来自竞赛爱好者一起交流~


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录