大模型发展新趋势：Agent和MCP（文末送国内首本MCP图书）

发布日期: 2025-05-30

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

基座模型的快速迭代和大模型价格下降带动了AI产业的繁荣，底层基模的能力边界、工具调用和数据的可连接性、数据的价值挖掘共同决定了Agent的最终呈现效果。
本文将从Agent和MCP的角度，分析下为未来大模型应用开发的趋势和主要的形式，并在文末给大家介绍国内首本MCP图书。
Agent是一个能够自主决策并采取行动的软件系统，它能够观察环境、使用工具，并以目标为导向执行任务。Agent具备以下几个关键特征：
自主性：可以在无人工干预的情况下运行，独立做出决策。
目标驱动：具备主动性，即使没有明确指令，也会推理如何完成任务。
环境感知：能够处理外部输入，如用户请求、传感器数据或数据库信息。
可扩展性：可以整合不同的工具（API、数据库、计算模块等），提升执行能力。
适应性：能根据任务需求调整行为，优化执行路径。
工作流静态，智能体更为动态。根据Anthropic的区分，当任务明确定义，需要可预测性和一致性时，选择工作流。当任务需要灵活性和模型驱动的动态决策时，选择智能体。
特性
工作流（Workflow）
智能体（Agent）
通过预定义流程编排LLM和工具的系统
LLM动态决定自己的处理过程和工具使用的系统
稳定、准确、可预测
解决没有固定流程的开放性问题
为准确性牺牲了解决问题的延迟
无明确局限性（根据描述未提及）
Agent的架构模块的划分主要包含了：感知、记忆、规划、行动四个核心的要素，同时包括定义（管理Agent角色特性）、学习（预训练、小样本学习）、认知与意识（思考、整体认知）等特色模块。
感知：接收输入信息，这个信息可以是用户输入或者是通过传感器在环境中获取信息；
记忆：长期记忆存储与上下文管理，用于处理复杂任务；
规划：任务分解、子任务生成及自我反思；
行动（工具使用）：通过API或外部工具增强Agent的能力（如搜索、文件操作，代码执行等）。
规划模块以LLM的推理规划能力为核心。LLM作为Agent的核心决策引擎，它决定Agent如何分析信息、精准的拆解任务、动态推理、做出选择、执行。在此过程中通常会用到各种Prompt框架、多Agent协同、模型微调等方法，来提高LLM推理规划能力。
工具使用模块主要用于扩展Agent访问外部世界的能力。Agent通过访问API、数据库等外部接口，使其能够执行检索、计算、数据存储等操作。通过工具使用，Agent不仅能与外部世界进行实时交互，获取最新信息，还能在特定领域发挥专业优势。
2024年11月，Claude的母公司Anthropic推出了模型上下文协议(MCP)，MCP是一种开放协议，提供连接LLM与所需的上下文的一种标准化方式，可以实现LLM应用与外部数据源和工具的无缝集成。
传统开发模式中，大模型调用外部服务需要经历复杂的技术链路：自然语言理解——业务逻辑解析——API调用——结果处理，每个环节都可能产生信息损耗，造成映射模糊、能力黑洞、风险敞口等问题。
MCP统一不同大模型和不同服务之间的协议，MCP主要由Host、MCPClient、MCPServer等组件构成：
Host：内置了MCPClient的应用程序，可以是APP、Agent、Web应用、桌面应用等等形态；
MCPClient：大模型与MCPServer之间的桥梁；
MCPServer：负责处理来自MCPClient的请求，并调用各种资源，返回相应的结果或数据。
工具的调用从最初的fuctioncall到后续的GUI再到目前的MCP，大模型工具获取的能力在不断完善。
MCP主机（位于左侧）是AI驱动的应用程序，例如ClaudeDesktop、一个集成开发环境（IDE）或其他充当代理的工具。主机连接到多个MCP服务器，每个服务器都暴露了一个不同的工具或资源。
MCP服务器就像一个智能适配器，用于连接工具或应用程序。它知道如何将来自AI的请求（例如“获取今天的销售报告”）翻译成该工具能够理解的命令。例如：
一个GitHubMCP服务器可能会将“列出我的开放拉取请求”转换为一条GitHubAPI调用。
一个文件MCP服务器可能会将“将这个总结保存为文本文件”写入到你的桌面。
一个YouTubeMCP服务器可以按需转录视频链接。
在另一端，MCP客户端位于AI助手或应用程序内部（例如Claude或Cursor）。当AI想要使用某个工具时，它会通过这个客户端与对应的服务器进行通信。例如：
Cursor可以使用客户端与你的本地开发环境进行交互。
Claude可能会使用它来访问文件或从电子表格中读取数据。
客户端负责处理所有的来回通信——发送请求、接收结果并将它们传递给AI。
MCP协议是保持一切同步的关键。它定义了客户端和服务器之间的通信方式——消息的格式、动作的描述方式以及结果的返回方式。它非常灵活：
可以在本地运行（例如在你的AI和计算机应用程序之间）
可以通过互联网运行（例如在你的AI和在线工具之间）
使用像JSON这样的结构化格式，以保持一切清晰和一致
由于这种共享协议的存在，AI代理可以连接到一个全新的工具——即使是它从未见过的工具——并且仍然能够理解如何使用它。
如今MCP正成为AI落地的关键基建。但想要真正掌握其设计思想、避坑实践与企业级部署方案，仍需系统化学习——首本MCP深度解析专著《MCP原理与实战：高效AIAgent智能体开发》现已上市！
掌握MCP=掌握AI应用标准化提效密码，企业智能化落地速度翻倍！
9大AI场景，50个实战案例，详细讲解资源、工具、提示模板与双传输层的实现机制。
以Python与Node. js双栈为例，从零开始编写天气与邮件服务器，并在ClaudeDesktop、Cursor、CopilotStudio中完成MCP客户端接入与链路调试，演示如何在30分钟内让大模型读取私有数据、触发真实操作。
#留言领取MCP图书#
#学习大模型&讨论Kaggle#
△长按添加竞赛小助手
每天大模型、算法竞赛、干货资讯
与36000+来自竞赛爱好者一起交流~