清华LeapLab开源cooragent框架:一句话构建您的本地智能体服务群
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
本文由清华黄高教授团队完成,第一作者王政是清华MEM工程管理硕士,SeamLessAI创始人,曾任爱奇艺虚拟机云平台负责人,小红书商业化算法工程团队负责人。
刚刚,清华大模型团队LeapLab发布了一款面向Agent协作的开源框架:Cooragent。
你只需要说一句「咒语」:「创建一个AI情报收集秘书,为我收集最新的AI进展。」
魔法就会产生,Cooragent就会根据你的个人偏好生成你专属的AI情报收集秘书,每天自动浏览网页,收集最重要的情报,总结成你喜欢的图文文档发送给你。
更有趣的是你创造的智能体之间自动组合,创造出无限可能。当然,你还可以将你的智能体发布到社区中,与其他人共享。
项目链接:https ://github.com/LeapLabTHU/cooragent
Cooragent实际上成为了智能体落地的「最后一公里」。虽然智能体技术层出不穷,但是对于大众来说,智能体的使用门槛依然很高,很难落地。
拿写作智能体为例,通用的写作智能体很难满足不同人的个性化需求,而定制化的智能体开发流程又过于复杂,导致智能体很难落地到每个人的生活和工作中。
Cooragent通过对话生成可协作的智能体,其本质一种可编辑的AGI-即让智能体通过AGI的方式产生,但同时可以随时保持其可编辑性,与人协作,让智能体真正落地到每个人的生活和工作中。
从Agent技术层面来看,Cooragent是一个基于Agent的协作框架。通过动态上下文理解与自主归纳能力,Cooragent彻底摒弃了传统Agent框架对人工设计Prompt的依赖。
系统利用深度记忆扩展和实时环境分析,自动生成高精度任务指令,显著降低使用门槛并提升智能体的适应性。它允许你通过一句话创建一个具备强大功能的智能体,并与其他智能体协作完成复杂任务。
Cooragent由两种工作模式:AgentFactory和AgentWorkflow。
AgentFactory模式下,你只需要你对智能体做出描述,Cooragent就会根据你的需求生成一个智能体,系统的会自动分析用户需求,通过记忆和扩展深入理解用户,省去纷繁复杂的Prompt设计。Planner会在深入理解用户需求的基础上,挑选合适的工具,自动打磨Prompt,逐步完成智能体构建。智能体构建完成后,可以立即投入使用,但你仍然可以对智能体进行编辑,优化其行为和功能。
AgentWorkflow模式下你只需要描述你想要完成的目标任务,Cooragent会自动分析任务的需求,挑选合适的智能体进行协作。Planner根据各个智能体擅长的领域,对其进行组合并规划任务步骤和完成顺序,随后交由任务分发节点publish发布任务。各个智能领取自身任务,并协作完成任务。
Cooragent可以在两种模式下不断演进,从而创造出无限可能。
Prompt本身越来越成为一种负担。Prompt设计需要考虑的因素太多,用户很难在短时间设计出合适的Prompt。Cooragent采用Prompt-Free设计,通过Agent的协作,深入理解上下文,自主归纳环境因素,自动生成Prompt,从而省去Prompt设计。
Cooragent坚信开放与安全的力量,因此我们选择采用极其宽松且商业友好的MITLicense进行开源。这种彻底的开放性旨在最大限度地降低使用门槛,并激励社区成员共同参与创新与贡献,共建繁荣的智能体生态。
更重要的是,Cooragent提供了一键本地部署的能力。用户可以通过极其简单的步骤,在自己的个人电脑或私有服务器上快速部署和运行整个系统。这不仅极大地简化了安装配置过程,让用户能够迅速上手体验,更从根本上解决了数据安全和隐私的顾虑。
通过本地部署,用户所有数据——包括智能体配置、交互历史、处理内容等——都将完全保留在您自己的设备上,用户对自己的数据拥有绝对的控制权,无需担心数据泄露或被第三方平台滥用的风险。
开发者友好【Cli+MCP】
Cooragent提供了一系列开发者工具,帮助开发者快速构建智能体。通过CLI工具,开发者可以快速创建,编辑,删除智能体。CLI的设计注重效率和易用性,大幅减少了手动操作的繁琐,让开发者能更专注于智能体本身的设计与优化。
通过MCP工具,开发者可以快速链接MCP社区,获取最新的工具。开发者可以浏览和获取由官方或社区贡献的预构建智能体模板、功能组件、工具插件、数据集或优化过的模型,将自己开发的优秀智能体、工具或组件发布到MCP,与其他开发者共享,共同建设生态。
Cooragent不仅仅是一个强大的智能体构建和协作框架,它更开创性地提出了一个全新的社区概念:一个人与Agent共同参与、互动、贡献的生态系统。这超越了传统开发者社区仅限于人际交流的模式,将智能体本身也视为社区的一等成员。
这种「人机共融」的社区模式打破了传统软件生态的边界。它不仅加速了知识的创造和传播,激发了前所未有的协作模式,更让智能体真正「活」了起来,从单纯的工具转变为社区中积极的参与者和贡献者。Cooragent致力于构建这样一个充满活力、互相赋能的未来社区,让人类和他们创造的智能体共同塑造一个更加智能、高效的世界。
让我们通过几个例子来一起看看Cooragent的神奇之处。
「咒语」:构建一个漫画师和一个剧本创作师,让他们协作完成一个漫画:一个小男孩在森林里迷路,遇到了一只小狗,他们一起努力走出森林。
「咒语」:为我创建一个AI前沿科技追踪秘书,整理AI前沿科技信息,形成文字和图表汇报给我。
使用Cli工具
pythoncli.py
一句话创建小米股票分析智能体
run-tagent_workflow-m’创建一个股票分析专家agent,分析过去一个月的小米股票走势,并预测下个交易日的股价走势,并给出买入或卖出的建议。’
使用一组智能体协作完成复杂任务
run-tagent_workflow-m’综合运用任务规划智能体,爬虫智能体,代码运行智能体,浏览器操作智能体,报告撰写智能体,文件操作智能体为我规划一个2025年五一期间去云南旅游的行程。首先运行爬虫智能体爬取云南旅游的景点信息,并使用浏览器操作智能体浏览景点信息,选取最值得去的10个景点。然后规划一个5天的旅游的行程,使用报告撰写智能体生成一份旅游报告,最后使用文件操作智能体将报告保存为pdf文件。’
Cooragent从一开始就将数据主权和部署灵活性作为核心设计原则。我们深知,对于许多企业和个人用户而言,能够完全掌控自己的数据、在私有环境中安全运行是至关重要的。因此,Cooragent的整体架构都围绕着「私有化优先」的理念进行构建。
核心引擎本地运行:Cooragent的核心调度、任务规划、Agent管理和执行引擎均设计为在用户本地环境(个人电脑、私有服务器或内部网络)运行。它不强制依赖任何外部云服务来执行其基本功能,确保了操作的独立性和自主性。
数据不出域:所有的用户数据,包括但不限于:
智能体的配置和定义
用户与智能体的交互历史和日志
智能体处理和生成的内容
连接的本地工具或数据源信息
Cooragent在设计上追求极致的开放性和兼容性,确保能够无缝融入现有的AI开发生态,并为开发者提供最大的灵活性。这主要体现在对Langchain工具链的深度兼容、对MCP(ModelContextProtocol)协议的支持以及全面的API调用能力上。
深度兼容Langchain工具链:
平滑迁移与整合:如果您已经有基于Langchain开发的应用或组件,可以更轻松地将其迁移或整合到Cooragent框架中,利用Cooragent提供的协作、调度和管理能力对其进行增强。
超越基础兼容:Cooragent不仅兼容Langchain,更在其基础上提供了如AgentFactory、AgentWorkflow、原生A2A通信等高级特性,旨在提供更强大、更易用的智能体构建和协作体验。您可以将Langchain作为强大的工具库,在Cooragent的框架内发挥其作用。
支持MCP(ModelContextProtocol):
标准化交互:MCP定义了一套规范,用于智能体之间传递信息、状态和上下文,使得不同来源、不同开发者构建的智能体能够更容易地理解彼此并进行协作。
高效上下文管理:通过MCP,可以更有效地管理和传递跨多个智能体或多轮交互的上下文信息,减少信息丢失,提高复杂任务的处理效率。
增强互操作性:对MCP的支持使得Cooragent能够更好地与其他遵循该协议的系统或平台进行互操作,构建更广泛、更强大的智能生态系统。
全面的API调用支持:
Cooragent的核心功能几乎都通过全面的API(RESTfulAPI)暴露出来,为开发者提供了强大的编程控制能力。
程序化管理:通过API调用,您可以自动化智能体的创建、部署、配置更新、启动/停止等全生命周期管理。
任务集成:将Cooragent的任务提交和结果获取能力集成到您自己的应用程序、脚本或工作流引擎中。
状态监控与日志:通过API获取智能体的实时运行状态、性能指标和详细日志,方便监控和调试。
构建自定义界面:利用API,您可以为Cooragent构建自定义的前端用户界面或管理后台,满足特定的业务需求和用户体验。
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com