仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
OpenAI在通向AGI(通用人工智能)的五大阶段中,将「组织级」智能列为最终目标:即AI能像一个组织般管理复杂流程、决策高层任务、协调大规模操作。近两年来,大量多智能体系统(Multi-AgentSystems,MAS)研究陆续涌出,不断朝这这一里程碑迈进。
为了推动该领域加速健康发展,由上海交通大学、上海AI实验室、牛津大学、普林斯顿大学、Meta等十个机构联合推出的MASLab,带来首个统一、全面、研究友好的大模型多智能体系统代码库:
论文地址:https ://arxiv. org/pdf/2505. 16988
代码地址:https ://github. com/MASWorks/MASLab
「一键横评」「快速上手」「复现无忧」
你是否也曾:
看了几十篇MAS论文,却发现代码实现千差万别?
打开一个MAS项目的仓库,一眼望去配置乱、接口杂?
想尝试复现或二次开发,但总是无从下手,Debug到天亮?
那你一定不能错过MASLab!
🧠MASLab有多好用?
MASLab统一化集成了超过20种主流MAS方法,涵盖过去两年内各大顶会的成果、多个领域、多种任务类型。并且每种方法都经过研究者们逐步输出比对,确保过程和结果严格遵循原始实现!
三大核心特性,一次到位:
✅方法全:包含AgentVerse、ChatDev、LLMDebate、AFlow、MAS-GPT等20多种多智能体方法,为广大研究者省去复现烦恼!
✅评估准:统一输入预处理、LLM配置、评估协议,确保横评公平性与可重复性!
✅结构清晰:统一方法实现结构,新手也能轻松上手,轻松拓展!
📊跨域横评,真实力一目了然!
研究者们利用MASLab进行了大量实验分析,覆盖10余种评测基准(MATH、GPQA、GAIA等),包括LLaMA-3. 3、Qwen-2. 5系列、GPT-4o等8大主流模型,首次系统地刻画大模型多智能体(MAS)方法在多个任务维度下的性能图谱。
通过大量实验,为广大研究者们展示了当前多智能体系统方法的发展现状、有劣势等。
MASLab研究团队不仅紧跟多智能体(MAS)领域前沿,更基于现有成果,创新性地提出了更高效的MAS方法——MASLab-ReAct。该方法支持搜索、读图、读语音等多种工具,并在GAIA验证集上取得了更优结果!实验数据更是有力证明,尤其在需要代码执行、图像解析等工具调用能力的场景下,MAS展现出无可比拟的显著优势,预示着其在真实世界应用中蕴藏的巨大潜力!
🔍多维剖析:不只是简单跑跑实验!
MASLab进一步探索:
⚖️仅因评估协议不同,不同MAS方法排名可发生巨大变动!
MASLab研究团队探讨了不同MAS方法使用的评估协议,实验证明——评估方式选择,直接影响科研结论!这一结果直接地证明了MASLab这一统一代码框架对多智能体领域的重要性!
🧬扩展性分析:
考察不同多智能体方法Test-timeCompute的拓展性:
考察不同模型尺寸(7B~72B)对多智能体方法表现的影响:
💥失败分析:详细追踪格式错误、工具调用失败等常见问题源。MAS系统的表现不仅依赖模型「聪明」,更依赖其是否能「听懂指令」。
💬共建未来:开源共享,共创智能新生态!
MASLab不是闭门造车的项目,而是为社区而生的开源平台,欢迎社区贡献!共同打造MAS的标准实验平台!
未来MASLab将持续开源更多方法与基准,推动构建真正可持续发展的MAS研究社区!
🚀MASWorks大模型多智能体开源社区
与此同时,MASLab研究团队近期发起了一个全新的倡议——MASWorks开源社区!愿景是连接全球研究者,汇聚智慧,一同分享、贡献与协作,共同推动MAS领域的蓬勃发展。
作为社区启动的首个重磅活动,MASWorks将在ICML2025举办聚焦大语言模型多智能体的Workshop:MAS-2025!期待全球广大学者的积极参与,共同探讨、碰撞思想,描绘MAS的未来蓝图!
MASWorks:https ://github. com/MASWorksMAS-2025
ICML2025WorkshoponMAS:https ://mas-2025. github.io/MAS-2025/
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin. com