NICE59期 | Agent进入下一篇章!Alita:不靠人工预设,自己造MCP自我进化的AI


NICE59期 | Agent进入下一篇章!Alita:不靠人工预设,自己造MCP自我进化的AI

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

Agent进入下一篇章!Alita:不靠人工预设,自己造MCP自我进化的AI
2025. 6.1周日10:30-11:30北京时间
这篇论文提出了一个非常有趣且实用的想法:让Agent主动创造用于解决MCP的工具,实现自我进化。这些工具既可以是从网上检索的开源工具,也可以是Agent借助代码生成能力自主编写的。
相比之下,传统冲GAIA榜单的方法通常是手动构造大量特定Agent,或者为了实现完全自动化,又堆叠出繁复的workflow。虽然这些系统可以在榜单上取得好成绩,但在实际应用中效果往往不佳。
Alita的做法则更具通用性与实效性:通过试错让Agent自主探索并创造工具,持续扩充其工具库,从而将原本依赖多次尝试(pass@k)的任务,转化为一次成功(pass@1)。随着工具的积累和使用,Agent的能力不断增强,达到“越做越熟练”的效果。
此外,Alita还提出了“Agent蒸馏”的思想:由大模型构建高质量工具,再由小模型调用这些工具。这种方式类似于“用大号装备小号”,不仅提升了小模型的实用能力,也使其在特定领域具备更强的任务完成能力。

裘嘉豪,普林斯顿博士生,导师王梦迪老师。研究方向LLMalignment,Agent,AI4Science。在ICML,NeurIPS,ICLR,AAAI,ICRA,EMNLP等会议发表多篇论文。

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录