AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!


AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

大家好,我是Ai学习的老章
之前推荐过N多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的ArXivMCP服务器、整篇翻译并保留样式的看论文神器,一键翻译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、翻译,效率飙升100倍!的AlphaXiv
今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code
开源代码不支持DeepSeek,稍作修改就可以使用DeepSeekAPI了
一句话总结,PaperCoder旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。
“尽管机器学习研究快速增长,相应的代码实现通常不可用,使研究人员复现结果和基于先前工作构建变得缓慢且劳动密集。”
顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:
PaperCoder通过将研究库生成形式化为软件开发问题来解决可重复性挑战。
该框架可以表示为M(R)=C,其中:
R是包含方法和算法的研究论文
C是生成的代码库
M是执行转换的基于LLM的模型
该系统采用三阶段方法,该方法反映了人类的软件开发过程:
规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。
分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。
生成阶段:根据规划期间确定的执行顺序合成整个代码库。
每个阶段都使用专门的LLM代理来实现,这些代理协同工作以完成任务,这使得PaperCoder成为一个复杂的多代理系统。
效果怎么样呢?
PaperCoder的性能优于软件开发工作基线,如ChatDev和MetaGPT,表明其专门设计的有效性。
作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:
PaperCoder生成的存储库中有77%被人类评估者评为最佳
85%的人类评审员报告说生成的存储库很有帮助
如何使用呢?
安装
输出结果如下
系统的工作流程是:
将PDF论文转换为JSON格式0_pdf_process.py:4-17
分析论文内容并生成实现计划1_planning.py:26-36
进行逻辑分析2_analyzing.py:49-54
生成代码实现3_coding.py:43-50
不过这个项目是默认OpenAI的api,本地运行也只支持vllm拉起的模型。
我看了一下,其实该起来也非常简单
比如把OpenAI切换为DeepSeek,需要修改的脚本不多
修改API客户端初始化和调用:
codes/1_planning.py-规划生成组件1_planning.py:1-16
codes/2_analyzing.py-逻辑分析组件2_analyzing.py:1-20
codes/3_coding.py-代码生成组件3_coding.py:1-19

修改为下面即可
如果你用的是DeepSeek官方API,base_url改为https ://api.deepseek.com_/v1
其他类似
然后修改scripts/run.sh中的环境变量设置:run.sh:1-3
然后就全部ok
最后推荐一个我正在学习的Cusor快速入门与实战
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!
搭建完美的写作环境:工具篇(12章)图解机器学习-中文版(72张PNG)ChatGPT、大模型系列研究报告(50个PDF)108页PDF小册子:搭建机器学习开发环境及Python基础116页PDF小册子:机器学习中的概率论、统计学、线性代数史上最全!371张速查表,涵盖AI、ChatGPT、Python、R、深度学习、机器学习等


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录