RAG文档解析:EasyDoc文档解析API实测体验分享


RAG文档解析:EasyDoc文档解析API实测体验分享

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

最近在处理一批论文数据,之前经常用到的一些开源工具比如Mineru,有了预算之后我们调研一些闭源解析服务,虽然付费但是如果解析质量比较好的话,我们也是可以接收的。其中有一个工具是EasyDoc,下面给大家分享一下EasyDoc文档解析API的使用以及解析效果,EasyDoc近期也有新用户优惠,送几千页解析额度,足够我们初步体验了。
刚好自己在采集科研论文,下面是我用EasyDoc解析论文的一些效果,在这里分享给大家。为了对比和Mineru等框架的区别,我们下面采用Premium来测试论文解析效果,大家也可以按照自己需求来切换不同解析模式。
下面是解析pdf的代码:
参数说明如下:
我们在命令行执行:
添加成功之后,我们可以EasyDoc平台看到任务列表:
https ://platform.easydoc.sh/workspace/task
下面我们根据task_id获取解析结果
解析速度如果加上多模态对图表解析,速度还算可以接受
体验下来,有两个点不错的是:
做到了层级的识别,比如第二章的章节做了层级识别
第二点对图表内容做了vl的多模态解析,比如
不过现在官方还不支持markdown内容生成渲染,希望后续更新能支持
为了验证是否像官方介绍可以识别跨页表格,下面是简单制作了一个跨页word文档解析的结果中有text文本以及table两种格式:对于跨页表格的内容识别,我们可以看到EasyDoc能够正确的识别内容以及将跨页表格内容合并在一起。
在平时解析文档的过程中,我们会遇到ppt,其中ppt内容一般是图文并茂,传统的ppt解析方法只能解析文字,图片内容丢失比较多,下面是一个云计算行业报告:
解析命令如下:
对于上面图片解析内容如下,多模态解析效果还是不错的
我们再看另外一张柱状图
核对了下数字,解析都对了
基于语义智能识别内容块,精准提取完整知识单元,为AI应用提供高质量的语料,提升模型的理解能力。
构建清晰的文档结构树,无论是“第三章第四条第二款”,还是更复杂的层级关系,都能一目了然,使AI迅速定位并理解其确切位置和上下文联系。通过parent_id,你可以轻松追踪每个内容块的层级关系,快速重建文档结构。
超越简单的表格和图片提取,EasyDoc能够深度理解表格和图片,提取结构化数据并提供语义解读,为AI推理提供丰富且准确的多模态信息。下图中vlm_understanding部分就是EasyDoc的表格和图片的深度理解。

适用场景:适合快速开发与原型验证,提供基础文本提取功能。
适用场景:专为RAG系统优化,保留完整的文档层次结构,提升检索准确性。
适用场景:解锁表格和图片深度解析和理解,适合需要处理复杂数据的高级应用。
代码示例:
首发限时福利,新用户免费注册即获10美金API额度(可用于Lite模式5000页,或者Lite和Pro模式2000页),另外附赠500页Premium解析。
三步开始使用EasyDoc:
访问https ://easydoc.sh/zh注册账户。
获取API密钥即可使用文档解析功能。
开始你的文档解析之旅!
EasyDoc优点的话相比开源工具,一个做的比较好的就是可以支持层次结构分析,之前试了一些工具基本上只能识别出一级标题,其次对图表内容基于VL去做了识别解析,可能其他工具也有,但是单独部署一个多模态模型成本还是比价高的,这个相对方便一些。其次就是在后台工作空间我们可以实时看到解析精度,对于低代码用户很方便。
有一些不太完善的地方就是目前还不支持Markdown内容渲染、多模态解析图表目前是中文,有些场景论文是英文数据这个时候解析为中文感觉比较突兀,解析的效果和上下文关系联系比较弱,只是单纯的内容解析。
EasyDoc官网:https ://easydoc.sh/zh
完整API文档:https ://github.com/easydoc-ai/easydoc
中文版快速上手指南:https ://apifox.com/apidoc/shared/704f7d88-99d0-495d-b775-dcfeb96621be/6345913m0


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录