仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
这次带来RAG的小白应用教程:介绍如何通过ragflow框架把DeepSeek接入到自己的个人知识库中,当然其他模型也是类似,可以自由搭配。
先看效果:
RAGFlow是一款基于深度文档理解的开源检索增强生成(Retrieval-AugmentedGeneration,RAG)引擎,旨在通过结合信息检索和生成式AI的优势,解决现有技术在数据处理和生成答案方面的挑战。
RAGFlow广泛应用于需要动态生成内容且依赖外部知识库的场景,例如:
智能客服:实时从企业知识库中检索相关信息,为客户提供准确、个性化的解答。
文档生成与报告分析:从多个数据源中检索信息并生成结构化的文档或摘要,适合大规模内容管理。
辅助诊断:医疗专业人员可以通过RAGFlow快速查找相关医学文献和病例资料,为诊断和治疗提供参考。
文献综述:帮助学生和研究人员快速定位和分析相关的学术文献,高效完成文献综述的撰写。
新闻报道与投资分析:记者和金融机构可以利用RAGFlow整合和提炼大量素材,生成新闻稿件或投资分析报告。
深度文档理解:能够从复杂格式的非结构化数据中精准提取知识,支持多种文档格式(如Word、PPT、Excel、PDF等),并自动识别文档布局。
降低幻觉风险:提供清晰的关键引用来源,支持文本分块的可视化和人工干预,确保生成答案有据可依。
兼容异构数据源:无缝处理多种数据格式,整合不同来源的数据,为用户提供一站式的数据处理和问答体验。
自动化工作流:支持从个人应用到超大型企业的各类生态系统,提供易用的API,便于快速集成到各类业务系统。
高效性与成本优化:通过动态优化流程,减少不必要的计算和查询次数,降低运行成本。
精准性与可靠性:检索和生成环节相辅相成,确保最终结果的准确性和可靠性。
RAGFlow的这些特性和优势使其在信息检索和内容生成领域具有广泛的应用前景和显著的竞争力。
我的理解呢,ragflow的意义在于它把原本复杂的rag系统开发,处理成了零代码开发模式,方便非计算机背景的人也可以进行rag系统的搭建和维护,而且融入了类似dify的强大的工作流编排功能。
配置要求:ragflow是一个相当“重”的项目,如果你的电脑不满足以下条件,请不要随意尝试
首先我们需要安装好docker软件
https ://www.runoob.com/docker/windows-docker-install.html
安装好docker后启动即可,不用登陆不用设置任何东西,一路跳过。
这里我们需要配置docker镜像源
上方代码粘贴替换完毕后点击右下角
到这里我们的docker就配置好了
然后我们需要安装git:https ://cloud.tencent.com/developer/article/2099150
最后我们需要安装vscode:https ://zhuanlan.zhihu.com/p/264785441
在c盘之外的地方打开一个文件夹用来安装ragflow,鼠标右键,点击openGitBashhere
输入命令:
gitclonehttps ://github.com/infiniflow/ragflow.git
点击回车就可以看到多了一个文件夹ragflow
由于默认配置版本是没有embedding模型的,所以我们修改配置为完整版。使用vscode打开.env文件,修改第84行和第87行,ctrl+s保存文件。
大概15分钟后镜像加载完毕就部署完毕了。最后我们输入dockerlogs-fragflow-server,出现RAGFLOW字体就代表后端服务启动成功了。
之后我们在浏览器地址栏输入:localhost:80即可打开ragflow登录页面。登录页面可以随便输入一个邮箱账号(随便编一个符合邮箱格式的就可以),全部是保存在你本地电脑上的,不用担心数据泄露。但是要注意第一个注册的默认是管理员,所以还是要注意保存一下你注册的邮箱信息。之后点击登录就可以使用ragflow了。
首先我们配置一下deepseek模型服务,api-key可以从https ://platform.deepseek.com/api_key申请获取(官网已经恢复充值)。
之后我们上传资料创建一个本地知识库就可以啦。可以看到上传的资料支持多种格式,扫描版的pdf文档也是可以的。
上传文件之后需要等待文档解析完成,可以看到文档解析的效果还是不错的
创建对话助理后,就可以对话啦,注意在模型设置里把模型替换为deepseek-chat
关掉powershell窗口,退出docker进程即可。
如果都在运行中,此时可以在浏览器输入localhost:80即可启动前端界面,愉快的使用ragflow啦!
本教程主要参考以下两篇官方文档撰写:
1.https ://github.com/infiniflow/ragflow?tab=readme-ov-file
长按👇关注-数据STUDIO-设为星标,干货速递