仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
大家好,我是Ai学习的老章
推荐一个实用的项目,最近更新了MCP服务,我在本地CherryStudio试了一下,效果还行。
MarkItDown是一个轻量级的Python工具,用于将各种文件转换为Markdown,以便与LLMs和相关的文本分析管道一起使用,将重要的文档结构和内容作为Markdown保留(包括:标题、列表、表格、链接等)。
项目地址:https ://github.com/microsoft/markitdown
目前,MarkItDown支持:
PDF
PowerPoint
Word
Excel
图像(EXIF元数据和OCR)
音频(EXIF元数据和语音转录)
HTML
基于文本的格式(CSV,JSON,XML)
ZIP文件(遍历内容)
Youtube链接
EPubs
直接使用pip:
pipinstall’markitdown[all]’
或从源安装:
命令行:
或使用-o指定输出文件:
通过管道传输内容:
Python中的基本用法:
Python中的DocumentIntelligence转换:
若要将大型语言模型用于图像描述,请提供llm_client和llm_model:
以上都是基础功能
今天我们重点看看MarkItDown刚刚新增的MCP(模型上下文协议)服务器,用于与LLMClaudeDesktop等应用程序集成。
使用pip:
要运行MCP服务器,请使用STDIO(默认),使用以下命令:
要使用SSE运行MCP服务器,请使用以下命令:
CherryStudio的配置如下,更详细介绍可以看看我之前的文章
给所有大模型加上联网功能,套到极致,就是艺术
【教程】用大模型,批量下载,总结论文
命令那里如果直接填写markitdown-mcp报错的话,可以用whereis看一下自己的markitdown-mcp安装位置
使用时,在对话框下面选中该MCP即可
结果:
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!
搭建完美的写作环境:工具篇(12章)图解机器学习-中文版(72张PNG)ChatGPT、大模型系列研究报告(50个PDF)108页PDF小册子:搭建机器学习开发环境及Python基础116页PDF小册子:机器学习中的概率论、统计学、线性代数史上最全!371张速查表,涵盖AI、ChatGPT、Python、R、深度学习、机器学习等