LLM喂文件神器-讲讲开源文件转换工具 file2md

📅 2026/7/1 1:53:33
LLM喂文件神器-讲讲开源文件转换工具 file2md
这两年 AI 越来越火大家都在折腾 RAG、知识库、AI Agent。但有个问题始终绕不开怎么把各种乱七八糟的文件格式喂给大模型PDF、Word、Excel、PPT、图片、邮件……每个格式都有自己的一套解析方案。PDF 要用 pdfminerWord 要用 mammothExcel 要用 xlsx 库图片还要走 OCR。项目还没写几行业务逻辑光处理文件格式就堆了一堆代码。我也踩过这些坑最开始给一个 AI 项目做文档导入客户发来的文件五花八门——合同是 PDF 扫描件报表是 Excel会议纪要是 Word还有一堆 PPT 和图片。为了把这些都转成 LLM 能读的文本我前后试了好几个方案最后决定自己写一个工具。这个工具就是file2mdnpm 包是 covoyage/file2md同时提供 CLIMIT 协议开源。要做的事情很简单把任何文件变成 Markdown。不管是 PDF、DOCX、XLSX、PPTX、图片、音频、邮件甚至 YouTube 视频、维基百科页面、RSS 订阅——都能统一输出成 Markdown。安装 CLI全局装之后直接 file2md 命令npm install -g covoyage/file2md不想装也行npx 免安装直接跑npx covoyage/file2md 报告.pdfCLI 用法给个文件路径输出 Markdown 到终端或文件file2md 合同.docx # 输出到终端 file2md 报告.pdf -o 输出.md # 写入文件管道输入适合做自动化处理的一环cat 会议纪要.docx | file2md -x docx curl https://example.com/doc.pdf | file2md -x pdf库用法Node.js 项目里直接 import 当库用import { File2MD } from covoyage/file2md; const md new File2MD(); const result await md.convertLocal(./合同.docx);浏览器项目Svelte、Vite 等也能用走 convertStream() 传入 File 对象。给 AI Agent 调用这工具本身就是为 AI 场景写的对 Agent 很友好——Markdown 直接打 stdoutexit code 0 表示成功报错走 stderr。Coding Agent、MCP Server、CI 流程都能直接调file2md /path/to/报告.pdf # Markdown 从 stdout 拿 file2md 报告.pdf -o /tmp/out.md # 或者写文件让 Agent 读 cat 报告.pdf | file2md -x pdf # 管道传内容也一样还额外提供了一个Agent Skill装到 Cursor、Claude Code、GitHub Copilot、Windsurf、OpenCode 等编辑器里Agent 就能自动学会怎么用——知道哪些格式能转、什么时候传路径、什么时候用管道、Cloud 模式怎么配。目前支持近 20 种格式文档类有 PDF、DOCX、XLSX、PPTX、EPUB、CSV、IPYNBJupyter Notebook媒体类有图片JPG/PNG/GIF/WebP、音频WAV/MP3/M4A网络类有 YouTube、维基百科、RSS还支持 Outlook 邮件 .msg 和 ZIP 压缩包。对于 AI 开发者来说这个工具最大的价值就是是省掉了大量的脏活累活。无论是做 RAG 管道的文档预处理还是给 AI Agent 加文件读取能力或者批量清洗老旧文档都可以使用这个工具直接把文件转成干净的文本。如果你也在被文件格式折磨可以试试GitHubgithub.com/covoyage/file2mdnpmnpm install covoyage/file2md