MinerU 3.4.0 PDF/文档转 Markdown/Word软件免安装一键启动整合包

📅 2026/6/26 11:35:27
MinerU 3.4.0 PDF/文档转 Markdown/Word软件免安装一键启动整合包
一、软件简介本软件基于MinerU 3.4.0开源文档解析引擎提供了一套开箱即用的图形化文档转换工具。它能够将 PDF、图片、Office 文档DOCX/PPTX/XLSX等内容精准地转换为Markdown 文本或Word 文档同时保留原始文档的版面结构和排版信息。下载解压后一键启动即可使用。二、主要功能特点1. 多格式输入支持文件类型格式PDF.pdf图片.jpg,.jpeg,.png,.gif,.webp,.svg,.bmp,.tiff,.tifWord.docxPowerPoint.pptxExcel.xlsx2. 三种解析后端可选后端特点适用场景pipeline传统多模型管道解析支持多语言无幻觉对精度要求高、需要多语言支持的通用文档vlm-auto-engine多模态大模型VLM高精度解析仅支持中英文学术论文、技术文档等复杂排版hybrid-auto-engine混合引擎结合 pipeline 的速度与 VLM 的精度平衡速度与精度的最佳选择默认3. 丰富的识别能力公式识别— 自动识别行内公式和行间公式输出 LaTeX 格式表格识别— 识别并还原为 Markdown 表格禁用时以图片形式保留图片分析— 使用 VLM 模型对文档中的图片/图表进行语义分析vlm/hybrid 后端OCR 文字识别— 支持 60 种语言包括中文、英文、日文、韩文、阿拉伯文、拉丁语系、斯拉夫语系等版面还原— 保留原始文档的标题层级、段落顺序和版面布局4. 输出格式Markdown 渲染预览— 直接在浏览器中查看渲染后的排版效果支持 LaTeX 公式渲染Markdown 纯文本— 可复制粘贴的源代码格式Word 文档导出— 通过 Pandoc 将 Markdown 转换为.docx格式PDF 预览— 上传 PDF 或图片后在右侧直接预览原文档5. 批量处理支持对文件夹中所有支持的文档进行批量转换自动遍历排序逐文件处理并汇总结果转换结果统一输出到./output目录。三、使用方法3.1 启动软件方式一一键启动推荐直接双击0启动软件.batpython start.py启动成功后浏览器将自动打开http://localhost:7860进入 Web 操作界面。3.2 单文件转换在 Web 页面中点击请选择要上传的文件上传 PDF、图片或 Office 文档配置转换参数参见下文参数说明点击转换按钮等待转换完成在右侧查看转换状态— 实时进度Markdown 渲染— 渲染后的效果预览Markdown 文本— 原始 Markdown 源码3.3 批量转换在Batch Processing区域输入要处理的文件夹路径配置统一的转换参数点击批量转换按钮系统将自动遍历文件夹中所有支持的文档逐文件处理并输出汇总结果3.4 参数说明参数说明起始页码从第几页开始从 0 计默认 0结束页码处理到第几页-1 表示最后一页解析后端pipeline / vlm-auto-engine / hybrid-auto-engine解析方法auto自动/ txt仅文本/ ocr强制 OCR解析强度medium较快禁用图片分析/ high高精度启用图片分析启用公式识别识别并解析文档中的数学公式启用表格识别识别并还原表格结构启用图片分析对文档内图片/图表进行语义分析VLM 后端有效导出 Word额外生成 .docx 格式文件语言选择 OCR 识别的语言支持 60 语言四、输出说明所有转换结果默认保存在软件根目录下的./output/文件夹中按文件名称自动创建子目录output/ └── 文件名/ ├── 文件名.md # Markdown 结果文件 ├── 文件名_layout.pdf # 版面布局预览 PDF图片/PDF 文档 ├── 文件名_origin.pdf # 原始 PDF 预览图片/PDF 文档 ├── 文件名.docx # Word 导出文件勾选导出时生成 ├── images/ # 提取的图片资源 ├── content_list.json # 内容列表结构化中间数据 └── model_output.json # 模型输出原始数据五、系统与环境说明硬件要求推荐配置NVIDIA GPU6GB 显存支持 CUDA最低配置CPU 模式速度较慢VLM 后端不可用内存建议 16GB 以上后端选择建议使用场景推荐后端原因通用中文 PDFhybrid-auto-engine默认速度与精度均衡学术论文含大量公式vlm-auto-engine公式识别更准确多语言混合文档pipeline多语言支持最完善简单文字 PDFpipeline auto速度最快扫描件/图片型 PDF任意 ocr强制 OCR 识别需要远程 GPUxxx-http-client可对接远程 API 服务PDF转markdown/Word软件mineru最新版整合包下载链接夸克网盘分享