开源一个本地离线智能填表工具:旺财填表助手 WangcaiFormAssistant

📅 2026/7/1 1:37:25
开源一个本地离线智能填表工具:旺财填表助手 WangcaiFormAssistant
最近做了一个本地离线智能填表工具名字叫旺财填表助手 WangcaiFormAssistant项目已经开源https://github.com/superalp1985/WangcaiFormAssistant网盘完整包通过网盘分享的文件WangcaiForm链接: https://pan.baidu.com/s/1UBFvsfJyXAgMIdcA7X-yOQ?pwdsubj提取码: subj这个项目的目标很明确不做通用聊天机器人只做本地、离线、可复核、可审计的填表流程。它适合处理一些典型办公场景根据合同、申报书、台账、花名册等资料填写 Excel 表格从发票图片/PDF 中识别信息并导入台账对填表结果保留来源依据方便人工核对在不方便上传资料到云端的环境里本机完成抽取、OCR 和审计一、为什么做这个工具很多办公自动化任务其实并不复杂但非常消耗时间。比如根据合同填写合同台账根据花名册筛选人员信息根据发票填写报销或发票登记表根据申报书提取项目名称、简介、金额、周期根据多个 Word/PDF/Excel 文件汇总成一个固定模板这些任务的共同特点是答案通常已经在资料里。人工复制粘贴容易出错。填完以后还要能核对来源。有些资料不适合上传到在线 AI。完全自动化并不现实必须保留人工确认。所以这个项目没有做成“自由对话式 Agent”而是做成固定流程选择待填表格- 分析表格结构- 选择参考资料- 配置字段来源和规则- 本地模型抽取 / OCR- 生成填表结果- 生成审计记录- 用户核对确认这样做的好处是边界清楚出错也容易定位。二、项目当前能力当前版本主要支持.xlsx 待填表分析可以读取 Excel 表格识别表头标题待填列空白格常见键值型表单多表头/合并单元格等常见结构识别后不会直接写入而是允许用户调整确认。多参考资料读取支持常见办公文件.txt.md.json.csv.docx.xlsx.pptx.pdf图片扫描件其中 PDF 和图片可以通过 OCR 生成文本或表格草稿。本地模型抽取当前主抽取模型为NuExtract-2.0-2B GGUF它负责从参考资料中抽取结构化字段。另外使用Qwen 2B GGUF用于摘要解释规则理解简单补充推理两个模型都通过本地 llama.cpp server 运行不调用云端接口。OCR 发票和扫描件识别OCR 默认使用 RapidOCR 适配器支持图片 OCRPDF OCR发票信息识别扫描表格转 .xlsx 草稿对发票台账场景当前可以提取常见字段发票号码开票日期销方名称购买方名称金额税额价税合计OCR 结果默认进入复核流程不假设 100% 正确。白盒规则配置这个项目比较强调“白盒”。用户可以明确配置哪些列需要填写哪些字段来自哪些资料是否只填指定范围金额是否必须来自合同项目简介是否来自申报书找不到内容时留空还是进入复核是否允许模型做轻微改写模型不会直接自由操作文件。它只生成候选结果最后由程序写表并生成审计记录。审计记录每个填入结果都会保留目标单元格填入值来源文件证据片段置信度复核状态也就是说输出不是一个黑箱 Excel而是一个带来源依据的填表草稿。三、技术架构项目整体架构如下Win32 GUI|| 调用vC CLI 核心||-- Excel 解析与写入|-- 表格结构分析|-- 字段规则编译|-- 参考资料提取|-- OCR 适配器调用|-- 模型服务管理|-- 审计记录生成|±- llama.cpp server| |-- NuExtract 2B| ±- Qwen 2B|±- RapidOCR adapter|-- ONNX Runtime|-- pypdfium2±- OCR 模型项目主体使用 C 实现。Python 主要用于OCR 适配器PDF 渲染/文本提取测试脚本工程辅助脚本这样做是为了让主流程尽量独立、可控同时保留成熟 OCR/PDF 生态的能力。四、为什么选 2B 级模型一开始也测试过更大的模型但办公软件要考虑实际机器。很多办公电脑没有独显甚至只有普通 CPU。如果模型太大效果可能更强但部署成本和等待时间会明显上升。当前选择是NuExtract 2B主抽取Qwen 2B解释、摘要、规则理解推荐配置场景 配置最低可用 4 核 CPU、8GB 内存、10GB 磁盘推荐配置 6-8 核 CPU、16GB 内存、15GB 磁盘批量 OCR 8 核以上、24GB 内存、20GB 磁盘不需要独立显卡。默认根据机器内存自动调整8GB4096 上下文OCR 1 worker16GB6144 上下文OCR 2 workers24GB8192 上下文OCR 2-3 workers五、安装和使用下载GitHubhttps://github.com/superalp1985/WangcaiFormAssistant百度网盘链接: https://pan.baidu.com/s/1UBFvsfJyXAgMIdcA7X-yOQ?pwdsubj提取码: subj解压完整包分为几个部分WangcaiFormAssistant-v0.1.0-runtime-base.tar.gzWangcaiFormAssistant-v0.1.0-model-nuextract-2b.tar.gzWangcaiFormAssistant-v0.1.0-model-qwen3.5-2b.tar.gz把它们解压到同一个目录并保留目录结构。最终目录大概是WangcaiFormAssistant/build/config/models/runtime/docs/tests/一键安装.cmd自检先运行check_offline_environment.cmd再运行self_check.cmd如果习惯中文脚本也可以运行一键自检.cmd安装install_wangcai_form_assistant.cmd或者一键安装.cmd默认会安装到%LOCALAPPDATA%\WangcaiFormAssistant并创建快捷方式。六、几个典型命令运行环境探测build\wangcai_form_assistant_cli.exe runtime-probe分析 Excel 表格build\wangcai_form_assistant_cli.exe analyze-xlsx --workbook tests\fixtures\sample_form.xlsxOCR 发票样张build\wangcai_form_assistant_cli.exe ocr-draft ^–source tests\fixtures\generated\real_invoice_cn.png ^–output-json out\selfcheck_ocr_draft.json ^–review-json out\selfcheck_ocr_review.json模型进程清理build\wangcai_form_assistant_cli.exe model-cleanup --config config\default.json七、当前测试情况当前版本做过一轮完整真机测试覆盖普通表格填报多表头表格分析合并单元格边界合同台账花名册筛选批量发票 OCR图片/PDF 待填表转 .xlsx自然语言规则编译模型常驻和进程清理离线部署检查发布包依赖检查结果41/41 required checks passed安装包自检覆盖runtime-probeanalyze-xlsxocr-draft八、项目边界这个项目目前还是早期预览版。需要明确几个边界当前主要支持 Windows x64。WPS/Office 不是运行硬依赖但建议用于查看和微调输出表格。OCR 和模型结果必须人工核对。不适合做完全无人值守的财务入账或复杂业务判断。模型和第三方运行时遵循各自许可证和模型卡。没有内置 runtime/python 的包需要系统有 Python 3.12 才能跑 OCR/PDF 相关适配器。它的定位不是替代人而是减少重复劳动。更准确地说让软件先生成一个有来源依据的填表草稿人再做最后确认。九、开源协议项目源码采用 Apache-2.0 协议。第三方组件包括llama.cppNuExtractQwenRapidOCRONNX Runtimepypdfium2Pillowminizpugixmlnlohmann/json具体见项目中的LICENSETHIRD_PARTY_NOTICES.md十、后续计划后续可能继续做更好的扫描表格结构识别更方便的原文/结果同屏核对更多 OCR 引擎适配模板化文字材料生成套模板改 PPT本地办公工具合集现在先把最基础、最真实、最烦人的填表问题解决掉。项目地址https://github.com/superalp1985/WangcaiFormAssistant网盘下载链接: https://pan.baidu.com/s/1UBFvsfJyXAgMIdcA7X-yOQ?pwdsubj提取码: subj