深度剖析百度 PaddleOCR-VL 0.9B 的文档解析方案:两阶段架构、统一建模与开源实践
一个 0.9B 参数的小模型,在文档解析的权威评测 OmniDocBench 里拿了总分第一,92.86 分。第二名 MinerU2.5 是 90.67,差的不是很多。但你再往下看,GPT-4o 只有 75.02,Qwen2.5-VL-72B 只有 87.02,Gemini 2.5 …
2026/6/29 19:24:30