GPT-4o中文长文本幻觉率高达12.7%?DeepSeek-R1通过动态注意力掩码将事实一致性提升至99.1%(附NLP权威评测组原始报告截图)
更多请点击:
https://kaifayun.com
第一章:GPT-4o与DeepSeek-R1事实一致性评测的核心发现 在统一评测框架下,我们对GPT-4o(OpenAI 2024年5月发布)与DeepSeek-R1(DeepSeek 2024年6月开源推理模型࿰…
2026/7/1 13:47:20