Mistral AI 发布 OCR4 模型,支持 170 种语言并强化文档智能处理
2026/06/26 16:37阅读量 2
Mistral AI 正式推出文档识别模型 OCR4,支持 170 种语言,在 OmniDocBench 评测中得分 93.07,性能超越 GPT-5.5 Pro 和 Gemini 3.1 Pro Preview。模型具备边框识别、区域分类、置信度评分及 RAG 语义分块等功能,基础 API 定价为每千页 4 美元,批处理可享五折优惠。
Mistral AI 发布了全新文档识别模型 OCR4,该模型支持跨越 10 个语族的 170 种语言。在 OmniDocBench 测试中,Mistral OCR4 获得了 93.07 分,在用户体验测评中优于 GPT-5.5 Pro 和 Gemini 3.1 Pro Preview 等同类产品。
OCR4 专注于高效文档处理,不仅能精准识别和提取文字,还支持边框识别、区域分类以及置信度评分。模型设计充分考虑了下游业务需求,提供 RAG 语义分块、智能体结构化基本单元及连接器结构化内容输出等能力,可支撑复杂文档智能化工作负载。
定价方面,OCR4 基础 API 收费标准为每千页 4 美元,批处理模式可享受 50% 折扣;专业文档人工智能服务定价为每千页 5 美元。
