Mistral OCR正式上线：多语言复杂文档转换利器准确率超微软谷歌

Meise · 发表于 2025-3-12 09:54:32

“纸质档案电子化终于有解药了！”人工智能公司Mistral最新推出的OCR（光学字符识别）服务引发行业关注。这款名为Mistral OCR的API接口，号称能精准解析表格、数学公式等复杂排版文档，对中文、日文、阿拉伯文等11种语言的平均识别准确率最高达99.54%，直接把微软、谷歌的同类产品甩在身后。

打破复杂文档识别瓶颈
传统OCR技术面对简单文字转换游刃有余，但遇到跨栏表格、嵌套公式或混合语言文档时就容易“翻车”。Mistral OCR针对这些痛点优化算法，实测数据显示：

中文印刷体识别准确率99.12%
日文片假名识别率98.76%
阿拉伯语连笔字识别率97.00%
即便是包含统计图表与数学符号的学术论文，整体识别精度仍比谷歌Document AI高出3个百分点。

企业级文件处理方案
目前该服务支持PDF、图片和网页内容直接解析，但对企业用户设定了两大门槛：单文件不得超过50MB，页数需控制在1000页以内。纸质文件需先扫描成电子版才能处理，适合档案馆、出版社等需要批量处理历史资料的机构。

技术优势与商业布局
Mistral官方强调，其算法在训练时纳入了全球200种特殊字体样本，能自动修正扫描文件常见的倾斜、模糊、阴影等问题。虽然尚未公布具体收费标准，但业内人士推测其定价将瞄准企业级市场，与Adobe Acrobat等成熟产品展开竞争。

用户实测反馈
早期试用者透露，这套系统对19世纪英文古籍的识别效果令人惊喜，连纸张边缘的蛀虫咬痕都能智能屏蔽。不过也有用户指出，处理超过30列的复杂表格时，仍会出现单元格错位的情况。Mistral团队回应称，后续将推出表格结构手动校准工具，预计今年第二季度更新相关功能。

账号		自动登录	找回密码
密码			立即注册

[科技] Mistral OCR正式上线：多语言复杂文档转换利器准确率超微软谷歌

本帖子中包含更多资源

相关帖子

浏览过的版块

[科技] Mistral OCR正式上线：多语言复杂文档转换利器 准确率超微软谷歌

本帖子中包含更多资源

相关帖子

浏览过的版块

[科技] Mistral OCR正式上线：多语言复杂文档转换利器准确率超微软谷歌