Mistral开源语音模型Voxtral问世：成本砍半狙击OpenAI，每分钟低至0.001美元

Meise · 发表于前天 18:14

会议记录漏掉关键结论、客服录音时间轴错乱、跨国外语识别翻车——这些职场人被语音识别软件坑到血压飙升的场景，很快要被巴黎AI公司Mistral的新武器解决。北京时间今日凌晨，这家欧洲技术企业推出开源性语音识别系统Voxtral，用"白菜价收费+顶级精度"的组合，直插OpenAI等巨头的定价命门。

价格牌掀翻行业底价
Mistral在官网公告直接抛出收费对比：

OpenAI Whisper每分钟收0.006美元
GPT-4o-mini语音转录每分0.003美元
Voxtral基础套餐每分钟仅0.001美元（顶配方案最高0.004美元）

精准度数据全维度碾压
在Mozilla公共语音库测试中，Voxtral的英语短音频转录准确率全面超越谷歌Gemini 2.5 Flash和OpenAI最新方案。官方宣称比Whisper large-v3精度更高。去年第三方研究曾揭露OpenAI存在约1%语音幻听现象（即虚构说话内容），Voxtral没有公布具体幻听比例数据，但测试曲线显示错误率明显是往下走的。

三大技术模块解密

主转录引擎：支持英语、西班牙语、法语、葡萄牙语、印地语等实时多语种转换
超长上下文处理：32,000 Token承载上限（约30分钟音频转录或40分钟语义任务）
语音指令中枢：支持自然语义触发操作（如"把这段总结发邮件给张经理"）

企业级定制藏着商机
面对医疗金融等专业领域需求，Mistral开放私有化部署选项，包含行业术语库训练、声纹识别系统嫁接等增值服务。有意思的是，本月初这家公司曾联合数十家欧洲科技企业发函，呼吁欧盟暂缓实施《AI法案》，直指政策对企业创新力的潜在压制。

开源生态背后的生意经

分级收费：个人开发者免费使用，企业用户按需购买增值服务
行业方案：针对法律、医疗等专业场景定制术语库
生态整合：声纹识别与情感分析技术接口开放嫁接
当前服务通过Mistral云平台提供，基础套餐以每分钟0.001美元覆盖常规需求，顶配方案开放语音指令执行等进阶功能。开源社区版已在GitHub上架，支持本地设备离线运行。

开发者连夜抢测
随着智能家居、车载系统、客服中心等场景加速渗透语音交互，Voxtral的横空出世正引发技术圈地震。OpenAI的硅谷办公室尚未回应，不过GitHub数据显示Voxtral开源包发布3小时下载量已突破2万次。"这个价格精度比，把行业旧账本直接烧了。"某AI公司技术总监在社交媒体如此评论。

语音识别赛道从未如此躁动——当巴黎企业将价格屠刀精准挥向硅谷巨头的业务腹地，办公室里的程序员正灌着浓茶调试代码包。这场技术价值战的胜负手，最终将由录音文件的错别字数量判定。

账号		自动登录	找回密码
密码			立即注册

[科技] Mistral开源语音模型Voxtral问世：成本砍半狙击OpenAI，每分钟低至0.001美元

本帖子中包含更多资源

相关帖子

浏览过的版块