数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 62|回复: 0

[科技] Mistral开源语音模型Voxtral问世:成本砍半狙击OpenAI,每分钟低至0.001美元

[复制链接]
发表于 前天 18:14 | 显示全部楼层 |阅读模式
会议记录漏掉关键结论、客服录音时间轴错乱、跨国外语识别翻车——这些职场人被语音识别软件坑到血压飙升的场景,很快要被巴黎AI公司Mistral的新武器解决。北京时间今日凌晨,这家欧洲技术企业推出开源性语音识别系统Voxtral,用"白菜价收费+顶级精度"的组合,直插OpenAI等巨头的定价命门。

价格牌掀翻行业底价​​
Mistral在官网公告直接抛出收费对比:

OpenAI Whisper每分钟收0.006美元
GPT-4o-mini语音转录每分0.003美元
Voxtral基础套餐每分钟仅0.001美元(顶配方案最高0.004美元)

精准度数据全维度碾压​​
在Mozilla公共语音库测试中,Voxtral的英语短音频转录准确率全面超越谷歌Gemini 2.5 Flash和OpenAI最新方案。官方宣称比Whisper large-v3精度更高。去年第三方研究曾揭露OpenAI存在约1%语音幻听现象(即虚构说话内容),​​Voxtral没有公布具体幻听比例数据,但测试曲线显示错误率明显是往下走的​​。

​​三大技术模块解密​​

​​主转录引擎​​:支持英语、西班牙语、法语、葡萄牙语、印地语等实时多语种转换
​​超长上下文处理​​:32,000 Token承载上限(约30分钟音频转录或40分钟语义任务)
​​语音指令中枢​​:支持自然语义触发操作(如"把这段总结发邮件给张经理")

​​企业级定制藏着商机​​
面对医疗金融等专业领域需求,Mistral开放私有化部署选项,包含行业术语库训练、声纹识别系统嫁接等增值服务。有意思的是,本月初这家公司曾联合数十家欧洲科技企业发函,呼吁欧盟暂缓实施《AI法案》,直指政策对企业创新力的潜在压制。

​​开源生态背后的生意经​​

​​分级收费​​:个人开发者免费使用,企业用户按需购买增值服务
​​行业方案​​:针对法律、医疗等专业场景定制术语库
​​生态整合​​:声纹识别与情感分析技术接口开放嫁接
当前服务通过Mistral云平台提供,基础套餐以每分钟0.001美元覆盖常规需求,顶配方案开放语音指令执行等进阶功能。开源社区版已在GitHub上架,支持本地设备离线运行。

开发者连夜抢测​​
随着智能家居、车载系统、客服中心等场景加速渗透语音交互,Voxtral的横空出世正引发技术圈地震。OpenAI的硅谷办公室尚未回应,不过GitHub数据显示Voxtral开源包发布3小时下载量已突破2万次。"这个价格精度比,把行业旧账本直接烧了。"某AI公司技术总监在社交媒体如此评论。

语音识别赛道从未如此躁动——当巴黎企业将价格屠刀精准挥向硅谷巨头的业务腹地,办公室里的程序员正灌着浓茶调试代码包。这场技术价值战的胜负手,最终将由录音文件的错别字数量判定。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-18 09:58 , Processed in 0.140400 second(s), 5 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表