数码之家

 找回密码
 立即注册
搜索
查看: 134|回复: 1

[科技] 谷歌Meet语音翻译上线:AI同传能克隆你的声音和情绪了

[复制链接]
发表于 2025-5-21 11:02:42 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
当马德里分部的工程师用西班牙语吐槽项目延期时,纽约总部的产品经理耳机里传来的,是带着原声颤抖和叹气声的英文翻译——这项由谷歌在2025 I/O大会发布的Meet实时语音翻译功能,用AI建模技术完整复刻了人类对话中的134种情绪参数。这项基于Gemini大模型的技术,不仅实现英语与西班牙语的实时互译,还能保留说话者的音色、语调和微表情。

背后的AudioPaLM语言模型每秒处理48000个音频采样点,通过拆解音高、语速甚至呼吸间隙的声纹特征,再重组为带情感的目标语言输出。在官方演示中,巴塞罗那设计师的地中海腔调英文翻译,连标志性的"¡Olé!"欢呼都被精准转化。实测数据显示,其情感保留准确度比传统翻译工具提升23%,错误率压至4.8%。

目前该功能仅向AI Ultra订阅用户开放,月费249.99美元,初期支持英西双语互译,未来六周将扩展至意大利语、德语和葡萄牙语。企业用户需注意硬件成本,参考2023年原型机单台50万美元的投入,全套系统可能达百万美元级。

这项技术突破源自谷歌DeepMind团队三年研发的端到端语音转换模型。不同于传统翻译将语音拆解为文字再重组,新系统直接让声波跨语言传递。2019年Translatotron项目已实现语音到语音转换,而2025年的迭代版本将延迟压缩至0.8秒,接近真人对话节奏。

对于跨国企业而言,该功能可能重塑远程协作模式。德勤测试显示,3D全息会议结合语音克隆技术,使全球策略会效率提升40%。但决策者需权衡成本效益——相比日薪2万美元的人类同传,AI方案在连续使用时更具性价比。

google-meet-translation-1.jpg

Google-Meet-Speech-Translation-cover.jpg

Google-Meet-Speech-Translation-1.jpg

Google-Meet-Speech-Translation-cover-2.jpg
发表于 2025-5-21 11:36:31 | 显示全部楼层
AL像是有了人的大脑,又吃惊又可怕
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-6-7 20:06 , Processed in 0.156000 second(s), 12 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表