|
生成式AI战场正从文字转向语音!谷歌在2025年3月17日宣布,旗下语音模型Chirp 3将于下周接入Vertex AI开发平台。这款支持31种语言、拥有8种声线的工具,可用来制作有声书、搭建语音客服,还能给视频自动配音。
这次升级让Chirp 3与谷歌的AI绘图工具Imagen、视频生成器Veo 2组成全家桶。开发者现在能用同一套系统,同时处理语音、图像和视频内容。谷歌云CEO托马斯·库里安在伦敦发布会上透露:"我们正在和风控团队制定防护措施,防止语音技术被滥用。"
语音AI赛道近期热闹非凡。就在上周,初创公司Sesame开放了其语音模型的API接口,这家公司打造的"Maya"语音助手因高度拟真引发过热议。另一家语音技术公司ElevenLabs已获得数亿美元融资,正在快速扩张。
Chirp系列其实是谷歌的"复仇者计划"——最早是为对抗亚马逊Alexa而研发,现在成了AI时代的语音基建。Vertex AI平台自2021年上线以来,已吸引大量开发者训练机器学习模型。不过面对微软Azure和亚马逊AWS的竞争,谷歌仍需加快追赶速度。
DeepMind CEO哈萨比斯在发布会上泼了盆冷水:"未来十年AI会持续进化,但别指望这两年就能造出通用人工智能。"这番话给火热的语音AI赛道降了降温,毕竟现在最拟真的语音助手,说话时还是会露出机械感的破绽。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|