数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 39|回复: 1

[科技] 谷歌Gemini Live语音大升级:会察言观色的AI助手来了

[复制链接]
发表于 9 小时前 | 显示全部楼层 |阅读模式
还记得那些年和语音助手对话的尴尬时刻吗?你在这头激情澎湃地提问,它在那头用毫无波澜的机械音回应,简直比相亲现场的冷场还要让人脚趾抠地。不过谷歌最近给Gemini Live带来的更新,可能要彻底改变这种"人机对话酷刑"了。

事情是这样的:随着Pixel 10系列发布时预告的Gemini Live功能,现在正在安卓设备上大规模推送原生音频输出支持。简单来说,就是你手机里的AI助手现在彻底开窍了,不仅回应更及时,连说话都带上了真情实感。

这背后是算法架构的全面进化。回溯到八月份,谷歌就透露要通过"新模型更新"来重塑语音交互体验。现在的Gemini能捕捉你说话时的语调起伏、节奏快慢甚至音高变化。举个例子,如果你语气急促地询问航班延误情况,它会用更沉稳平和的声线回应;要是你兴奋地分享好消息,它的语音也会跟着轻快起来。

更妙的是,你现在可以像调音师一样定制Gemini的发音特色。想要优雅的英伦腔?安排。喜欢慵懒的澳洲口音?没问题。语速也可以随心调节,从《疯狂动物城》里闪电那样的慢速,到rapper般的语速都能实现。这些设置在整个对话过程中都会保持,即便中途离开,回来时点击聊天记录里的Live按钮就能恢复之前的语音配置。不过开始全新对话时,这些个性化设置会重置回默认状态。

按照谷歌在八月底公布的进度,这项功能应该在"未来几周"落地。现在看起来承诺正在兑现:最近几天,Google AI Pro的付费用户陆续收到了更新。从收集到的反馈看,无论是Pixel还是其他安卓品牌,只要系统达标都能体验到这项升级。不过iOS用户可能要再等等,目前外媒测试的多台苹果设备都还没有相关选项。

与语音升级同步到来的是视觉指引功能的普及。这个最初随Pixel 10系列亮相的小工具,现在已向所有安卓用户开放(包括免费账户)。当你说"展示给我看"或"在哪里"时,屏幕会出现圆角矩形框,配合柔和的背景虚化和聚焦动画,帮你在现实中精准定位物体。

顺便说个细节变化:Gemini应用内的谷歌账户菜单最近改成了全屏设计,和谷歌主应用保持统一。现在要下滑页面才能找到设置入口,这个调整在安卓和iOS端同步实现。

如果说以前的语音助手像是照本宣科的客服,那现在的Gemini Live就更像是个懂得察言观色的聊天伙伴。这种进步背后是语音合成技术的飞跃:从最早的参数合成到现在的端到端神经网络合成,AI正在学会人类对话中的微妙细节。

不过要实现真正自然的对话,还有很长的路要走。比如在嘈杂环境中语音识别的准确度,对方言口音的适应性,以及更深入的情感理解能力,都是接下来的挑战。但无论如何,这次更新让我们看到了人机交互的新可能——也许不久的将来,我们真会忘记是在和AI对话呢。









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 9 小时前 | 显示全部楼层
手机ai功能使用频率比较少。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-10-18 23:55 , Processed in 0.062400 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表