数码之家

 找回密码
 立即注册
搜索
查看: 591|回复: 0

[业界] 苹果研究如何利用音频来估计设备与说话用户的距离

[复制链接]
发表于 2021-1-22 13:53:37 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
来源: cnBeta

新专利显示,苹果正在研究HomePod或其他设备如何利用音频来估计与说话用户的距离,还可以识别周围的声音。苹果的HomePod已经很好地听到了你的声音,即使是在大声播放音乐的时候。现在新专利申请显示,苹果希望改进这一点,并将设备的听觉能力,提升到一个新的水平。
  一项是名为 “基于学习的距离估计”的专利,涉及到使用音频不仅仅是为了识别用户,而是为了弄清用户的位置。苹果在专利当中表示,设备使用紧凑麦克风阵列估计设备到用户的距离,例如,设备可以根据用户与设备的估计距离来调整播放音量或智能辅助设备的响应。因此,如果用户离设备非常近,音乐或语音将不会以高音量播放,另外,如果用户离得很远,媒体播放或智能助理设备的响应可能会被调整到更大的音量。
  这个想法也是为了改进苹果目前令人印象深刻但又有些缺陷的系统,即多个苹果设备都会尝试确定你对哪个设备说了 “嘿,Siri”。对此,苹果在专利当中表示,在有多个设备的应用场景中,设备之间可以相互协调或仲裁,根据每个设备到用户的距离来决定哪一个或多个设备应该回复查询。
  在专利当中,苹果提出了简单和更复杂的解决方案,这些方案都可以协同使用。比较简单的是让设备像HomePod一样,先绘制出环境图。然后,它有效地拥有一个声学环境中的测量或模拟点的网格。在这种情况下,就可以将声音与这个 “网格 ”进行对比,从而大致判断出说话的人所在的位置。
  如果这不够好,苹果还有另一个解决方案,它涉及 “基于学习的系统,如深度神经网络(DNN),而且不需要多个设备互相协调帮助。苹果在专利当中表示,深度学习系统可以根据紧凑的麦克风阵列接收到的语音信号,估计语音源在每个时间段的距离。这个DNN系统可以做的是确定什么是语音,什么是背景噪声。然后,它可以计算出 关于直接信号传播的信息,还可以计算出混响效应和噪声。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-20 20:44 , Processed in 0.156000 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表