数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 1227|回复: 12

[综合] 有搞过语音识别系统的TX吗

[复制链接]
发表于 2020-7-10 19:03:54 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
如题,请教

不知最少量的语句 对内存容量要求是多少?(用于训练的语言库可以少些,假设只三、五句话)

希望是有比较高的识别率

STM32F0/F1这样的低档货玩得转吗

不依赖XX云 本地有办法解决吗




发表于 2020-7-10 20:15:42 | 显示全部楼层
我觉得可以考虑一下十几二十几的那种wifi故事机的方案,不知道他们有没有本地识别的功能。
那种方案如果都是服务端端识别的话,估计服务器带宽和系统负载压力很大。所以它们有可能是本地识别成文本或者其它语义然后发送到服务器的。
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2020-7-10 20:21:44 | 显示全部楼层
这个要找贾维斯
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-7-10 23:17:09 | 显示全部楼层
028053283 发表于 2020-7-10 20:15
我觉得可以考虑一下十几二十几的那种wifi故事机的方案,不知道他们有没有本地识别的功能。
那种方案如果都 ...

是个思路   :handshake:

回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 23:18:48 | 显示全部楼层

确定是贾。。?




不是真维斯?:smile:
回复 支持 反对

使用道具 举报

发表于 2020-7-10 23:22:20 来自手机浏览器 | 显示全部楼层
茶壹杯 发表于 2020-7-10 23:18
确定是贾。。?



真维斯是什么?
贾维斯应该是传说中的英式管家
语音识别还是用API接口联网处理吧
回复 支持 反对

使用道具 举报

发表于 2020-7-10 23:34:54 | 显示全部楼层
试试语言识别IC,比如:LD3320,个人感觉这个就是个玩具型IC,嘈杂环境直接无法识别,你也可以淘宝下,我看有其它离线识别方案。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 23:49:44 | 显示全部楼层
40560335 发表于 2020-7-10 23:34
试试语言识别IC,比如:LD3320,个人感觉这个就是个玩具型IC,嘈杂环境直接无法识别,你也可以淘宝下,我看 ...

感谢回复 :handshake:
回复 支持 反对

使用道具 举报

发表于 2020-7-13 09:11:06 | 显示全部楼层

这东西,如果没有电脑端(云端),估计即是玩具。。。。。 Xun飞可以参看。。。。。。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-13 16:43:07 | 显示全部楼层
devcang 发表于 2020-7-13 09:11
这东西,如果没有电脑端(云端),估计即是玩具。。。。。 Xun飞可以参看。。。。。。 ...

看到有个介绍   不知我有没有理解错 :

只要本地FLASH空间足够多  可以通过电脑端向服务器获取相关的语音指令  存储在本地单元
然后就有比较好的效果

目前只是有点兴趣 还不打算投钱下去
回复 支持 反对

使用道具 举报

发表于 2020-7-14 13:58:26 | 显示全部楼层
方案1:现在广泛使用的,都是云方式的,包括上面说的讯飞之类的,全是云方案,需要大型机来运行。数据量根本不是一片单片机可以承受的。
方案2:有专用ic,叫什么我记不得了,某宝有模块,100左右,需要把你想识别的语句的发音事先录进去,不能识别含义,只判断发音。
方案3:手机上的语音助手,比如windows早期的语音助手和windowsMobile上的语音识别。windows早期的语音助手能听懂挺多东西,后来升级改云了,超垃圾。windowsMobile上的语音识别跟方案2的专用ic效果差不多,可以事先录制一些控制语句,还能简单识别如:“播放歌曲《xxx》” 歌曲名字来自实际曲库。软件要先扫描一遍,同样还有打电话给xxx
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-14 21:44:01 | 显示全部楼层
mousebat04 发表于 2020-7-14 13:58
方案1:现在广泛使用的,都是云方式的,包括上面说的讯飞之类的,全是云方案,需要大型机来运行。数据量根 ...

:handshake:

windowsMobile阵营的开发者跑得早的估计都出息了
撤得晚的都是被M$坑的  :lol:


回复 支持 反对

使用道具 举报

发表于 2020-7-15 18:16:57 | 显示全部楼层
用过LD3320,真的就是玩具级别的,安静环境都会出现识别错误,嘈杂环境更加不用说了。
有看过用单片机做的论文,大概就是先把声音录下来,通过傅里叶变换得到声音的一些特征,然后再跟语音做对比,没见到实物,不好判断好不好。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-22 20:47 , Processed in 0.124800 second(s), 11 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表