百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
语音识别方法、装置及电子设备
本公开提供一种语音识别方法、装置及电子设备,所述方法包括:提取待识别语音的目标声纹特征;从预先训练的多个语音识别模型中获取与所述目标声纹特征对应的目标语音识别模型,所述多个语音识别模型分别与多个地理区域对应;基于所述目标语音识别模型对所述待识别语音进行语音识别,得到语音识别结果。本公开实施例能够提高语音识别效果。
一种二值化神经网络语音唤醒方法及系统
本发明涉及一种二值化神经网络语音唤醒方法及系统。该方法包括:获取待识别音频文件;并提取待识别音频文件的语音特征;根据语音特征和语音唤醒模型,确定待识别音频文件的识别结果;语音唤醒模型通过训练后的二值化的深度可分离卷积神经网络进行建立;语音唤醒模型具体的识别过程为:利用所述第一卷积层对输入进行量化处理;根据量化后的语音特征与网络层的二值量化参数权重以及网络层修正因子做卷积乘法,并将卷积后的数据与第一卷积层的偏置系数做加法;将第一卷积层的输出作为第二卷积层的输入;并将第一卷积层替换为第二卷积层,返回量化的步骤,直至输出识别结果。本发明能够在保证识别准确度的基础上,降低功耗。
一种编码器及采用该编码器的基于局部生成式注意力机制的端到端语音识别系统
本发明为一种编码器及采用该编码器的基于局部生成式注意力机制的端到端语音识别系统,本发明属于端到端语音识别技术,用低复杂度的生成式注意力计算代替点积式的注意力机制,减少了计算复杂度,同时提高了语音识别的正确率;所提出一种基于DSA的语音识别模型来减少计算复杂度。我们进一步提出了局部DSA,将DSA的注意范围限制在当前语音帧周围的若干帧之内。本发明将LDSA与SA结合起来让模型具有同时提取局部和全局信息的能力。在Ai-shell1普通话语音识别语料库上的实验结果显示,所提出的LDSA-Transformer实现了6.49%的字符错误率。相比于SA-Transformer,LDSA-Transformer正确率更高,计算复杂度更低。所提出的组合注意力方法在参数量和计算复杂度与SA-Transformer大致相同的情况下,取得了显著优于后者的正确率。
语音纠正方法、装置及电子设备
本公开提供一种语音纠正方法、装置及电子设备,所述方法包括:提取待处理语音的目标声音特征;基于所述目标声音特征确定所述待处理语音所属的目标地理区域;从预先训练的多个语音纠正模型中获取与所述目标地理区域对应的目标语音纠正模型,所述多个语音纠正模型分别与多个地理区域对应;基于所述目标语音纠正模型对所述待处理语音进行语音纠正,输出纠正后的语音。本公开实施例能够提高语音纠正效果。
语音语义模型的处理方法和装置
本发明公开了一种语音语义模型的处理方法和装置。其中,该方法包括:部署语音语义模型;将菜单标准问文件同步到目标租户的应用程序,以使目标租户的应用程序匹配本地菜单文件与菜单标准问文件,生成菜单关联文件,并加载菜单关联文件以启用语音语义模型。本发明解决了现有技术中APP租户依靠手工操作来触发新的语音语义模型生效的技术问题。