百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
训练方法、声纹识别方法、装置和电子设备
本公开提供一种训练方法、声纹识别方法、装置和电子设备。所述训练方法包括:获取样本音频数据集,基于样本音频数据集训练声纹识别模型。样本音频数据集包括多个样本音频数据;声纹识别模型用于确定多个样本音频数据中每个样本音频数据对应的声纹特征。针对不同的声纹特征,声纹识别模型的损失函数含有不同的余量,且余量与声纹特征到该声纹特征所属类别的类别中心的距离相关联。本公开方法在损失函数中针对不同声纹特征引入不同的余量,从而提高声纹识别模型训练速度和识别准确率。
声纹识别模型的优化方法、装置、计算机设备及存储介质
本申请公开了声纹识别模型的优化方法、装置、计算机设备及存储介质,涉及人工智能技术领域,用于针对线上用户进行实时优化,提高了模型的准确率。方法包括:将预置的初始声纹识别模型分别部署到多个终端;获取目标终端发送的待识别语音数据;通过预置的历史存量数据对待识别语音数据进行声纹核身操作;当待识别语音数据通过声纹核身操作时,将多个匿名声纹向量确定为负样例数据并发送至目标终端,以使得目标终端进行梯度计算;获取多个关联终端发送的多个关联模型梯度,并采用联邦聚合平均算法对多个关联模型梯度和目标模型梯度进行聚合,得到聚合梯度;将聚合梯度发送到多个终端,以使得每个终端根据聚合梯度对初始声纹识别模型进行优化。
语音识别方法及智能家居系统、会议设备、计算设备
本申请公开了一种语音识别方法及智能家居系统、会议设备、计算设备。其中,该方法包括:采集至少一个目标对象的语音信息;将至少一个目标对象的语音信息输入至第一机器学习模型和第二机器学习模型,并将第一机器学习模型和第二机器学习模型中每个网络层的输出结果共同输入至目标机器学习模型进行分析,得到目标对象的身份信息和与身份信息对应的语音内容;输出语音内容。本申请解决了与短时文本无关任务对应的语音识别方案准确率较低的技术问题。