百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
基于局部卷积块注意力网络的语音端点检测方法及系统
本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
一种TTS系统性能测试方法、装置、设备及介质
本申请公开了一种TTS系统性能测试方法、装置、设备及介质,应用于语音合成技术领域,用以解决现有技术的TTS系统性能测试方法存在的准确度较低的问题。具体为:获取TTS系统对输入文本的文本预测结果和语音预测结果;基于文本预测结果,确定TTS系统的文本处理性能测试结果;基于语音预测结果,确定TTS系统的语音转换性能测试结果;基于文本处理性能测试结果和语音转换性能测试结果,确定TTS系统的综合性能测试结果。这样,采用文本处理和语音转换两个方面的客观指标对TTS系统的性能进行测试,不仅可以实现对TTS系统性能的全方位测试,还可以提高TTS系统性能测试的准确度。
健康智能检测方法、装置、电子设备及可读存储介质
本申请公开了一种健康智能检测方法、装置、电子设备及可读存储介质,其方法包括获取音频信号,并对所述音频信号进行预处理,得到检测信号;将所述检测信号转化为矩阵数字矩阵;将得到的矩阵数字矩阵作为检测样本,输入健康智能检测模型中,以获取检测结果;其中,所述健康智能检测模型是采用迁移学习和卷积神经网络对训练样本进行训练得到的。本申请由于卷积神经网络各组件或部分组件基于迁移学习进行了重新训练,显著提升了对人们健康检测的准确度;且本申请中的健康智能检测模型为分类模型,计算量小,可将其部署于人们的移动终端中,使用方便,极大程度上提升了用户的使用感受。
一种语音情感识别方法
本发明涉及一种语音情感识别方法,通过首先对于输入的音频信号进行片段化操作,然后通过音频特征提取方法提取能够表达情感信息的特征,然后使用函数对每种特征进行计算初步拼接融合,融合后的特征输入到构建的一维卷积神经网络模型进行训练识别。采用多特征融合弥补了单一特征的单一化和表达能力有限的不足,多种表达情绪特征再融合的方法,可以从不同的角度、层次获取语音情感信息,对语音情感信息进行更加全面的描述,这样不但使系统得到更高的识别率,同时提高了系统鲁棒性;音频信号片段化识别可以更加精准的掌握情绪变化,避免了整条音频识别只返回概率最大标签而忽略其中情绪变动的问题。
语音情绪识别方法、装置、电子设备及存储介质
本发明涉及人工智能技术领域,提供一种语音情绪识别方法、装置、电子设备及存储介质,所述方法包括:对小样本数据集进行语音数据扩充,得到目标小样本数据集;将大样本数据集和目标小样本数据集进行融合,得到目标样本数据集;根据目标样本数据集训练构建好的语音情绪识别模型;获取待识别语音数据;将待识别语音数据输入至训练好的语音情绪识别模型中,得到待识别语音数据的情绪识别结果。本发明通过对小样本数据集进行语音数据扩充,扩充了小样本数据集的数据分布,增强了模型中的神经网络的鲁棒性,提高了语音情绪识别模型的泛化能力及情绪识别的准确率。
对象状态的确定方法、装置、存储介质及电子装置
本发明实施例提供了一种对象状态的确定方法、装置、存储介质及电子装置,其中,该方法包括:获取摄像设备对目标对象进行拍摄所得到的视频;获取声音采集设备对目标对象的声音进行采集所得到的声音;基于视频以及声音确定目标对象的目标状态。通过本发明,解决了相关技术中存在的确定对象的状态不准确的问题,提高了确定对象的状态的准确率。
一种语音信号未知情绪状态识别方法
本发明公开了一种语音信号未知情绪状态识别方法,对带有未知情绪状态信息的语段信号样本进行副语言特征提取,并结合情绪状态标签的语义嵌入,通过合成分类器的方法进行分类判决。在训练阶段首先对已知情绪类别训练语段样本提取副语言特征,同时根据已知情绪类别名称处理得到已知情绪类别原型权重,进而结合已知情绪类别训练语段样本标签,求解得到最优虚拟分类器;在测试阶段使用最优虚拟分类器,结合未知情绪类别测试语段样本的副语言特征,以及未知情绪类别原型权重,对测试样本进行未知情绪类别判决。本发明在语音信号情感识别方面基于语义嵌入提出了识别未知情绪语音信号的方法,能够针对语音信号有效地分辨出未知情绪。
一种基于语音数据的质量评价方法
本发明公开了一种基于语音数据的质量评价方法,涉及语音数据质量评价技术领域,解决了现有技术中能够对测试语音进行预处理导致工作强度增加的技术问题,获取一段20秒的语音,随后获取到一段质量评价合格的语音并将其标记为标准语音,将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较,将监测语音进行帧划分,将监测语音划分为若干个语音帧,获取到语音帧的音频波长和频率,随后通过公式获取到语音帧的参数分析系数Xi,将测试语音内语音帧构建参数分析系数集合,对测试语音进行预处理,提高了测试语音的合格率,防止对不合格语音进行质量评价,导致工作强度增加,降低了语音质量评价的工作效率。
一种基于听觉谱特征提取的直升机声信号识别方法
本发明涉及直升机声信号识别,具体公开了一种基于听觉谱特征提取的直升机声信号识别方法,包括如下步骤:步骤1:分段加窗;步骤2:FFT分析;步骤3:尺度变换;步骤4:听觉滤波;步骤5:对数压缩;步骤6:求取均值;步骤7:分类识别。本发明的有益效果为:将非线性频率尺度变换和听觉滤波器引入到FFT分析与对数压缩之间,借助听觉计算模型的非线性频率选择能力以及更强的中低频分辨率和分析处理能力,使不易察觉的直升机声信号个性特征在若干分析频带内显露出来,提升直升机辨识的有效性和鲁棒性。
一种基于声音传感器的生产设备预测性维修方法与系统
本发明公开了一种基于声音传感器的生产设备预测性维修方法与系统,涉及设备维修领域,其通过获取正常状态下各生产设备运转时的音频数据,并对各音频数据进行滤波后得到其对应的标准音频波形文件;通过各标准音频波形文件构建对应的原始音频生成模型,并根据各原始音频生成模型获取各标准音频波形文件对应的预测音频文件;实时采集各生产设备运转时的音频数据,并对其进行滤波后得到实时音频波形文件;获取各实时音频波形文件与其对应的预测音频文件的差异度;当各差异度未在对应的预设标准范围内时发出对应的维修预警信息,解决了目前制造工厂中由于设备在不可预见的情况下出现的一些故障所导致的维修不及时,质量、产能和交期不可控的问题。