百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种语音情感识别方法
本发明涉及一种语音情感识别方法,通过首先对于输入的音频信号进行片段化操作,然后通过音频特征提取方法提取能够表达情感信息的特征,然后使用函数对每种特征进行计算初步拼接融合,融合后的特征输入到构建的一维卷积神经网络模型进行训练识别。采用多特征融合弥补了单一特征的单一化和表达能力有限的不足,多种表达情绪特征再融合的方法,可以从不同的角度、层次获取语音情感信息,对语音情感信息进行更加全面的描述,这样不但使系统得到更高的识别率,同时提高了系统鲁棒性;音频信号片段化识别可以更加精准的掌握情绪变化,避免了整条音频识别只返回概率最大标签而忽略其中情绪变动的问题。
一种语音信号未知情绪状态识别方法
本发明公开了一种语音信号未知情绪状态识别方法,对带有未知情绪状态信息的语段信号样本进行副语言特征提取,并结合情绪状态标签的语义嵌入,通过合成分类器的方法进行分类判决。在训练阶段首先对已知情绪类别训练语段样本提取副语言特征,同时根据已知情绪类别名称处理得到已知情绪类别原型权重,进而结合已知情绪类别训练语段样本标签,求解得到最优虚拟分类器;在测试阶段使用最优虚拟分类器,结合未知情绪类别测试语段样本的副语言特征,以及未知情绪类别原型权重,对测试样本进行未知情绪类别判决。本发明在语音信号情感识别方面基于语义嵌入提出了识别未知情绪语音信号的方法,能够针对语音信号有效地分辨出未知情绪。
语音信号处理方法、装置、存储介质及设备
本申请实施例公开了一种语音信号处理方法、装置、存储介质及设备,属于人工智能-语音技术领域。其中,方法包括:获取待处理的原始语音信号,对原始语音信号进行分离处理,得到原始语音信号中的有效语音信号,对原始语音信号进行特征提取,得到原始语音信号的特征信息,并根据原始语音信号的特征信息生成有效语音信号的增强系数。根据有效语音信号的增强系数以及原始语音信号,对有效语音信号进行增强处理,得到增强的目标语音信号。通过本申请能够有效避免有效语音信号丢失,提高有效语音信号的信噪比。
语音合成方法、系统、设备及存储介质
本申请实施例提供一种语音合成方法、系统、设备及存储介质。在本申请实施例中,提供一种多通道线性预测网络声码器,支持多通道输入,通过获取待合成文本在多个通道上的声学特征,利用该多通道线性预测网络声码器可合成出该待合成文本对应的语音信号;其中,基于线性预测进行语音合成可保证语音合成质量,与此同时,借助于多通道的优势可提高语音合成效率。
一种音视频多模态情感分类方法及系统
本发明涉及语音和图像处理、模式识别领域,为一种音视频多模态情感分类方法及系统,其方法包括步骤:对原始视频数据的处理与计算,得到视频数据样本、音频数据样本及文本特征样本;构建情感特征提取网络,分别对视频数据样本、音频数据样本及文本特征样本进行特征提取,获得多模态中的视觉模态特征、音频特征及文本特征;将提取到的视觉模态特征、音频特征及文本特征进行维度统一,输入到张量融合网络中进行融合学习,最后进行分类输出多模态情感分类概率结果。本发明能够对跨模态之间的情感信息进行有效的整合,对视频、音频及文本进行时空高维度上的特征提取,拼接成多模态特征向量,再融合学习并进行情感分类。