百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种语音情感识别方法
本发明涉及一种语音情感识别方法,通过首先对于输入的音频信号进行片段化操作,然后通过音频特征提取方法提取能够表达情感信息的特征,然后使用函数对每种特征进行计算初步拼接融合,融合后的特征输入到构建的一维卷积神经网络模型进行训练识别。采用多特征融合弥补了单一特征的单一化和表达能力有限的不足,多种表达情绪特征再融合的方法,可以从不同的角度、层次获取语音情感信息,对语音情感信息进行更加全面的描述,这样不但使系统得到更高的识别率,同时提高了系统鲁棒性;音频信号片段化识别可以更加精准的掌握情绪变化,避免了整条音频识别只返回概率最大标签而忽略其中情绪变动的问题。
语音情绪识别方法、装置、电子设备及存储介质
本发明涉及人工智能技术领域,提供一种语音情绪识别方法、装置、电子设备及存储介质,所述方法包括:对小样本数据集进行语音数据扩充,得到目标小样本数据集;将大样本数据集和目标小样本数据集进行融合,得到目标样本数据集;根据目标样本数据集训练构建好的语音情绪识别模型;获取待识别语音数据;将待识别语音数据输入至训练好的语音情绪识别模型中,得到待识别语音数据的情绪识别结果。本发明通过对小样本数据集进行语音数据扩充,扩充了小样本数据集的数据分布,增强了模型中的神经网络的鲁棒性,提高了语音情绪识别模型的泛化能力及情绪识别的准确率。
对象状态的确定方法、装置、存储介质及电子装置
本发明实施例提供了一种对象状态的确定方法、装置、存储介质及电子装置,其中,该方法包括:获取摄像设备对目标对象进行拍摄所得到的视频;获取声音采集设备对目标对象的声音进行采集所得到的声音;基于视频以及声音确定目标对象的目标状态。通过本发明,解决了相关技术中存在的确定对象的状态不准确的问题,提高了确定对象的状态的准确率。
一种语音信号未知情绪状态识别方法
本发明公开了一种语音信号未知情绪状态识别方法,对带有未知情绪状态信息的语段信号样本进行副语言特征提取,并结合情绪状态标签的语义嵌入,通过合成分类器的方法进行分类判决。在训练阶段首先对已知情绪类别训练语段样本提取副语言特征,同时根据已知情绪类别名称处理得到已知情绪类别原型权重,进而结合已知情绪类别训练语段样本标签,求解得到最优虚拟分类器;在测试阶段使用最优虚拟分类器,结合未知情绪类别测试语段样本的副语言特征,以及未知情绪类别原型权重,对测试样本进行未知情绪类别判决。本发明在语音信号情感识别方面基于语义嵌入提出了识别未知情绪语音信号的方法,能够针对语音信号有效地分辨出未知情绪。
语音转换方法、装置、终端及存储介质
本申请属于终端技术领域,具体而言,涉及一种语音转换方法、装置、终端及存储介质。其中,一种语音转换方法,应用于发送终端,包括:获取语音信息,获取所述语音信息对应的文字信息、声音响度以及情绪特征;将所述语音信息、所述文字信息、所述声音响度以及所述情绪特征发送至接收终端,所述接收终端用于显示所述语音信息并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。由于发送终端除了发送语音信息外,还发送了相应的文字信息以及情绪特征等信息,因此在接收者不方便收听语音信息时,让接收者看到文字信息的同时感受到发送者的声音响度和情绪特征,从而可以提高用户的使用体验。
一种用户交互方法、装置以及设备
本说明书实施例公开了一种用户交互方法、装置以及设备。方案包括:展示包含指示和对应的待发放权益的权益页面;采集用户响应于指示录入的语音数据和/或图像数据;通过情感计算对采集到的数据进行处理,以分析用户进行录入时的情感;若根据分析的结果,判定用户进行录入时的情感为预定的正面情感,则向用户发放待发放权益。
基于视频图像面部表情和语音的多模态儿童情绪识别融合模型
本发明公开了一种基于视频图像面部表情和语音的多模态儿童情绪识别模型,涉及情绪识别领域。在视频图像模态上,将面部表情训练数据使用Gabor滤波增强人脸纹理,然后将纹理增强后面部表情训练数据在稠密卷积神经网络(D)上进行训练,得到视频图像模态情绪识别模型;在语音模态上,将训练数据集的GFCC特征与MFCC特征进行融合,再输入至语音模态模型中进行训练,语音模态使用CGRU网络,CGRU网络由卷积神经网络(CNN)、门控循环单元(GRU)网络融合;最后将CGRU与SVM连接,得到语音情绪识别模型。视频图像模态识别结果和语音模态识别结果依据权值准则在决策层进行融合,实现多模态儿童情绪识别。本发明提供的技术方案,有效的提高儿童情绪识别的准确率,有较强的推广价值。
一种音视频多模态情感分类方法及系统
本发明涉及语音和图像处理、模式识别领域,为一种音视频多模态情感分类方法及系统,其方法包括步骤:对原始视频数据的处理与计算,得到视频数据样本、音频数据样本及文本特征样本;构建情感特征提取网络,分别对视频数据样本、音频数据样本及文本特征样本进行特征提取,获得多模态中的视觉模态特征、音频特征及文本特征;将提取到的视觉模态特征、音频特征及文本特征进行维度统一,输入到张量融合网络中进行融合学习,最后进行分类输出多模态情感分类概率结果。本发明能够对跨模态之间的情感信息进行有效的整合,对视频、音频及文本进行时空高维度上的特征提取,拼接成多模态特征向量,再融合学习并进行情感分类。
等保测评中基于AR的数据采集方法、装置及系统
本发明公开了等保测评中基于AR的数据采集方法、装置及系统,涉及网络安全技术领域。所述方法包括步骤:根据用户设置的现场处理事项与联系人的对应关系,将现场处理事项与前述联系人的IM账号进行绑定;采集用户选择的现场处理事项,获取该现场处理事项绑定的IM账号后,生成用户与前述联系人的即时通信交互界面;通过前述即时通信交互界面建立用户与前述联系人的增强现实通话,生成增强现实导航图像输出;获取增强现实通话过程中的语音信息,根据所述语音信息生成前述现场处理事项的安全管理访谈信息。本发明实现了环境感知、高效沟通、远程知识传递和信息智能整理,显著提高了等保测评效率。