百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种基于反正切函数的零吸引回声消除方法
一种基于反正切函数的零吸引回声消除方法,其步骤是:第一步:获取信号,采样远端传来的语音信号从而得到当前时刻n的远端信号离散值x(n);同时,对采样近端麦克风收集到的回声信号从而得到当前时刻n的期望信号d(n)。第二步:计算自适应滤波器的输出y(n),第三步:回声抵消,将近端信号d(n)减去输出信号y(n)得到误差信号e(n)。第四步:权系数向量的更新,(1)根据当前时刻n的误差信号e(n),算出当前时刻n基于反正切函数的误差信号(2)利用去冲激干扰的误差信号更新得到下一个时刻n+1的抽头权向量W(n+1);第五步:令n=n+1,重复第一步至第四步的步骤,直至通话结束。本发明对电话通信系统的辨识能力强且收敛速度快、稳态误差低,回声消除效果明显。
人机交互方法、装置、存储介质及终端设备
本申请公开了一种人机交互方法、装置、存储介质及终端设备,属于人工智能技术领域。该方法应用于终端设备,终端设备集成有语音交互组件、N个业务组件和接入方提供的自定义声学模型;该语音交互组件中封装有与语音交互相关的SDK;N个业务组件是由接入方根据自身产品需求在开发方提供的业务组件集合中选择的;一个业务组件用于为终端设备提供至少一项服务,包括:通过语音交互组件接收自定义声学模型采集的音频数据;通过语音交互组件,将音频数据发送至服务器,该音频数据用于指示服务器执行音频处理并生成响应数据;通过语音交互组件,将服务器返回的响应数据下发至第一业务组件。本申请为接入方实现灵活以及简便地智能语音交互提供了可能。
一种基于变张成广义子空间的多通道频域语音增强算法
本发明公开了一种基于变张成广义子空间的多通道频域语音增强算法,本发明将时域的数据变换到频域,通过广义子空间追踪算法提取更新的信号协方差矩阵的广义特征向量构建变张成滤波器,该滤波器对频域数据不同子频带进行滤波处理,滤波后的信号取得了和纯净语音信号相近的统计量,取得了良好的滤波效果。本发明具有一定拓展性,可以协调语音输出信噪比和语音失真的平衡,同时可以应用在实时语音降噪处理场合。
语音信号处理方法、装置、存储介质及设备
本申请实施例公开了一种语音信号处理方法、装置、存储介质及设备,属于人工智能-语音技术领域。其中,方法包括:获取待处理的原始语音信号,对原始语音信号进行分离处理,得到原始语音信号中的有效语音信号,对原始语音信号进行特征提取,得到原始语音信号的特征信息,并根据原始语音信号的特征信息生成有效语音信号的增强系数。根据有效语音信号的增强系数以及原始语音信号,对有效语音信号进行增强处理,得到增强的目标语音信号。通过本申请能够有效避免有效语音信号丢失,提高有效语音信号的信噪比。
语音信号的增强处理方法、装置、设备及存储介质
本申请公开了一种语音信号的增强处理方法、装置、设备及存储介质,属于音视频技术领域。所述方法包括:获取目标语音信号;采用参考语音增强方式对目标语音信号进行增强处理,得到参考增强信号;根据参考增强信号,确定目标语音增强方式;采用目标语音增强方式对目标语音信号进行增强处理。本申请实施例提供的技术方案实现了结合语音信号的信号特点有针对性地确定实际采用的语音增强方式,相比于相关技术采用固定的语音增强方式无法做到针对语音信号的不同情况做出区别处理,本申请实施例在语音信号增强的过程中,充分考虑语音信号的信号特点,有助于准确有效地增强语音信号,提升语音信号的增强效果。
用于实时音频流播放的噪音处理方法、系统、介质和装置
本发明涉及音频处理领域,具体提供一种用于实时音频流播放的噪音处理方法,旨在解决实时音频流播放过程中产生的噪音问题。为此目的,本发明的方法包括:依次将缓存队列中多个相邻的原始音频数据包进行组合,对组合数据包中的原始音频数据通过频率转换算法进行频率转换,对包含多个转换后音频数据的组合数据包进行拆分,舍弃掉拆分后的最后一个音频数据包,保留其余未经频率转换算法降调处理的音频数据包,将转换后且未经过频率转换算法降调处理的音频数据包保存到浏览器待播放音频数据缓存队列中,由浏览器播放。本发明解决了频率转换算法对音频数据进行过度修饰导致的噪音问题,使得在实时连续播放音频流的场景中不会出现噪音。
一种监控音频的处理方法、装置、存储介质及电子设备
本申请实施例公开了一种监控音频的处理方法、装置、存储介质及电子设备。该方法包括:根据当前环境的场景类型,确定音频质量提升参数,采用所述音频质量提升参数进行监控视频的录制;若录制过程中监控到声源目标,则根据声源目标的距离确定增益大小;以及若监控到声源目标发出的声音信息,则根据声音信息的类型确定增益频段;根据所述增益大小以及增益频段对监控音频进行处理。通过执行本技术方案,可以通过软件的处理方式,对监控音频进行有效处理,以得到高质量的监控音频的效果。
音频编码方法、装置、设备以及计算机可读存储介质
本发明公开了一种音频编码方法、装置、设备以及计算机可读存储介质,所述方法包括:将第一终端的待编码的音频信息发送至第二终端;获取所述第二终端发送的所述音频信息的语音损伤信息;根据所述语音损伤信息确定所述音频信息的平均意见MOS值;根据所述MOS值对应的编码码率对所述音频信息进行编码。本发明保证了编码后的音频信息的音频质量。
车内含噪语音数据生成方法、装置以及设备
本发明公开了一种车内含噪语音数据生成方法、装置以及设备,本发明的构思在于预先采集纯实景车噪及纯人声声源以构造出车用语音素材库,该车用语音素材库中的音频资源用于与用户所提需求结合,分别得到符合用户期望的车内含噪语音数据的两个独立元素,纯人声声源以及纯实景车噪,然后将匹配出的纯人声声源以及纯实景车噪进行通道融合,生成用户所需的目标车内含噪语音数据。本发明实现了对语音素材的复用,解决了当前实车实景人工录制方式费时、费力、高成本等弊端,并有效提升了车用交互语音数据样本的制作效率。
语音处理方法和系统、及语音交互设备和方法
提出了一种语音处理方法和系统、及语音交互设备和方法,其中该语音处理方法包括:接收来自用户的语音数据;确定所述用户的用户身份;以及基于所述用户身份,生成所述语音数据的处理结果。本发明能够依据用户身份提供个性化语音交互服务,能够根据不同用户的不同喜好,推荐出非精确意图场景下不同的信息服务流组合。