声音信号处理方法、设备和计算机可读存储介质
技术领域
本发明涉及声音处理
技术领域
,特别涉及一种声音信号处理方法、声音信号处理设备和计算机可读存储介质。背景技术
目前,对于声学产品(包括但限于头戴式VR设备或头戴式AR设备或耳机等),在声音降噪时,一般麦克风阵列来实现声音的空间指向性,提高语音质量。然而,麦克风阵列需要用到多个麦克风,成本较高。
发明内容
本发明的主要目的是提出一种声音信号处理方法,旨在降低实现声音空间指向性的成本。
为实现上述目的,本发明提出的声音信号处理方法用于声音信号处理设备,所述声音信号处理设备包括麦克风、及与所述麦克风连通的第一拾音通道和第二拾音通道,所述第二拾音通道长于所述第一拾音通道,所述声音信号处理方法包括:
获取第二拾音通道相对于第一拾音通道的延时时间和信号补偿参数;
根据所述延时时间,从通过所述麦克风接收到的声音信号中获取与第一拾音通道对应的第一声音信号、及包括第二拾音通道所传递声音的第二声音信号;
根据所述延时时间,对所述第一声音信号进行延时处理,及根据所述信号补偿参数,对所述第二声音信号进行补偿处理;
根据延时处理后的第一声音信号和补偿处理后的第二声音信号,获取目标声音信号后输出。
可选地,所述获取第二拾音通道相对于第一拾音通道的延时时间和信号补偿参数的步骤包括:
封堵第二拾音通道的拾音孔,通过所述麦克风获取置放在第一拾音通道的拾音孔处的标准声源的第一标准声音信号;
封堵第一拾音通道的拾音孔,通过所述麦克风获取置放在第二拾音通道的拾音孔处的标准声源的第二标准声音信号;
根据所述第一标准声音信号和所述第二标准声音信号,获取所述延时时间和所述信号补偿参数。
可选地,所述根据所述第一标准声音信号和所述第二标准声音信号,获取所述延时时间和所述信号补偿参数的步骤包括:
计算接收到所述第二标准声音信号与所述第一标准声音信号在时域上的时间差值,以得到所述延时时间;
计算所述第二标准声音信号与所述第一标准声音信号之间的信号强度之比,以得到所述信号补偿参数。
可选地,所述根据延时处理后的第一声音信号和补偿处理后的第二声音信号,获取目标声音信号后输出的步骤包括:
对延时处理后的第一声音信号和补偿处理后的第二声音信号进行波束成形处理,得到所述目标声音信号后输出。
可选地,在所述对延时处理后的第一声音信号和补偿处理后的第二声音信号进行波束成形处理,得到所述目标声音信号后输出的步骤之前,所述声音信号处理方法还包括:
将第二声音信号中所包括的第一拾音通道所传递声音的部分信号滤除。
本发明还提出一种声音信号处理设备,包括:
壳体,设有第一拾音通道和第二拾音通道,所述第二拾音通道长于所述第一拾音通道;
麦克风,设于所述壳体,并与所述第一拾音通道和所述第二拾音通道均连通;以及
存储器和处理器,所述存储器上存储有可在所述处理器上运行的声音信号处理程序,所述声音信号处理程序被所述处理器执行时实现前述的声音信号处理方法的步骤。
可选地,所述第一拾音通道的拾音孔和所述第二拾音通道的拾音孔均显露于所述壳体的下侧。
可选地,所述第一拾音通道的拾音孔和所述第二拾音通道的拾音孔呈对称地设于所述壳体。
可选地,所述声音信号处理设备为头戴式VR设备或头戴式AR设备或耳机。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有声音信号处理程序,所述声音信号处理程序被处理器执行时实现前述的声音信号处理方法的步骤。
本发明的技术方案通过对与较短的第一拾音通道对应的第一声音信号进行延时处理,以使所述第一声音信号与所述第二声音信号在时域上同步,并通过对衰减更大的与较长的第二拾音通道对应的第二声音信号进行补偿处理,以避免衰减差别所导致的信号差别影响后续声音信号的处理性能,再对延时处理后的第一声音信号和补偿处理后的第二声音信号进行处理,来获取目标声音信号并输出,如此,不需要采用麦克风阵列,而仅需要采用一个麦克风就能获得具有空间指向性的声音,能低成本且有效地实现声音的增强及降噪,保证输出的目标声音信号的信号性能,提高声音识别率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明声音信号处理方法一实施例的步骤流程图;
图2为第一标准声音信号和第二标准声音信号的波形图;
图3为本发明声音信号处理设备一实施例于佩戴状态下的示意图;
图4为图3中声音信号处理设备的仰视图;
图5为图3中声音信号处理设备的剖视结构示意图。
附图标号说明:
标号
名称
标号
名称
10
壳体
11
第一拾音通道
12
第二拾音通道
20
麦克风
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,若全文中出现的“和/或”或者“及/或”,其含义包括三个并列的方案,以“A和/或B”为例,包括A方案、或B方案、或A和B同时满足的方案。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提出一种声音信号处理方法。
参照图1,在本发明一实施例中,该声音信号处理方法用于声音信号处理设备,所述声音信号处理设备包括麦克风、及与所述麦克风连通的第一拾音通道和第二拾音通道,所述第二拾音通道长于所述第一拾音通道。所述声音信号处理方法包括:
步骤S10、获取第二拾音通道相对于第一拾音通道的延时时间和信号补偿参数;
步骤S20、根据所述延时时间,从通过所述麦克风接收到的声音信号中获取与第一拾音通道对应的第一声音信号、及包括第二拾音通道所传递声音的第二声音信号;
步骤S30、根据所述延时时间,对所述第一声音信号进行延时处理,及根据所述信号补偿参数,对所述第二声音信号进行补偿处理;
步骤S40、根据延时处理后的第一声音信号和补偿处理后的第二声音信号,获取目标声音信号后输出。
在本实施例中,由于第二拾音通道长于第一拾音通道,故而声音经由第一拾音通道到达麦克风所需的时间要短于声音经由第二拾音通道到达麦克风所需的时间,其二者的时间差为所述延时时间。另外,同样由于第二拾音通道长于第一拾音通道,声音在通过更长的第二拾音通道的过程中,声音会有更大的衰减,为避免这个衰减差别所导致的信号差别影响后续声音信号的处理性能,对所述第二声音信号进行了补偿处理。
本发明的技术方案通过对与较短的第一拾音通道对应的第一声音信号进行延时处理,以使所述第一声音信号与所述第二声音信号在时域上同步,并通过对衰减更大的与较长的第二拾音通道对应的第二声音信号进行补偿处理,以避免衰减差别所导致的信号差别影响后续声音信号的处理性能,再对延时处理后的第一声音信号和补偿处理后的第二声音信号进行处理,来获取目标声音信号并输出,如此,不需要采用麦克风阵列,而仅需要采用一个麦克风就能获得具有空间指向性的声音,能低成本且有效地实现声音的增强及降噪,保证输出的目标声音信号的信号性能,提高声音识别率。
进一步地,所述步骤S10包括:
步骤S11、封堵第二拾音通道的拾音孔,通过所述麦克风获取置放在第一拾音通道的拾音孔处的标准声源的第一标准声音信号;
步骤S12、封堵第一拾音通道的拾音孔,通过所述麦克风获取置放在第二拾音通道的拾音孔处的标准声源的第二标准声音信号;
步骤S13、根据所述第一标准声音信号和所述第二标准声音信号,获取所述延时时间和所述信号补偿参数。
在本实施例中,通过标准声源的采用,来保证实验中第二拾音通道拾音孔处所接收到的声音与第一拾音通道拾音孔处所接收到的声音是一致的,从而使得所述第一标准声音信号与所述第二标准声音信号之间差别仅是由于第二拾音通道与所述第一拾音通道的不同,从而保证所获取的所述延时时间和所述信号补偿参数的准确性。本实施例是通过实验的方式来获取所述延时时间和所述信号补偿参数的,实验得到的数据更为准确。然本设计不限于此,于其他实施例中,还可通过查询资料,结合第二拾音通道与第一拾音通道之间差异,利用经验数据来获取所述延时时间和所述信号补偿参数。
需要说明的是,所述步骤S11和所述步骤S12之间的先后顺序可以调换,本发明对此不作限制。
进一步地,所述步骤S13包括:
步骤S131、计算接收到所述第二标准声音信号与所述第一标准声音信号在时域上的时间差值,以得到所述延时时间;
步骤S132、计算所述第二标准声音信号与所述第一标准声音信号之间的信号强度之比,以得到所述信号补偿参数。
在本实施例中,参照图2,图2为第一标准声音信号和第二标准声音信号的波形图,从图2可以看出,在标准声源发出声音之后,要经过时间间隔t1,麦克风才接收到第一标准声音信号;而要经过时间间隔t2,麦克风才接收到第二标准声音信号;所述延时时间T=t2-t1。另外,从图2还可以看出,第一标准声音信号的信号强度S01要强于第二标准声音信号的信号强度S02,所述信号补偿参数F=S02/S01。
需要说明的是,所述步骤S131和所述步骤S132之间的先后顺序可以调换,本发明对此不作限制。
本实施例中,在所述步骤S30中,对所述第一声音信号进行延时处理时,通常将所述第一声音信号的波形在时域上进行平移所述延时时间T,以得到延时处理后的第一声音信号的波形;而对所述第二声音信号进行补偿处理时,则通常将所述第二声音信号的信号强度S2与所述信号补偿参数F作商,也即,补偿处理后的第二声音信号的信号强度为S2/F,将所述第二声音信号作放大处理。
进一步地,所述步骤S40包括:
对延时处理后的第一声音信号和补偿处理后的第二声音信号进行波束成形处理,得到所述目标声音信号后输出。
在本实施例中,通过波束形成处理的方式,提取延时处理后的第一声音信号和补偿处理后的第二声音信号中相关性较强的部分进行合并处理,可以实现声音信号增强以及降低信号噪声的效果,以保证输出的目标声音信号的信号性能,提高声音识别率。进一步地,在所述步骤S40之前,所述声音信号处理方法还包括:步骤S50、将第二声音信号中所包括的第一拾音通道所传递声音的部分信号滤除;如此,可避免在波束成形处理时,所述第二声音信号中存在干扰成分,从而提高声音信号的处理性能。另外,需要说明的是,于其他实施例中,还可采用其他能获得声音空间指向性的处理方式对延时处理后的第一声音信号和补偿处理后的第二声音信号进行处理,本发明对此不作限制。
本发明还提出一种声音信号处理设备,该声音信号处理设备包括壳体、设于所述壳体的麦克风及存储器和处理器,所述存储器上存储有可在所述处理器上运行的声音信号处理程序,所述声音信号处理程序被所述处理器执行时实现如上所述的声音信号处理方法的步骤,该声音信号处理方法的具体步骤参照上述实施例,由于本声音信号处理设备采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。其中,所述壳体设有第一拾音通道和第二拾音通道,所述第二拾音通道长于所述第一拾音通道,所述麦克风与所述第一拾音通道和所述第二拾音通道均连通。
在本发明中,所述声音信号处理设备为头戴式VR设备或头戴式AR设备或耳机等。
不失一般性,以下描述以所述声音信号处理设备为头戴式VR设备为例。
参照图3至图5,在本实施例中,所述壳体10为头戴式VR设备的外壳,其通常佩戴在头部双眼位置的前侧,麦克风20通常内置于所述壳体10。
进一步地,所述第一拾音通道11的拾音孔和所述第二拾音通道12的拾音孔均显露于所述壳体10的下侧。可以理解,一方面,壳体10的下侧更为靠近用户嘴的位置,也即更为靠近声音发出的位置,且朝向声音发出的位置,有利于更清晰地对用户所发出的声音进行拾取,提高产品的拾音效果;另一方面,设于壳体10的下侧可使得所述第一拾音通道11的拾音孔和所述第二拾音通道12的拾音孔均朝下,考虑到杂物受到重力的作用有向下的趋势,如此设置,能降低拾音孔被杂物堵塞的概率。然本设计不限于此,于其他实施例中,所述第一拾音通道11的拾音孔和所述第二拾音通道12的拾音孔还可但不限于均显露于所述壳体10的前侧。
进一步地,所述第一拾音通道11的拾音孔和所述第二拾音通道12的拾音孔呈对称地设于所述壳体10;如此,有利于使得用户所发出的声音能同时到达所述第一拾音通道11的拾音孔和所述第二拾音通道12的拾音孔,使得两拾音孔处所进入的声音没有时间差且相位相同,从而有利于提高处理后的声音性能,提高声音识别率。当然,于其他实施例中,两拾音孔也可有轻微的不对称。
本发明还提出一种计算机可读存储介质,该计算机可读存储介质上存储有声音信号处理程序,所述声音信号处理程序被处理器执行时实现如上所述的声音信号处理方法的步骤,该声音信号处理方法的具体步骤参照上述实施例,由于本计算机可读存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。