基于语音固定条件下的查询方法
技术领域
本发明涉及自然语言处理
技术领域
,具体为基于语音固定条件下的查询方法。背景技术
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论,它能为学科研究提供切实的、有价值的参考,用户在通过语音信息来查询问题结果时,一般是将用户问题的查询语音信息通过语音识别模块转换为文本,然后再通过自然语言理解模块对文本信息进行解析和理解匹配,最后在知识图谱中查找并检索出与用户文本最接近的问题,最终将查询问题的结果信息展示给用户;
而现有的语音查询方法在对用户问题进行理解匹配的过程中需要维护一个庞大的知识库,通过将查询语音与知识库内的对应知识文本进行匹配,来生成问题查询的答案,以此需要对该知识库进行不断的更新维护,使得用户所问的问题需要存在于该知识库中,导致该问题查询方式的扩展性差,维护成本高,而现有的基于语音查询助手来查询问题的方式,由于在查询过程中无法对查询问题的语音信息进行处理,以此使得该问题语音信息在出现同音、歧音和歧义时无法及时的将用户的查询问题的准确意愿信息进行输入和查询,进而增大了查询结果的偏差,使得用户无法获得与其查询意愿相对应的查询结果。
发明内容
本发明提供基于语音固定条件下的查询方法,可以有效解决上述背景技术中提出现有技术需要对该知识库进行不断的更新维护,使得用户所问的问题需要存在于该知识库中,导致该问题查询方式的扩展性差,维护成本高,增大了查询结果的偏差,使得用户无法获得与其查询意愿相对应的查询结果的问题。
为实现上述目的,本发明提供如下技术方案:基于语音固定条件下的查询方法,具体包括如下步骤:
S1、用户录入语音;
S2、自然语音识别;
S3、通过知识图谱提取实体关键词;
S4、填充模板词槽;
S5、对模板的查询结果进行排序;
S6、展示排序结果。
根据上述技术方案,所述S1中,用户录入语音是指通过语音录入设备将用户需要查询的问题语音信息进行录入,用户问题的语音信息的录入次数初始设定为两次,设定单次问题语音录入信息的时间为20S,语音录入设备在两次录入用户的问题语音信息后,确定最优录音结果,无最优录音结果,则发出提示,指导用户在20S内完成第三次录音,三次录音结束均无最优录音结果,则提示用户无法完成问题语音信息的查询,在最优录音结果确定后,获取用户查询问题的意愿信息。
根据上述技术方案,在获取用户查询问题的意愿信息时,具体是指在获取用户查询问题的最优录音结果后,语音录入设备发出提示,指导用户录入与问题语音信息相关的意愿陈述语音,该意愿陈述语音具体是指用户所期待的该查询问题的预期结果以及倾向性结果,该用户的预期结果以及倾向性结果则为用户查询问题的意愿信息。
根据上述技术方案,所述S2中,自然语音识别是指将用户查询的问题语音信息从语音格式自动转换为文本字符格式,该问题语音信息为最优录音结果,在问题语音信息转换为问题文本信息时,对问题语音信息进行同音和歧音处理,具体指将问题语音信息的同音词义进行不同类型的转换,将问题语音信息的歧音词义进行不同类型的转换。
根据上述技术方案,在问题语音信息通过同音和歧音处理后,并转换为不同类型的问题文本信息后,将转换后不同类型的问题文本信息进行语音判断,并结合用户查询问题的意愿信息来去除明显不合问题语音信息语义的问题文本信息,并保留符合用户意愿的问题文本信息。
根据上述技术方案,所述S3中,通过知识图谱提取实体关键词,是指在问题语音信息通过格式转换成符合用户意愿的问题文本信息后,通过知识图谱来提取该问题文本信息的实体关键词信息,在实体关键词信息提取后对该提取的实体关键词进行歧义分析处理,具体是指依据实体关键词信息的不同歧义信息来将该提取的实体关键词进行不同类型的划分,并将不同歧义的实体关键词信息进行区分存储。
根据上述技术方案,所述S4中,在依照知识图谱提取实体关键词信息后,以实体关键词信息为填充模板,并将不同歧义的实体关键词信息全部构建为对应的词槽填充模板,在不同歧义实体关键词填充模板构建后,依照用户的意愿信息,组织词槽内对应的填词,来对实体关键词填充模板进行填槽,直至将不同歧义的实体关键词填充模板分别通过填词进行信息补全;
通过填充模板词槽,实现将用户意图信息转化为明确的查询指令,且通过补全信息使用户的查询指令更加清晰准确,在实体关键词填充模板通过填词补全信息后,将不同歧义实体关键词所转化的明确的查询指令代入到知识图谱中分别进行问题信息查询。
根据上述技术方案,所述S5中,在实际关键词通过填充模板词槽处理后,并将填充模板词槽处理后对应的查询指令代入到知识图谱中进行问题查询后,将知识图谱查询的结果进行输出,并对模板的查询结果进行排序。
根据上述技术方案,在对查询结果进行排序时,首先将多个不同歧义的实体关键词所对应的查询结果进行归纳处理,并明确归纳后该对应的查询结果的释义,然后将对应的查询结果与用户查询问题的意愿信息进行比对,最终通过查询结果与用户意愿信息的匹配度作为排序标准,来将多个查询结果进行排序,并依照排序结果来将多种查询结果进行标号。
根据上述技术方案,所述S6中,在将查询结果与用户查询问题的意愿信息进行比对并排序处理后,将查询结果依照其排序的次序进行展示,具体是将依照查询结果的标号顺序将查询结果通过文本和语音展示的方式进行展示,文本和语音的展示方式可依据用户需求择一进行展示,也可通过文本和语音相结合的方式进行展示。
与现有技术相比,本发明的有益效果:
1、通过基于查询条件自动生成技术来结合知识图谱,实现对用户的语音信息查询和结果输出,以此方式来摒弃了传统方法中需要维护知识库的缺点,同时通过该查询技术实现了用户短文本问题信息的意图解析,可快速的进行多维度查询数据,实现语音查询,且通过自然语言来筛选列表类型的数据,具有更高的准确度,鲁棒性好。
2、在用户录入语音时,通过设定语音信息的录入次数和单次问题语音录入信息的时间,使得该语音信息在录入过程中能够更加快速的获取最优录音结果,同时保证了该语音信息在录入过程中的准确率,同时在录入语音时,能够获取用户查询问题的意愿信息,且通过获取用户的意愿信息使得后续在对查询结果输出排序时能够依据用户的意愿信息来将查询结果进行优先排序,以此使得用户能够更加准确的得到该查询问题的结果信息,保证了用户查询问题时该问题结果信息的准确性。
3、在对用户查询问题的语音信息进行格式转换时,能够对该问题语音信息进行同音和歧音处理,以此使得问题语音信息能够依据其的同音词义和歧音词义进行不同类型的转换,且在转换后,能够结合用户查询问题的意愿信息来去除明显不合问题语音信息语义的问题文本信息,并保留符合用户意愿的问题文本信息,进而使得后续问题语音信息在进行查询时能够快速的对符合用户意愿的问题语音信息进行查询,保证查询的效率和准确率;
且在同音和歧音处理的基础上,在实体关键词信息提取后能够对该提取的实体关键词进行歧义分析处理,并且能够将该提取的实体关键词进行不同类型的划分,以此使得不同歧义的实体关键词信息能够作为不同的查询条件,进而使得用户在查询问题时能够保证用户所要查询的问题结果更加全面。
4、在依照知识图谱提取实体关键词信息后,以实体关键词信息为填充模板,并将不同歧义的实体关键词信息全部构建为对应的词槽填充模板,在不同歧义实体关键词填充模板构建后,;
通过填充模板词槽,便于依照用户的意愿信息,来组织词槽内对应的填词,进而对实体关键词填充模板进行填槽,不仅方便将不同歧义的实体关键词填充模板分别通过填词进行信息补全,同时也能够实现将用户意图信息转化为明确的查询指令,且通过补全信息使用户的查询指令更加清晰准确,进一步保证用户后续在通过知识图谱查询问题结果时更加准确。
5、在通过知识图谱将用户问题查询的结果进行输出后,能够将对应的查询结果与用户查询问题的意愿信息进行比对,并且通过查询结果与用户意愿信息的匹配度作为排序标准,来将多个查询结果进行排序,同时能够将查询结果依照其排序的次序进行展示,以此使得用户后续在查询问题结果能够更加直观明确的找寻到与其查询问题对应的查询结果,同时也能够使用户对其查询问题的不同输出结果具有更加直观的了解,以此改善了用户在查询问题结果时的体验,保证了问题结果查询的效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明查询方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1所示,本发明提供一种技术方案,基于语音固定条件下的查询方法,具体包括如下步骤:
S1、用户录入语音;
S2、自然语音识别;
S3、通过知识图谱提取实体关键词;
S4、填充模板词槽;
S5、对模板的查询结果进行排序;
S6、展示排序结果。
基于上述技术方案,S1中,用户录入语音是指通过语音录入设备将用户需要查询的问题语音信息进行录入,用户问题的语音信息的录入次数初始设定为两次,设定单次问题语音录入信息的时间为20S,语音录入设备在两次录入用户的问题语音信息后,确定最优录音结果,无最优录音结果,则发出提示,指导用户在20S内完成第三次录音,三次录音结束均无最优录音结果,则提示用户无法完成问题语音信息的查询,在最优录音结果确定后,获取用户查询问题的意愿信息。
基于上述技术方案,在获取用户查询问题的意愿信息时,具体是指在获取用户查询问题的最优录音结果后,语音录入设备发出提示,指导用户录入与问题语音信息相关的意愿陈述语音,该意愿陈述语音具体是指用户所期待的该查询问题的预期结果以及倾向性结果,该用户的预期结果以及倾向性结果则为用户查询问题的意愿信息。
基于上述技术方案,S2中,自然语音识别是指将用户查询的问题语音信息从语音格式自动转换为文本字符格式,该问题语音信息为最优录音结果,在问题语音信息转换为问题文本信息时,对问题语音信息进行同音和歧音处理,具体指将问题语音信息的同音词义进行不同类型的转换,将问题语音信息的歧音词义进行不同类型的转换。
基于上述技术方案,在问题语音信息通过同音和歧音处理后,并转换为不同类型的问题文本信息后,将转换后不同类型的问题文本信息进行语音判断,并结合用户查询问题的意愿信息来去除明显不合问题语音信息语义的问题文本信息,并保留符合用户意愿的问题文本信息。
基于上述技术方案,S3中,通过知识图谱提取实体关键词,是指在问题语音信息通过格式转换成符合用户意愿的问题文本信息后,通过知识图谱来提取该问题文本信息的实体关键词信息,在实体关键词信息提取后对该提取的实体关键词进行歧义分析处理,具体是指依据实体关键词信息的不同歧义信息来将该提取的实体关键词进行不同类型的划分,并将不同歧义的实体关键词信息进行区分存储。
基于上述技术方案,S4中,在依照知识图谱提取实体关键词信息后,以实体关键词信息为填充模板,并将不同歧义的实体关键词信息全部构建为对应的词槽填充模板,在不同歧义实体关键词填充模板构建后,依照用户的意愿信息,组织词槽内对应的填词,来对实体关键词填充模板进行填槽,直至将不同歧义的实体关键词填充模板分别通过填词进行信息补全;
通过填充模板词槽,实现将用户意图信息转化为明确的查询指令,且通过补全信息使用户的查询指令更加清晰准确,在实体关键词填充模板通过填词补全信息后,将不同歧义实体关键词所转化的明确的查询指令代入到知识图谱中分别进行问题信息查询。
基于上述技术方案,S5中,在实际关键词通过填充模板词槽处理后,并将填充模板词槽处理后对应的查询指令代入到知识图谱中进行问题查询后,将知识图谱查询的结果进行输出,并对模板的查询结果进行排序。
基于上述技术方案,在对查询结果进行排序时,首先将多个不同歧义的实体关键词所对应的查询结果进行归纳处理,并明确归纳后该对应的查询结果的释义,然后将对应的查询结果与用户查询问题的意愿信息进行比对,最终通过查询结果与用户意愿信息的匹配度作为排序标准,来将多个查询结果进行排序,并依照排序结果来将多种查询结果进行标号。
基于上述技术方案,S6中,在将查询结果与用户查询问题的意愿信息进行比对并排序处理后,将查询结果依照其排序的次序进行展示,具体是将依照查询结果的标号顺序将查询结果通过文本和语音展示的方式进行展示,文本和语音的展示方式可依据用户需求择一进行展示,也可通过文本和语音相结合的方式进行展示。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。