一种智能教练方法和装置、电子设备和存储介质
技术领域
本发明涉及一种问答自助系统,特别涉及一种智能教练方法和装置、电子设备和存储介质。
背景技术
目前,日益增多的专家系统或是问答自助系统,都是以用户问问题,后台的智能系统根据用户的问题在后台搜索对应的答案或自行组织答案,再返回给用户的。这种问答系统大多数是以文字进行交流的。如果有语音进行交流的,大多数的情况也是用在了娱乐、简单教育方面。
或者还有各种查询服务的问答服务设备在接收到外部输入的查询语句时,会将该查询语句输入至问答系统进行查询,并获得问答服务设备在查询后得到的回复语句,该回复语句中包含有查询语句所要查询的信息。但是,在实际应用中,若仅依赖于问答系统实现对查询语句的被动查询,则会导致用户仅能获得查询语句的回复语句,而不能在系统的教练辅助下进行发散式思维,无法使用户从已知信息中全面的思考并追踪到最终结果。
因此,为解决目前现有技术中存在的上述缺陷,本发明特别提出一种智能教练装置、电子设备和存储介质,同时,增加了通用智能教练方法,以解决现有技术中存在的问答系统答复效率低下,并且,只能进行被动式的答案查询,造成用户无法激发潜能的技术问题。
发明内容
本发明针对上述现有技术中存在的问答系统答复效率低下,并且,只能进行被动式的答案查询,造成用户无法激发潜能的技术问题,提出一种智能教练方法和装置、电子设备和存储介质。
为了达到上述目的,本发明采用的技术方案为:
本发明实施例提供一种智能教练方法,智能教练方法包括:
主动教练步骤:基于用户输入已知数据,在知识图谱中进行实体识别和关系识别后,采用启发教练技术对用户进行主动的教练式启发,发出多个开放式问题,用户基于开放式问题进行回答,并基于开放式问题整理思路,找到最终答案;
双向教练步骤:用户输入已知数据后,用户进行教练式提问,教练系统基于知识图谱找到最终答案并进行回答;或教练系统基于知识图谱进行教练式提问,启发用户思考并回答问题,找到最终答案。
作为优选,上述智能教练方法还包括:
知识图谱建立步骤:基于历史知识库,建立知识图谱。
作为优选,上述智能教练方法还包括:
被动教练步骤:用户直接向系统提出问题,教练系统基于知识图谱进行实体识别和关系识别,找到最终答案,并回答用户。
作为优选,上述知识图谱建立步骤包括:
自学习步骤:从历史知识库中不断的自主学习,丰富知识图谱信息。
本发明实施例提供一种智能教练装置,采用如上所述智能教练方法,智能教练装置包括:
主动教练单元:用于基于用户输入已知数据,在知识图谱模块中进行实体识别和关系识别后,采用启发教练技术对用户进行主动的教练式启发,发出多个开放式问题,用户基于开放式问题回答问题,并基于开放式问题整理思路,找到最终答案;
双向教练单元:用户输入已知数据后,用户进行教练式提问,教练系统基于知识图谱找到最终答案并进行回答;或教练系统基于知识图谱进行教练式提问,启发用户思考并回答问题,找到最终答案。
作为优选,上述智能教练装置还包括:
知识图谱建立单元:用于基于历史知识库,建立知识图谱。
作为优选,上述智能教练装置还包括:
作为优选,上述智能教练装置还包括:
被动教练单元:用户直接向系统提出问题,教练系统基于知识图谱进行实体识别和关系识别,找到最终答案,并回答用户。
作为优选,上述知识图谱建立单元包括:
自学习单元:用于从历史知识库中不断的自主学习,丰富知识图谱信息。
本发明实施例提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信,存储器,用于存储计算机程序;处理器,用于通过运行存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
本发明实施例提供一种计算机可读的存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
与现有技术相比,本发明的优点和积极效果在于:
(1)本发明智能教练方法用提问的方式,支持用户达成成果,并愿意行动,完成潜能的激发,用户最终理清自己的思路,最终找到答案;
(2)本发明智能教练方法的问题以开放式问题为主,将机器思维与用户智能相结合;
(3)本发明智能教练方法的教练者会主动提出问题,引导被教练者进行思考;
(4)本发明智能教练方法采用三种工作模式相结合,极大提高了使用场景的可扩展性;
(5)本发明智能教练方法基于知识图谱技术,通过对知识图谱库的自主学习,极大提升了本发明教练方法的答案命中率和启发式提问数量;
(6)本发明知识图谱的内容通过不断的自主学习,不断地迭代更新,扩展现有的知识,增加新的知识,实现了知识融合。
附图说明
图1为本发明实施例智能教练方法流程示意图;
图2为本发明具体实施例场景一示意图;
图3为本发明具体实施例主动模式流程示意图;
图4为本发明具体实施例场景二示意图;
图5为本发明具体实施例被动模式流程示意图;
图6为本发明具体实施例场景三示意图;
图7为本发明具体实施例双向模式流程示意图;
图8为本发明具体实施例自主学习场景示意图;
图9为知识图谱示意图;
图10为知识图谱技术架构示意图;
图11为本体构建构成示意图;
图12为基于逻辑的推理示意图;
图13为基于图的推理示意图;
图14为基于深度学习的推理示意图;
图15为本发明智能教练装置结构示意图;
图16是根据本申请实施例的一种可选的电子设备的结构框图。
以上各图中:
100、智能教练装置
10、知识图谱建立单元 20、主动教练单元
30、双向教练单元 40、被动教练步单元
401、处理器 402、通信接口
403、存储器 404、通信总线
具体实施方式
下面将结合附图对本发明具体实施例中的技术方案进行详细、完整的描述。显然,所描述的实施例仅仅是本发明总的技术方案的部分具体实施方式,而非全部的实施方式。基于本发明的总的构思,本领域普通技术人员所获得的所有其他实施例,都落于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明智能教练方法旨在实现一种智能教练方法,该方法采用启发教练技术,基于知识图谱进行头脑风暴式的人机智能沟通方式,将用户思维与机器智能结合,以发散思维找到事物之间的规律及联系,以教练式提问协助用户最终理清思路,并得到最终答案。
本发明提出的启发的教练技术即为用提问的方式,支持用户达成成果,并愿意行动,完成潜能的激发。用户最终自己理清自己的思路,最终找到答案。并且,教练技术的问题要以开放式问题为主,如你怎么看?怎么想的?如果理解的?而不要问封闭问题,如是不是?对不对?综上本发明智能教练技术或教练式沟通在智能分析决策系统中是一种帮助用户理清思路的方式。
以下结合附图对本发明具体实施例进行详细说明:
图1为本发明实施例智能教练方法流程示意图,如图1所示,本发明实施例提供的智能教练方法包括:
主动教练步骤S20:基于用户输入已知数据,在知识图谱中进行实体识别和关系识别后,对用户进行主动的教练式启发,发出多个开放式问题,用户基于开放式问题进行回答,并基于开放式问题整理思路,找到最终答案;
双向教练步骤S30:用户输入已知数据后,用户进行教练式提问,教练系统基于知识图谱找到最终答案并进行回答;或教练系统基于知识图谱进行教练式提问,启发用户思考并回答问题,找到最终答案。
进一步的,本发明智能教练方法还包括:
知识图谱建立步骤S10:基于历史知识库,建立知识图谱;
进一步的,本发明智能教练方法还包括:
被动教练步骤S40:用户直接向系统提出问题,教练系统基于知识图谱进行实体识别和关系识别,找到最终答案,并回答用户。
其中,知识图谱建立步骤S10包括:
自学习步骤:从历史知识库中不断的自主学习,丰富知识图谱信息。
本发明具体实施例:
假设在公安系统中,一个案件已经发生,办案人员已经有了一些信息:如嫌疑人、时间、地点、交通工具、住宿情况等。需要进行深度的分析,找到其中的联系,锁定嫌疑人。
图2为本发明具体实施例场景一示意图,如图2所示,小明为智能机器人,在该智能机器人系统中执行本发明智能教练方法。小明的角色为充当案件分析智库的功能,高度自主的沟通机器人。同时,小明支持语音输入、输出,后台有知识图谱技术做关联分析。本发明智能教练系统:主动提出问题,引导被教练者进行思考的一方。被教练者(即用户):在回答教练问题过程中,不断理顺自己思维,思绪的一方。
小明有三种模式可以选择:主动模式(教练)、被动模式(被教练)、双向模式(既是教练,又是被教练);
小明的工作模式一:主动模式,如图2所示:
小明主动问用户问题:
如A嫌疑人为什么要做?动机是?
A嫌疑人和B嫌疑人关系是什么样?在此案件中的作用是?
C嫌疑人从时间线上看,在此案件中的作用是?为什么?潜在的风险是什么?
在用户回答问题后,小明可根据用户的回答,继续提深挖的问题,也可另起问题。
图3为本发明具体实施例主动模式流程示意图,如图3所示,详细流程:
(1)用户将已知数据输入知识图谱;
(2)小明基于知识图谱进行实体识别和关系识别;
(3)小明基于知识图谱中搜索到的历史问题对用户进行教练式提问;
(4)用户基于教练式提问进行头脑风暴和深入思考;
(5)用户思考后回答问题,找到最后答案。
小明的工作模式二:被动模式,图4为本发明具体实施例场景二示意图,如图4所示:
小明被动回答用户的问题:
简单回答:
A嫌疑人和B嫌疑人关系是朋友,是亲戚。
复杂回答:
如在此案件中的作用是?为什么?潜在的风险是什么?
这种问题对机器智能要求较高。需要小明从历史的知识中提取已经学习到的知道。
图5为本发明具体实施例被动模式流程示意图,如图5所示,详细流程为:
(1)用户用语音向小明直接提问;
(2)小明进行语音识别及语义分析;
(3)小明基于知识图谱进行实体识别和关系识别;
(4)小明在知识图谱中搜索到答案;
(5)小明将答案转换为语音,语音输出,告诉用户答案。
小明的工作模式三:双向模式,图6为本发明具体实施例场景三示意图,如图6所示:
小明既可以提问题,也可以回答问题。
图7为本发明具体实施例双向模式流程示意图,如图7所示,详细流程为:
(1)用户将已知数据输入知识图谱;
(2)如果小明基于知识图谱进行实体识别和关系识别;
(3)则小明基于知识图谱中搜索到的历史问题对用户进行教练式提问;
(4)用户基于教练式提问进行头脑风暴和深入思考;
(5)用户思考后回答问题,找到最后答案。
(6)或者,如果用户进行教练式提问;
(7)则小明基于知识图谱回答用户的提问,找到最后答案。
小明的自主学习,图8为本发明具体实施例自主学习场景示意图,如图8所示:
小明从历史知识库中不断的自主学习,不断的丰富自己的知识图谱信息。以更强的分析能力对外输出服务。
知识图谱的历史知识库包括:历史知识,历史案件,历史结论和历史关系。
小明的知识图谱能力,包括了事件关联,事件推理,人物关联,人物推荐,人物分析,潜在问题,可能方向,习惯推理,概率分析等。
一、知识图谱定义,本质上,是一种揭示实体之间关系的语义网络。用于迅速描述物理世界中的概念及其相互关系。
知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。
知识图谱有自顶向下和自底向上两种构建方式。所谓自顶向下构建是借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中;所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。
图9为知识图谱示意图,如图9所示,如果两个节点之间存在关系,他们就会被一条无向边连接在一起,那么这个节点,我们就称为实体(Entity),它们之间的这条边,我们就称为关系(Relationship)。
知识图谱的基本单位,便是“实体(Entity)-关系(Relationship)-实体(Entity)”构成的三元组,这也是知识图谱的核心。
实体:指的是具有可区别性且独立存在的某种事物。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。如图中的“中国”、“北京”、“16410平方公里”等。
关系:关系是连接不同的实体,指代实体之间的联系。通过关系节点把知识图谱中的节点连接起来,形成一张大图。如图中的“人口”、“首都”、“面积”等
二、数据类型和存储方式
知识图谱的原始数据类型一般来说有三类(也是互联网上的三类原始数据):
结构化数据(Structed Data):如关系数据库
半结构化数据(Semi-Structed Data):如XML、JSON、百科
非结构化数据(UnStructed Data):如图片、音频、视频、文本
三、逻辑与技术架构
1、逻辑架构
知识图谱在逻辑上可分为模式层与数据层两个层次。
模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。
模式层:实体-关系-实体,实体-属性-性值
数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的Neo4j、Twitter的FlockDB、sones的GraphDB等。
数据层:比尔盖茨-妻子-梅琳达·盖茨,比尔盖茨-总裁-微软
2、技术架构
图10为知识图谱技术架构示意图,知识图谱的整体架构如图10所示,其中虚线框内的部分为知识图谱的构建过程,同时也是知识图谱更新的过程。
大规模知识库的构建与应用需要多种智能信息处理技术的支持。通过知识抽取技术,可以从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。
知识抽取:主要是面向开放的链接数据,通过自动化的技术抽取出可用的知识单元,知识单元主要包括实体(概念的外延)、关系以及属性3个知识要素,并以此为基础,形成一系列高质量的事实表达,为上层模式层的构建奠定基础。知识抽取有三个主要工作:
实体抽取:在技术上我们更多称为NER(named entity recognition,命名实体识别),指的是从原始语料中自动识别出命名实体。由于实体是知识图谱中的最基本元素,其抽取的完整性、准确、召回率等将直接影响到知识库的质量。因此,实体抽取是知识抽取中最为基础与关键的一步;
关系抽取:目标是解决实体间语义链接的问题,早期的关系抽取主要是通过人工构造语义规则以及模板的方法识别实体关系。随后,实体间的关系模型逐渐替代了人工预定义的语法与规则。
属性抽取:属性抽取主要是针对实体而言的,通过属性可形成对实体的完整勾画。由于实体的属性可以看成是实体与属性值之间的一种名称性关系,因此可以将实体属性的抽取问题转换为关系抽取问题。
知识表示
近年来,以深度学习为代表的表示学习技术取得了重要的进展,可以将实体的语义信息表示为稠密低维实值向量,进而在低维空间中高效计算实体、关系及其之间的复杂语义关联,对知识库的构建、推理、融合以及应用均具有重要的意义。一直在关注我们公众号的朋友肯定阅读过上一篇博文,graph embedding就是一种表示学习。
知识融合
由于知识图谱中的知识来源广泛,存在知识质量良莠不齐、来自不同数据源的知识重复、知识间的关联不够明确等问题,所以必须要进行知识的融合。知识融合是高层次的知识组织,使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等步骤,达到数据、信息、方法、经验以及人的思想的融合,形成高质量的知识库。
其中,知识更新是一个重要的部分。人类的认知能力、知识储备以及业务需求都会随时间而不断递增。因此,知识图谱的内容也需要与时俱进,不论是通用知识图谱,还是行业知识图谱,它们都需要不断地迭代更新,扩展现有的知识,增加新的知识。
知识图谱应用
知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。
1、智能搜索
用户的查询输入后,搜索引擎不仅仅去寻找关键词,而是首先进行语义的理解。比如,对查询分词之后,对查询的描述进行归一化,从而能够与知识库进行匹配。查询的返回结果,是搜索引擎在知识库中检索相应的实体之后,给出的完整知识体系。
2、深度问答
问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。多数问答系统更倾向于将给定的问题分解为多个小的问题,然后逐一去知识库中抽取匹配的答案,并自动检测其在时间与空间上的吻合度等,最后将答案进行合并,以直观的方式展现给用户。
苹果的智能语音助手Siri能够为用户提供回答、介绍等服务,就是引入了知识图谱的结果。知识图谱使得机器与人的交互,看起来更智能。
四、知识图谱的构建
第一步:信息抽取
信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如何从异构数据源中自动抽取信息得到候选指示单元。
信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。
涉及的关键技术包括:实体抽取、关系抽取和属性抽取。
第二步:知识融合
知识融合包括2部分内容:实体链接,知识合并
1、实体链接(entity linking):是指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。
其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链接到正确的实体对象。
研究历史:
仅关注如何将从文本中抽取到的实体链接到知识库中,忽视了位于同一文档的实体间存在的语义联系。
开始关注利用实体的共现关系,同时将多个实体链接到知识库中。即集成实体链接(collective entity linking)
实体链接的流程:
从文本中通过实体抽取得到实体指称项。
进行实体消歧和共指消解,判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义。
在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
实体消歧:专门用于解决同名实体产生歧义问题的技术,通过实体消歧,就可以根据当前的语境,准确建立实体链接,实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题,类似于词性消歧和词义消歧。
共指消解:主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象。利用共指消解技术,可以将这些指称项关联(合并)到正确的实体对象,由于该问题在信息检索和自然语言处理等领域具有特殊的重要性,吸引了大量的研究努力。共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
2、知识合并:在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
将外部知识库融合到本地知识库需要处理两个层面的问题:
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
通过模式层的融合,将新得到的本体融入已有的本体库中
然后是合并关系数据库,在知识图谱构建过程中,一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF,其实质就是将关系数据库的数据换成RDF的三元组数据。
第三步:知识加工
在前面,我们已经通过信息抽取,从原始语料中提取出了实体、关系与属性等知识要素,并且经过知识融合,消除实体指称项与实体对象之间的歧义,得到一系列基本的事实表达。
然而事实本身并不等于知识。要想最终获得结构化,网络化的知识体系,还需要经历知识加工的过程。
知识加工主要包括3方面内容:本体构建、知识推理和质量评估。
1、本体构建
本体(ontology)是指工人的概念集合、概念框架,如“人”、“事”、“物”等。
本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人工方式工作量巨大,且很难找到符合要求的专家,因此当前主流的全局本体库产品,都是从一些面向特定领域的现有本体库出发,采用自动构建技术逐步扩展得到的。
自动化本体构建过程包含三个阶段:
实体并列关系相似度计算
实体上下位关系抽取
本体的生成
图11为本体构建构成示意图,如图11所示:当知识图谱刚得到“阿里巴巴”、“腾讯”、“手机”这三个实体的时候,可能会认为它们三个之间并没有什么差别,但当它去计算三个实体之间的相似度后,就会发现,阿里巴巴和腾讯之间可能更相似,和手机差别更大一些。
这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机,根本就不隶属于一个类型,无法比较。因此我们在实体上下位关系抽取这一步,就需要去完成这样的工作,从而生成第三步的本体。
当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们和手机并不是一类。”
知识推理
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD两个关联起来。除此之外,我们还可以去思考,串联里有一环是B是C的主席,那么B是C的CEO、B是C的COO,是不是也可以作为这个推理策略的一环呢?
当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。
推理属性值:已知某实体的生日属性,可以通过推理得到该实体的年龄属性;
推理概念:已知(老虎,科,猫科)和(猫科,目,食肉目)可以推出(老虎,目,食肉目)
图12为基于逻辑的推理示意图,图13为基于图的推理示意图,图14为基于深度学习的推理示意图,如图12-14所示,这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理。
五、总结
通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和利用海量信息的方式。目前的知识图谱技术主要用于智能语义搜索、移动个人助理(Siri)以及深度问答系统(Watson),支撑这些应用的核心技术正是知识图谱技术。
在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进而将其映射到知识图谱中的一个或一组概念之上,然后根据知识图谱的概念层次结构,向用户返回图形化的知识结构,这就是我们在谷歌和百度的搜索结果中看到的知识卡片。
在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。比如,如果用户提问:『如何判断是否感染了埃博拉病毒?』,则该查询有可能被等价变换为『埃博拉病毒的症状有哪些?』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等。如果由于知识库不完善而无法通过推理解答用户的问题,深度问答系统还可以利用搜索引擎向用户反馈搜索结果,同时根据搜索结果更新知识库,从而为回答后续的提问提前做出准备。
而本发明专利的核心点在于运用开放式问题,引导用户,或是机器人(小明)来运用知识图谱技术进行深层次的总结得到答案。
图15为本发明智能教练装置结构示意图,如图15所示,本发明实施例还提供一种智能教练装置100,采用如上所述智能教练方法,装置采用启发教练技术,基于知识图谱进行头脑风暴式的人机智能沟通方式,将用户思维与机器智能结合,以发散思维找到事物之间的规律及联系,以教练式提问协助用户最终理清思路,并得到最终答案。
其中,智能教练装置100包括:主动教练单元20和双向教练单元30
主动教练单元20:用于基于用户输入已知数据,在知识图谱模块中进行实体识别和关系识别后,对用户进行主动的教练式启发,发出多个开放式问题,用户基于开放式问题回答问题,并基于开放式问题整理思路,找到最终答案;
双向教练单元30:用户输入已知数据后,用户进行教练式提问,教练系统基于知识图谱找到最终答案并进行回答;或教练系统基于知识图谱进行教练式提问,启发用户思考并回答问题,找到最终答案。
进一步的,智能教练装置100还包括:
知识图谱建立单元10:用于基于历史知识库,建立知识图谱;
其中,知识图谱建立单元10包括:自学习单元用于从历史知识库中不断的自主学习,丰富知识图谱信息;
进一步的,智能教练装置100还包括:
被动教练步单元40:用户直接向系统提出问题,教练系统基于知识图谱进行实体识别和关系识别,找到最终答案,并回答用户。
图16是根据本申请实施例的一种可选的电子设备的结构框图,如图16所示,本发明实施例提供一种电子设备,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401、通信接口402和存储器403通过通信总线404完成相互间的通信,存储器403,用于存储计算机程序;处理器401,用于通过运行存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
主动教练步骤S20:基于用户输入已知数据,在知识图谱中进行实体识别和关系识别后,对用户进行主动的教练式启发,发出多个开放式问题,用户基于开放式问题进行回答,并基于开放式问题整理思路,找到最终答案;
双向教练步骤S30:用户输入已知数据后,用户进行教练式提问,教练系统基于知识图谱找到最终答案并进行回答;或教练系统基于知识图谱进行教练式提问,启发用户思考并回答问题,找到最终答案。
本发明具体实施例中,实施上述智能教练方法的设备可以是智能机器人或其他终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图16其并不对上述电子设备的结构造成限定。例如,终端设备还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示的不同的配置。
本发明实施例提供一种计算机可读的存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任一实施例中的智能教练方法步骤。在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本发明智能教练方法用提问的方式,支持用户达成成果,并愿意行动,完成潜能的激发。用户最终自己理清自己的思路,最终找到答案;本发明智能教练方法的问题以开放式问题为主,将机器思维与用户智能相结合;本发明智能教练方法的教练者会主动提出问题,引导被教练者进行思考;本发明智能教练方法采用三种工作模式相结合,极大提高了使用场景的可扩展性;本发明智能教练方法基于知识图谱技术,通过对知识图谱库的自主学习,极大提升了本发明教练方法的答案命中率和启发式提问数量。
以上所述为本发明的具体实施方式,其目的在于让技术人员能够了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,任何根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围内。需要说明的是,在附图或说明书正文中,未绘出或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各部件和工艺方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式。