用于辅助疾病推理的系统及存储介质
技术领域
本发明涉及一种用于辅助疾病推理的系统及存储介质。
背景技术
在线医疗是当前互联网与医疗行业结合所产生的新业态,其研究也逐 渐得到管理学界的广泛关注。本系统是根据已知的数据,经过严格复杂的 计算,预测出患者所患疾病的名称与概率,并给出希望进一步澄清的证据 的集合和对患者的处置建议,包括但不限于检查名称(CT、X线等)、就诊 科室、疾病的危重信息等。
目前患者想得知自己的疾病大多是去医院挂号,然后与医生进行多次 沟通与检查,来得知自己可能患有的疾病。
可以预见,上述直接去医院挂号沟通至少存在以下劣势:
1、由于现有医疗资源的紧张,会存在挂号难、看病难的问题;
2、由于对自己的症状理解不清晰、不到位,存在挂错号的问题,浪费 患者与医生的宝贵时间;
3、有一些系统也做了疾病推理,但是大部分运用的都是决策树算法作 为核心算法,但是决策树的缺点是很明显的,如:忽略属性之间的相关性, 各类别样本数量不一致的时候,信息增益偏向于那些更多数值的特征,类 别过多时,错误就会增加的比较快等等。这些缺点导致对样本的处理的难 度很大,效果也不是很好。
因此,需要一种可以降低医疗资源紧张程度同时提供高准确度的用于 辅助疾病推理的系统,使得可以在不去医院与医生直接沟通的情况下,准 确地预先获取可能疾病的信息。
发明内容
根据本公开的一个方面,本公开涉及一种用于辅助疾病推理的系统, 该系统包括:存储单元,其被配置成存储多重图;获取单元,其被配置成 获取至少包括用户基本信息以及用户症状信息的初始证据集合;以及处理 单元,该处理单元包括:症状扩展模块,其被配置成基于多重图对所述用 户症状信息进行扩展以获取经扩展证据集合并且基于经扩展证据集合获得 相关联的诊断集合;概率计算模块,其被配置成计算相关联诊断集合中的每个诊断相对于经扩展证据集合中的相关证据的诊断条件概率;完整度计 算模块,其被配置成计算相关联诊断集合中的每个诊断相对于经扩展证据 集合中的每个相关证据的贡献度以及每个诊断的所有相关证据归一化贡献 度的和,从而获取针对每个诊断的信息完整度;预定关系值计算模块,其 被配置成计算与诊断条件概率和信息完整度相关联的预定关系值;以及诊 断确定模块,其被配置成对所计算的预定关系值进行排序并且输出排名靠前的一个或多个诊断。
优选地,该系统还包括人机交互界面以及诊断交互界面,其中,人机 交互界面用于接收由用户输入的初始信息,其包括用户基本信息以及用户 症状信息的初始证据集合,进一步地,人机交互界面构造成以用户可实现 的任何形式接收初始信息;并且其中,诊断交互界面用于向用户显示诊断 结果,其包括一个或多个诊断。
优选地,处理单元还包括冷启动澄清模块,其被配置成在初始证据集 合不包括任何有效症状时询问用户添加新的用户症状直至获取有效症状。
优选地,诊断确定模块能够进一步被配置成将所计算的所有预定关系 值与一定阈值进行比较并且在没有任一预定关系值大于所述一定阈值情况 下激活推理澄清过程。
优选地,处理单元还包括问题域模块,其被配置成在诊断确定模块已 经确定不存在大于所述一定阈值的任何预定关系值时基于多重图获取与所 述相关联诊断集合中的每个诊断相关联的所有症状以获得问题域。
优选地,处理单元还包括鉴别诊断模块,其被配置成基于所述问题域 中的每个诊断的诊断条件概率以及其信息完整度确定所述问题域中的每个 诊断的询问优先度。
优选地,处理单元还包括澄清优先度计算模块,其被配置成基于每个 诊断的诊断条件概率、信息完整度以及有效症状相对于相关联疾病的条件 概率来确定与所述问题域中的每个疾病相关联的其他有效症状的澄清优先 度。
优选地,处理单元还包括推理澄清模块,其被配置为基于所述询问优 先度和所述澄清优先度确定针对哪个诊断的哪个其他有效症状进行询问, 并将其反馈给所述用户以获取所述用户针对该其他有效症状的肯定证据和 /或否认证据并将该肯定证据和/或否认证据反馈回所述症状扩展模块并实 现循环计算。
优选地,处理单元还包括计数模块,其被配置为对推理澄清过程的循 环次数进行计数,并且在次数大于12次时,诊断确定模块终止激活推理澄 清过程并且输出预定关系值排名靠前的一个或多个诊断。
根据本公开的另一个方面,本公开涉及一种存储介质,该存储介质存 储计算机指令,当这些指令被执行时,至少实现以下步骤:
获取包括用户症状信息的初始证据集合;
基于多重图对用户症状信息进行扩展以获取经扩展证据集合并且基于 经扩展证据集合获得相关联的诊断集合;
计算相关联诊断集合中的每个诊断相对于经扩展证据集合中的相关证 据的诊断条件概率;
计算相关联诊断集合中的每个诊断相对于经扩展证据集合中的每个相 关证据的贡献度以及每个诊断的所有相关证据归一化贡献度的和,从而获 取针对每个诊断的信息完整度;
计算与诊断条件概率和信息完整度相关联的预定关系值;以及
对所计算的预定关系值进行排序并且输出排名靠前的一个或多个诊 断。
附图说明
本发明的其他显著特征和优点从以下参考以下附图出于说明目的而提 供的非限制性描述中得出,其中:
图1示出了根据本发明的实施例的用于辅助疾病推理的系统所执行的 流程的流程图;
图2示出了根据本发明的另一实施例的用于辅助疾病推理的系统所执 行的流程的流程图;
图3示出了根据本发明的实施例的用于辅助疾病推理的系统的结构框 图;以及
图4示出了根据本发明的实施例的用于辅助疾病推理的系统的总体结 构图。
具体实施方式
本申请的实施例涉及计算机应用条件下的技术方案。
本申请的用于辅助疾病推理的系统所执行的流程根据已知“证据”推 导出可能的“诊断”及其概率并且给出希望需要进行进一步“澄清”的证 据集合。其中,某诊断的所有证据主要包括用户的“有效症状” 和所属“人群”,在本申请的范围内,e表示证据,而下角标i表示相关证 据的编号,其中1≦i≦r,r表示证据集合中所包括的证据元素的个数。某 证据相关的所有诊断通常为“疾病”,也包括疾病组或综合征, 在本申请的范围内,d表示诊断,而下角标j表示相关诊断的编号,其中1 ≦j≦w,w表示诊断集合中所包括的诊断元素的个数。其中,有效症状表 示与疾病有直接或间接关联的症状。间接关联是指证据ei虽然在知识图谱 中没有直接与疾病关联,但增加了近一步限制条件的证据ei’与疾病有关联。 因此,疾病dj对应的有效症状集合由以下关系定义:
因此,全部疾病集合D对应的有效症状集合则为
在根据本申请的用于辅助疾病推理的系统所执行的流程中,需要利用 以下已知信息并且这些信息可以包含在以下将详细描述且定义的多重图 中:
-“疾病-症状”关联信息,即有效症状对疾病的“敏感度”和“特异 度”,其分别表示有效症状相对于疾病的条件概率P(ei|dj)以及疾病 对于有效症状的条件概率P(dj|ei);以及
-“疾病-人群”关联信息,即疾病的人口统计学特征或简称为发病率, 其包括:
(a)疾病在全体人群中的发病率,即疾病的先验概率P(di),以及
(b)疾病在特定人群中的发病率P(dj|ei),或者患者的人群分布 P(ei|dj)。
虽然证据的先验概率P(ei)在疾病推理过程中也会被应用到,然而如所 理解的,在实践中,人群的先验概率可以从国家统计局等信息源获取,而 症状的先验概率通常是未知的。
贝叶斯网络是适合表达症状与对应疾病之间的关系的合适表达方式, 其中,贝叶斯网络中的结点表示随机变量(事件),在本发明的范围中,随 机变量即是指证据(有效症状或所属人群ei)或诊断(相关联疾病dj),而 网络中结点之间的边表示结点之间的关联关系。应该注意的是,在疾病推 理诊断的背景下,由于某些有效症状之间的相关性未知,例如头痛与背痛, 因此难以建立完整的贝叶斯网络。
虽然贝叶斯网络描述了事件及事件之间的关联关系,但在疾病推理的 范围中,人机交互经常通过概念进行传递,而事件往往由多个概念复合而 成,例如症状“腰部疼痛”由“腰部”和“疼痛”两个概念复合而成。因 此,还需要刻画概念及概念之间关系的知识图谱,才能形成有效的交互。 概念之间可以具有多种关系,例如,在疾病推理的背景下,例如定义用来 表达概念/事件之间的复合关系,该复合关系例如是包含(composed-of), 例如:
复合关系(1): 以及
复合关系(2):
在复合关系(1)中,既有术语贝叶斯网络中的事件“腰部疼痛”,也 有非事件概念“腰部”及“疼痛”,因此,称“腰部部位”和“疼痛症状种类”为 “腰部疼痛症状”的构成要素。
而在复合关系(2)中,其实际上为两个事件的逻辑组合,其可以被称 为“组合事件”。
应该理解,组合事件除了复合关系之外,这些事件之间还存在贝叶斯 网络中的概率关系。应该理解,“人群”与“诊断”的概率关系应该被包括 在该贝叶斯网络中。
P(腰部疼痛│腰部疼痛且发热)=1,P(发热│腰部疼痛且发热)=1
进一步地,在贝叶斯网络中,当概念概率关系的概率为1时,其等同 于推导关系,即,
为了更直观的表示贝叶斯网络和知识图谱在本申请中的使用,采用多 重图G=(V,R,I)来同时表示贝叶斯网络和知识图谱,其中:
-V={vk}表示顶点集合,其包括有效症状、人群等证据类事件,疾 病、疾病组或综合征等诊断类事件,以及部位、症状类型、症状限 定等非事件类概念;
-R表示关系集合,其包括:
(i)事件间的概率关系,例如,当P(下肢麻木│腰椎间盘突出)=0.7时,则简写为 进一步地,当在事件之间不具体标记关系类型 时,则默认事件之间为概率关系,即<v1→v2>;
(ii)同类概念之间的部分-整体关系(part-of),例如
(iii)概念之间的复合关系composed-of,如之前所述;
(iv)同类概念之间的上下位关系(kind-of),例如 当概念均为事件类型时,则上下位关系同时也意味着 推导关系,即或者
根据以上描述,关系集合R可以表示为概念关系集合RK与概率关 系集合Rp的并集,即R=RK∪RP。
-I表示概念或事件之间的关联函数。例如,对于两个事件v1,v2,如 果其间的关系r∈RP,则可以将这两个事件与相应关系r的关联关 系表示为I(r)=(v1,v2)并且关系r的权重定义为条件概率P(υ2|υ1)。
组合证据由两个或更多证据通过“与”或“或”关系构成。可以想见, 大部分特异性症状为“与证据”,例如,“腰部疼痛且下肢麻木”是“腰间 盘突出”的特异性症状。
如所理解的,症状分为“特异性症状”和“非特异性症状”两类,其 中特异性症状,其表示对单一疾病具有强指向性,其特异度P(dj|ei)通常大 于0.5。然而,需要注意的是,特异性症状也具有敏感度,并且该敏感度与 特异度没有相关性。在临床中,低敏感度的症状因其不常见而实际的询问 过程中优先级低于高敏感度的症状。实际上,在实际临床中,高敏感度的 症状往往用于鉴别诊断,即排除因具有类似症状而有可能误诊的疾病。
相对地,非特异性症状则通常以敏感度的形式给出。
为了尽可能的减少所引入的冗余信息,可以结合利用概念关系集合RK与概率关系集合Rp来等价地表示组合证据,而无需将逻辑运算记录在结点 属性中。
如前所述,证据间的与关系e3=e1∧e2可以表示为 相对应地,证据间的或关系e3=e1∨e2可以表示 为对于该与关系,当全部子结点为真时,可以反 向推导,即如果则然而,可以预 见,证据间的推导可能存在歧义,例如,如果e1=e3∨e4,e2=e3∨e5, 可以轻易地确定然而因此,为了避免歧义,需要引入概念关系集合RK进行区分以防止歧义,即当
时,可以确定 e3=e1∧e2,才可以进一步确定
为了进一步说明多重图中的结点之间的关系,在此示出了本申请范围 中的一些结点关系示例:
示例一:症状+限定
其中,“腰部疼痛”的构成元素是:
示例二:症状组合(与关系)
示例三:症状组合(或关系)
示例四:疾病组
本领域的普通技术人员应该理解到,上述对于多重图中的结点之间的 关系的描述仅仅是示例性,并且不应理解为对本申请的多重图中所有结点 关系的限制。
图1示出了根据本发明的实施例的用于辅助疾病推理的系统所执行的 流程的流程图。如图1所示,本发明所记载的用于辅助疾病推理的系统所 执行的流程至少包括如下将详细描述的步骤。
在步骤S100处,获取初始证据集合
初始证据集合至少包括用户基本信息以及用户症状。用户基本信息至 少包括用户的性别、年龄等基本人群信息。用户症状至少包括初始主诉症 状。
在步骤S102处,基于多重图对用户症状进行扩展以获取经扩展证据集 合并基于经扩展证据集合获取相关联诊断集合。
可以预见,在该步骤中,包括初始主诉症状的用户症状基于多重图进 行扩展。由于症状与症状之间可以存在composed-of关系,如: 且因此,当获取腰部疼痛且发热这一组合症状时,根据多重图理论,可以推 导出同时获取了腰部疼痛和发热两个症状,因此,通过对用户症状进行扩 展,可以防止证据信息丢失而导致推理结果不够准确。在基于多重图对用 户症状进行扩展后,初始证据集合更新为经扩展证据集合。进一步地,根 据该经扩展证据集合,可以根据多重图获取与该经扩展证据集合相关联的 相关诊断集合。例如,当对腰部疼痛且发热这一症状扩展为腰部疼痛以及 发热后,可以基于多重图获取与腰部疼痛相关联的诊断(疾病)集合并且 相应地可以获取与发热相关联的诊断(集合),因此,基于对腰部疼痛且发 热这一用户症状进行扩展,可以实际获得与腰部疼痛相关联的诊断(疾病) 集合以及与发热相关联的诊断(集合)的并集,使得与腰部疼痛且发热这 一用户症状相关联的所有疾病具备周全的考虑而不会造成遗漏。
请注意,如果经扩展证据集合中存在这样两个证据则从该 经扩展证据集合中去除e2。其理由是,作为事件描述的e1一定比e2包括更 多的信息(复合关系),因而,对于被任何诊断dj,若同时存在则p1一定比p2更准确的表达了相关证据道诊断的 概率关系(请注意,p1不一定大于p2),例如 则利用前者进行诊断一定要比后者更为准确。
进一步地,请注意,已经在多重图中预先针对所有有效症添加了与对 应疾病的关联联系,使得若不存在<ei→dj>,则添加无权重的 特殊概率关系并且不参与后续的诊断概率计算和信息完整度计算。
在步骤S104处,计算相关联诊断集合中的每个诊断相对于经扩展证据 集合中的相关证据的诊断条件概率。
根据前述记载可知,症状可以分为“特异性症状”和“非特异性症状”, 并且这两者均具有与特异度无关的敏感度。通常,非特异性症状以敏感度 的形式给出并已知。然而,在本申请的用于辅助疾病推理的系统及其所执 行的流程的范围中,由于推理方向为证据→诊断,因此,无法直接将敏感 度直接用于辅助疾病推理的过程中,而需要将该敏感度转换为如下将详细 描述的准特异度以计算每个诊断相对于相关证据的诊断条件概率。
若已知证据ei的先验概率P(ei),则该证据ei对于诊断dj的特异度可以 根据贝叶斯公式计算为:
然而,如前所述的,对于大部分症状(证据)ei而言,其先验概率P(ei) 并不能提前获取,因此只能根据与该症状ei相关联的全部疾病的集合来近 似计算准特异度:
其中,归一化因子
在完整建模的贝叶斯网络中,证据合成时通过条件概率表来实现的。 在无法获取各证据联合概率分布的情况下,采取如下方式进行近似计算。
证据可以分为两类,一类是正证据,一类是负证据。正证据表示使诊 断(疾病)的后验概率大于先验概率的证据,其集合在此表示为 E+(dj)={ei|P(dj|ei)>P(di)},简写为E+。根据贝叶斯公式, P(dj|ei)>P(di)等价于P(ei|dj)>P(ei)。
如果以表示诊断“非dj”。则当证据为正证据ei∈E+时,诊断的可能性则以为因子下降。进一步地,假设证据之间具有独立性, 则全部证据使概率下降到:
于是:
实际上,在本申请的用于辅助疾病推理的系统及其所执行的流程的范 围中,正证据表示由用户明确表示存在的用户症状。
与正证据相对地,负证据(简写为E-)表示如下证据的集合:
E-(dj)={ei|P(ei|dj)<P(ei)}={ei|P(dj|ei)<P(dj)}
其中,对于负证据ei∈E-而言,可以确定该负证据对于诊断的惩 罚度可以表示为:
实际上,在本申请的用于辅助疾病推理的系统及其所执行的流程的范 围中,负证据主要表示如下几种情况:
1.低患病率人群,例如某些疾病(针对)对于青年人群具有低发病率; 以及
2.相对低的患病性别,例如男性用户更不容易患有骨质酥松;其中一 种特殊情况是非患病性别,例如,男性用户不可能患有妇科疾病。
在本申请的范围内,正证据和负证据均属于肯定证据(其表示存在相 关证据)。
特殊地,在用户症状中,存在用户对某些症状的否认证据例 如“不腰疼”,可以通过将该否认证据等价于负证据而在诊断条件概率计算 中加以使用:
因此,对于,相关联诊断集合中的每个诊断相对于经扩展证据集合中 的相关证据的诊断条件概率可以表示为:
其中,E=E+∪E-表示肯定证据集合且并且E′表示否认证据集合。
进一步地,由于对于大部分症状(证据)ei而言,缺乏其先验概率P(ei), 因此上述公式可以进一步近似为:
或者:
其中为如前所述的特异度或准特异度。
在步骤S106处,计算相关联诊断集合中的每个诊断相对于经扩展证据 集合中的每个相关证据的贡献度以及每个诊断的所有经扩展证据归一化贡 献度的和,从而获取针对每个诊断的信息完整度。
每个诊断相对于经扩展证据集合中的相关证据的贡献度,即经扩展证 据集合中的相关证据ei(即经扩展证据集合中的当前已知相关证据)对相 关联诊断集合中的某一诊断dj信息收集完整性的贡献为:
C(ei,dj)=|P(dj|ei)-P(dj)|
该诊断dj的整体信息完整度为经扩展证据集合中的每个相关证据的归 一化信息贡献度之和:
其中,归一化因子表示对于相关联诊断集合中的某 个诊断dj,该诊断相对于与该诊断有关的所有证据(多重图中获取的与该 诊断有关的所有证据)的贡献度的和(即,多重图中与该诊断相关的所有 相关证据对该诊断的贡献度的和),其中,与该诊断相关的所有证据的集合 包括与该疾病相关的所有“有效症状”以及所属“人群”等证据。
在步骤S108处,计算与诊断条件概率与信息完整度相关联的预定关系 值。其中,该预定关系可以根据用于辅助疾病推理的系统或其流程的实施 者根据其对诊断条件概率和信息完整度的不同依赖程度依据需要而灵活确 定,例如,可以将预定关系值确定为诊断条件概率与信息完整度的权重和 等等,但是不限制于此。此外,值得注意的是,该预定关系值也可以按照 如下基本关系进行适当地调节确定:信息完整度越高,则证明当前证据对于确定诊断的可信度高,则相应地增强当前诊断条件概率的权重,进而使 得该预定关系值趋于越大,得出确切的结论。
在S110处,对所计算的预定关系值进行排序并且输出排名靠前的一个 或多个诊断。
如图2所示,根据本申请一个优选实施例,考虑到在步骤S100处获取 的初始证据集合可能不包括与疾病直接关联的有效症状,则需要进行冷启 动澄清。具体地,在可选的步骤S112处,判断步骤S100处获取的初始证 据集合是否包括直接有效症状。如果包括直接有效症状,则用于辅助疾病 推理的系统所执行的流程行进至步骤S102。如果确定不包括直接有效症状 或者包括间接有效症状,则步骤行进至步骤S114,在该步骤处,询问用户 添加新的用户症状直至获取直接有效症状或者询问用户对间接有效症状添 加进一步限制以获得直接有效症状。换言之,如果确定用户输入的初始证 据集合与多重图中的全部疾病的有效症状集合ED均没有交集,则在步骤 S114处对用户进行询问以扩充初始证据集合直至与ED有交集为止。
根据本申请的一个优选实施例,可以针对预定关系值设定阈值从而提 高诊断的准确性。具体地,在步骤S108之后,可以将预定关系值与一定阈 值进行比较,如果该存在任一预定关系值大于一定阈值,则认为该诊断已 经足够准确,则行进至步骤S110。然而,如果不存在任一预定关系值大于 一定阈值,则可以认为目前的诊断并不完全准确且不能推理出最可能的诊 断,在这种情况下,需要对目前获取的初始证据集合进行进一步扩充澄清以强化诊断的准确度。具体地,在没有任一预定关系值大于一定阈值的情 况下,本申请的用于辅助疾病推理的系统所执行的流程行进至步骤 S116-S122,这些步骤总体上也可以称为推理澄清过程步骤。
在步骤S116处,基于多重图获取与相关联诊断集合中的每个诊断相关 联的所有症状从而获得问题域,其中,相关联诊断集合中的所有诊断以及 与每个诊断相关联的所有症状被称为问题域。
根据上面对问题域和有效症状的定义,可以知悉一个有效症状的所有 下位症状也在问题域中,因此问题域恰好是有效症状的马尔可夫毯。当存 在多个有效症状时,问题域即为各有效症状的马尔可夫毯的并集。
然而,需要注意的是,在获取与相关联诊断集合中的每个诊断相关的 症状时,只获取敏感性症状,而不扩展特异症状。
在步骤S118处,基于相关联诊断集合中的每个诊断的诊断条件概率以 及信息完整度确定相关联诊断集合中的每个诊断的询问优先度,其中,该 询问优先度按以下关系进行计算:
Y(dj)=α×P(dj|E)+β×C(dj)
其中α、β为预设参数且满足α+β=1。
按Y(o)从高到低将当前相关联诊断集合D排序为
在步骤S120处,针对问题域中的所有症状计算澄清优先度,其中针对 证据ei的澄清优先度按如下关系进行计算:
在步骤S122处,基于询问优先度和澄清优先度确定针对哪个诊断的哪 个其他有效症状进行询问并将该询问反馈给用户以获取用户的针对该其他 有效症状的肯定证据和/或否认证据,并将该肯定证据和/或否认证据反馈回 步骤S102,以进行循环。可以预见,优先针对具有最高询问优先度的诊断 询问与其相关的具有最高澄清优先度的其他有效症状。
值得注意的是,优选地,在步骤S118处,判断是否存在具体地,其中,θ为预设阈值,m表示待选取的大于预设阈值θ的诊断的数 量,其中1≤m≤z(z为任意自然数)。可以预见,该z可以选择为1。例如, 当z选择为1时,则确定是否存在一个当z选择为2时,则 确定是否存在两个在z为确定数量的这些情况下,在步骤S122 中仅针对djz(该z为预设最大值)之后的具有最大询问优先度的其他诊断 询问与该诊断相关联的具有最高澄清优先度的其他有效症状。例如,当z 为1时,则针对具有第二最大询问优先度的其他诊断询问与该诊断相关联 的具有最高澄清优先度的其他有效症状;当z为2时,则针对具有第三最 大询问优先度的其他诊断询问与该诊断相关联的具有最高澄清优先度的其 他有效症状,以此类推。当然,z也可以表示存在性的非确定数目。也即, z表示确定的所有诊断的总数。在这种情况下,如果针对某 一诊断存在则在步骤S122中仅针对具有低于预设阈值θ 的最大询问优先度的其他诊断询问与该诊断相关联的具有最高澄清优先度 的其他有效症状。
在本申请的优选实施例中,还可以在适当位置处设置可选的计数步骤, 该计数步骤确定上述循环所经历的次数,并且在循环次数超过一定次数后, 例如12次,输出预定关系值排序靠前的一个或多个诊断。可以设想,输出 预定数量的诊断,例如五个。
进一步地,优选地,在确定需要询问的诊断中与该诊断相关联的具有 最高澄清优先度的其他有效症状时,实际上只考虑了证据粒度的询问效率, 但是在转换成用于辅助疾病推理的系统所执行的流程所采用的自然语言 时,实际上还可以考虑人类对话的自然逻辑。
例如:(1)合并同类元素;例如「腰部疼痛」和「腰部麻木」应该询 问为「请问您的腰部是否有如下症状:A.疼痛,B.麻木」;以及(2)依 用户的主诉症状依次询问;例如患者输入「我腰疼而且腿麻」,那么应该先 询问「腰部疼痛」相关的问题,包括限定条件、程度等等;之后再开始询 问「下肢麻木」相关的问题。
例如,可以将问题历史抽象建模为
其中,表示第a次循环的第b个询问对象,例如“腰部(的症状)”、 “腰部疼痛(的程度)”。当根据本申请的用于辅助疾病推理的系统所执行 的流程给出第n+1次循环的待澄清证据集合时,应该与历史问题进行比较, 优选选择同样的询问目标进行询问。比较顺序为:
即,同一循环中询问的对象依次澄清,不同循环中的询问对象优先询 问澄清最近询问过的,以接近人类的对话习惯。
进一步,优选地,在步骤S114处扩充用户的初始证据集合可以根据用 户输入的部位进入多重图中的知识图谱进行匹配而直接生成,例如,用户 输入“腰部”,则在匹配中发现“腰部疼痛”、“腰部肿胀”等相关部位症状 证据,则据此直接询问用户腰部是否具有上述症状,让用户直接进行选择。 另外,还可以直接生成相关问题,让用户回答,例如如果用户输入“腰部” 而确定没有直接有效症状时,则直接询问用户“您的腰部有什么不适2”。 当然,前述选择或直接询问方式可以结合使用。
如图3所示,图3示出了根据本发明的实施例的用于辅助疾病推理的 系统的结构框图。如图所示根据本申请的用于辅助疾病推理的系统3可以 包括存储单元302,获取单元304以及处理单元306。
存储单元302被配置成存储多重图。该多重图同时表示贝叶斯网络以 及知识图谱并且至少包括有效症状、与有效症状先关联的疾病、“疾病-症 状”关联信息以及“疾病-人群”关联信息等已知信息。
获取单元304被设置为如前所述地获取至少包括用户基本信息以及用 户症状信息的初始证据集合。进一步地,在有利的实施例中,该获取单元 304还可以被配置为根据系统中其他单元的反馈向用户索取其他信息。
处理单元306被配置为如前述地处理由获取单元304所获取的信息。 优选地,处理单元306可以包括多个子模块,例如,证据扩展模块3060、 概率计算模块3061、完整度计算模块3062、预定关系值计算模块3063以 及诊断确定模块3064。
证据扩展模块3060被配置为如前所述地基于存储单元302中所存储的 多重图将由获取单元304获取的用户症状信息进行扩展,从而获得经扩展 证据集合并且基于该经扩展证据集合获得相关联的诊断集合。
概率计算模块3061被配置为如前所述地计算相关联诊断集合中的每个 诊断相对于经扩展证据集合中的相关证据的诊断条件概率。
完整度计算模块3062被配置为如前所述地计算相关联诊断集合中的每 个诊断相对于经扩展证据集合中的每个相关证据的贡献度以及每个诊断的 所有经扩展证据归一化贡献度的和,从而获取针对每个诊断的信息完整度。
预定关系值计算模块3063被配置为如前所述地计算与诊断条件概率和 信息完整度相关联的预定关系值,
诊断确定模块3064被配置为如前所述地对由预定关系值计算模块 3063所计算的预定关系值进行排序并且输出排名靠前的一个或多个诊断, 例如五个诊断、四个诊断、三个诊断、一个诊断等。
可选地,诊断确定模块3064还可以被进一步配置为将所计算的所有预 定关系值与一定阈值进行比较,如果任一预定关系值大于一定阈值,则对 由预定关系值计算模块3063所计算的预定关系值进行排序并且输出排名靠 前的一个或多个诊断;并且如果不存在任何预定关系值大于一定阈值,则 将启动推理澄清过程。在此需要清晰地表示的是,推理澄清过程表示获取 进一步的证据以进一步确定诊断的过程。在本申请的优选实施例中,推理 澄清过程可以涉及至少由问题域模块3066、鉴别诊断模块3067、清优先度 计算模块3068以及推理澄清模块3069所进行的处理过程。
可选地,处理单元306还可以包括冷启动澄清模块3065。该冷启动澄 清模块3065判断由获取单元304所获取的初始证据集合是否包括有效症状 并且在所获取的初始证据集合不包括任何有效症状的情况下经由获取单元 304询问用户添加新的用户症状直至获取有效症状。
可选地,处理单元306还可以包括问题域模块3066,其被配置为在确 定不存在大于一定阈值的任何预定关系值时如前所述地基于多重图获取与 相关联诊断集合中的每个诊断相关联的所有症状以获得问题域。
可选地,处理单元306还可以包括鉴别诊断模块3067,其被配置为如 前所述地基于问题域中的每个诊断的诊断条件概率以及信息完整度确定问 题域中的每个诊断的询问优先度。
可选地,处理单元306还可以包括澄清优先度计算模块3068,其被配 置为如前所述地针对问题域中的所有症状计算症状的澄清优先度。
可选地,处理单元306还可以包括推理澄清模块3069,其被配置为如 前所述地基于询问优先度和澄清优先度确定针对哪个诊断的哪个其他有效 症状进行询问并将该询问反馈给用户以获取用户的针对该其他有效症状的 肯定证据和/或否认证据,并将该肯定证据和/或否认证据反馈回证据扩展模 块3060并实现循环计算。该推理澄清模块3069还可以被配置为对每个诊 断的询问优先度与预设阈值进行比较,如果存在询问优先度大于预设阈值 的诊断,则确定针对具有低于预设阈值的最大询问优先度的其他诊断询问 与该诊断相关联的具有最高澄清优先度的其他有效症状。
可选地,处理单元306可以包括计数模块3070,其被配置为循环次数 进行计数并且在次数大于12次时,诊断确定模块3064终止激活推理澄清 过程并输出预定关系值靠前的一个或多个诊断,例如五个诊断、四个诊断、 三个诊断、一个诊断等。
有利地,本申请范围内的用于辅助疾病推理的系统还包括人机交互界 面,其中,该人机交互界面用于接收由用户输入的初始信息,其包括用户 基本信息以及用户症状信息的初始证据集合。该人机交互界面构造成以用 户可实现的任何形式(例如,语音输入、文字输入、图像识别)接收用户 初始信息。作为示例而非限制性的,该人机交互界面可以实施为键盘、鼠 标、触摸屏幕、操纵杆、麦克风等任何可以接收用户所输入的初始信息的 硬件或其组合。
有利地,本申请范围内的用于辅助疾病推理的系统还包括诊断交互界 面,其中,该诊断交互界面用于显示由系统所输出的诊断结果或者将系统 所确定需要询问的诊断的其他有效症反馈给用户以获取用户针对系统的待 澄清其他有效症状进行答复。有利地,该诊断交互界面优选地为屏幕,例 如液晶显示器、有机发光二极管等形式。但是可以预见,作为示例而非限 制性的,诊断交互界面还可以是语音播报装置、投影装置等输出装置硬件或其组合。
更有利地,本申请范围内的用于辅助疾病推理的系统中的人机交互界 面和诊断交互界面可以集成在一起。作为示例而非限制性的,例如,触摸 屏幕可以是集成的人机交互界面和诊断交互界面的示例。但是可以预见, 包含屏幕的其他人机交互界面也可以与诊断交互界面集成,从而实现两者 的功能,例如显示器与键盘(或其他物理输入设备)的组合等。
有利地,本申请范围的用于辅助疾病推理的系统的存储单元302可以 例如包括存储器,例如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光 盘等或者其他可存储数据的硬件存储。进一步地,根据本发明的存储单元 302可以包括数据库、云存储等软件存储。进一步地,存储单元302可以包 括还可以存储用于实现本申请的用于辅助疾病推理的系统所执行的流程的 任何软件程序。
如图4所示,图4示出了根据本发明的实施例的用于辅助疾病推理的 系统的总体结构图,其中,基于相同的发明构思,所述用于辅助疾病推理 的系统总体上至少包括如下部件:处理器401、存储器402、通信接口403 和总线404;其中,所述处理器401、存储器402、通信接口403通过所述 总线404完成相互间的通信;所述通信接口403用于实现用于辅助疾病推 理的系统的信息交互通信以及与其他软件或硬件的信息传输;所述处理器401用于调用所述存储器402中的计算机程序,所述处理器执行所述程序时 实现如本申请之前所述的用于辅助疾病推理的系统所执行的流程。
基于相同的发明构思,本发明的又一实施例提供了一种计算机可读存 储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处 理器执行时实现如本申请之前所述的用于辅助疾病推理的系统所执行的流 程,在此不再赘述。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现 并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质 中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡 献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算 机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设 备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所 述用于辅助疾病推理的系统所执行的流程的全部或部分步骤。而前述的存 储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、 随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可 以存储程序代码的介质。
对于本发明实施例提供的计算机可读存储介质,其上存储的计算机程 序的工作原理和有益效果和上述实施例提供的疾病推理系统类似,具体内 容和参见上述实施例的介绍,本发明实施例对此不再详述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说 明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以 是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多 个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现 本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的 情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各 实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡 献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在 计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用 以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用 定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语 言或其任何组合来实现特定元件。例如,所公开的用于辅助疾病推理的系 统及其所执行的流程中的一些或全部可以通过使用根据本公开的逻辑和算 法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件 (例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的 可编程逻辑电路)进行编程来实现。
还应该理解,前述用于辅助疾病推理的系统所执行的流程可以通过服 务器-客户端模式来实现。例如,客户端可以接收用户输入的数据并将所述 数据发送到服务器。客户端也可以接收用户输入的数据,进行前述用于辅 助疾病推理的系统所执行的流程中的一部分处理,并将处理所得到的数据 发送到服务器。服务器可以接收来自客户端的数据,并且执行前述用于辅 助疾病推理的系统所执行的流程或前述用于辅助疾病推理的系统所执行的 流程中的另一部分,并将执行结果返回给客户端。客户端可以从服务器接 收到用于辅助疾病推理的系统所执行的流程的执行结果,并例如可以通过 输出设备呈现给用户。
还应该理解,用于辅助疾病推理的系统的组件可以分布在网络上。例 如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器 的另一个处理器执行其他处理。用于辅助疾病推理的系统的其他组件也可 以类似地分布。这样,用于辅助疾病推理的系统可以被解释为在多个位置 执行处理的分布式计算系统。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修 改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不 使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种椎体摄片阅片的方法