一种基于互联网医院的智能预问诊方法及系统
技术领域
本发明涉及计算机
技术领域
,尤其是涉及一种基于互联网医院的智能预问诊方法及系统。背景技术
现有的问诊方式主要通过医生的经验对患者进行逐步询问,以获取必要的诊断信息;对于必要的问诊问题,每一次问诊过程中医生都需要对每一个患者进行重复询问,问诊耗时长,问诊效率较低。
发明内容
本申请实施例提供了一种基于互联网医院的智能预问诊方法及系统,可以对患者进行智能预问诊并生成电子病历,提高问诊效率。
本申请实施例的第一方面,提供了一种基于互联网医院的智能预问诊方法,包括以下步骤:
响应于问诊请求,获取输入的主诉信息并转换为多个词向量;其中,所述主诉信息为用户输入的描述疾病情况的信息;
基于所述多个词向量,利用预训练的Bi-LSTM-CRF模型获取关键信息;其中,所述关键信息包括症状、疾病和药名;
基于所述关键信息和所述多个词向量,利用预训练的GCNN模型获取疾病信息;
基于所述疾病信息触发第一问诊模式,在所述第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题,采集用户答复所述若干个第一问诊问题的第一反馈信息;
根据所述若干个第一问诊问题和所述第一反馈信息,生成电子病历。
本申请实施例的第二方面,提供了一种基于互联网医院的智能预问诊系统,包括:
词向量获取模块,用于响应于问诊请求,获取输入的主诉信息并转换为多个词向量;其中,所述主诉信息为用户输入的描述疾病情况的信息;
关键信息获取模块,用于基于所述多个词向量,利用预训练的Bi-LSTM-CRF模型获取关键信息;其中,所述关键信息包括症状、疾病和药名;
疾病信息获取模块,用于基于所述关键信息和所述多个词向量,利用预训练的GCNN模型获取疾病信息;
问诊模块,用于基于所述疾病信息触发第一问诊模式,在所述第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题,采集用户答复所述若干个第一问诊问题的第一反馈信息;
基于互联网医院的智能预问诊模块,用于根据所述若干个第一问诊问题和所述第一反馈信息,生成电子病历。
本申请实施例的第三方面,提供了一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述基于互联网医院的智能预问诊方法的步骤。
本申请实施例的第四方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述基于互联网医院的智能预问诊方法的步骤。
在本申请实施例中,通过将输入的主诉信息并转换为词向量,并利用预训练的Bi-LSTM-CRF模型和预训练的GCNN模型获取疾病信息,根据疾病信息触发第一问诊模式,在第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题实现智能预问诊,通过采集用户对所述若干个第一问诊问题的反馈信息,根据各问诊问题及其对应的反馈信息自动生成电子病历,便于医生提前了解患者病情,简化问诊流程,提高问诊效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明一个实施例中基于互联网医院的智能预问诊方法的应用场景示意图;
图2为本发明一个实施例中基于互联网医院的智能预问诊方法的流程图;
图3为本发明一个实施例中基于互联网医院的智能预问诊系统的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它例子,都属于本申请实施例保护的范围。
在本申请实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
此外,在本申请的描述中,除非另有说明,“若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请提供的基于互联网医院的智能预问诊方法,可以应用于如图1所示的应用环境中。其中,终端101通过网络与服务器102通过网络进行通信。终端101用于获取用户输入的主诉信息和问诊请求,并通过网络发送至服务器102,服务器102用于对所述主诉信息和问诊请求进行数据处理并生成电子病历。
其中,终端101可以是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备或其它可以通过网络与服务器101进行通信的设备,服务器102可以是独立的服务器或者是多个服务器组成的服务器集群。
如图2所示,本发明提供了一种基于互联网医院的智能预问诊方法,包括以下步骤:
步骤S1:响应于问诊请求,获取输入的主诉信息并转换为多个词向量;
主诉信息为用户输入的描述疾病情况的信息,可以是通过在具备文本输入功能的终端上输入。具体地,主诉信息可以包括药品信息和疾病信息;其中,药品信息包括但不限于药品名称信息、药品作用信息和药品种类信息等可以确定相关药品的信息。疾病信息包括但不限于疾病名称信息、疾病对应的症状信息、疾病所在部位信息和疾病程度信息等可以确定相关疾病的信息。
词嵌入(Word Embedding)是指将文本中的词转换为数字向量的方法,通过把一个维数为所有词数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量,从而生成词向量,字词的相似度对应于向量在向量空间的距离远近,对字词向量化后可以实现“腹泄”=“拉肚子”、“国王”-“男人+“女人”=“皇后“等类似的运算。具体地,可以先通过利用jieba等分词工具对主诉信息分为多个字词,再通过利用one-hot编码、TF-IDF算法、构建词-上下文矩阵等常见的词嵌入方法将分词后的多个字词转换为多个词向量。
在一个实施例中,将所述主诉信息转换为词向量的步骤包括:
将所述主诉信息切分为多个字词;
利用预先训练的BERT模型将所述多个字词转换为多个词向量。
具体地,可以先通过利用jieba等分词工具对主诉信息切分为多个字词。
BERT模型(Bidirectional Encoder Representation from Transformers)为一种先进的预训练词向量模型,该模型进一步增强词向量模型泛化,充分描述字符级、词级、句子级甚至句间关系特征,可以更好地表征不同语境的句法与语义信息。利用BERT模型生成高质量的词向量,更加有利于疾病信息的提取和分类,提高生成电子病历的准确性。
步骤S2:利用预训练的Bi-LSTM-CRF模型获取关键信息;其中,所述关键信息包括症状、疾病和药名;
命名实体识别是指从文本中识别出具有特定意义的实体,并将其划分为指定类别的过程,主要包括人名、地名、机构名、专有名词的识别等。在本申请实施例中,利用预训练的Bi-LSTM-CRF模型实现文本向量中症状、疾病和药名的识别。Bi-LSTM-CRF模型(Bi-directional Long Short Term Memory,Conditional Random Field)主要包括输入特征层、Bi-LSTM中间层、CRF输出层,首先词向量作为模型的输入,Bi-LSTM中间层采用包含前向和后向两个方向的LSTM神经网络层对输入的文本序列进行建模,最后采用CRF输出层生成对应的类别标签序列。例如,对于用户输入的主诉信息:“医生你好,我感觉到头疼发热、流鼻涕,是不是感冒了?”,利用预训练的Bi-LSTM-CRF模型提取出“头疼发热”、“感冒”等关键信息,其中,“头疼发热”属于症状,而“感冒”属于疾病。
在本申请实施例中,Bi-LSTM-CRF模型的为预先采用大量训练文本训练并且训练精度达到预设要求的模型,具体地,在将所述词向量输入预训练的Bi-LSTM-CRF模型的步骤之前,还包括:
从数据库中获取训练文本;
利用所述训练文本对Bi-LSTM-CRF模型进行预训练,获取所述Bi-LSTM-CRF模型的训练精度;
调整所述Bi-LSTM-CRF模型的模型参数,直至所述Bi-LSTM-CRF模型的训练精度达到预设要求。
其中,所述训练文本可以为标注有症状、疾病、药名等标签的医学文本数据;训练文本可以从预先构建的医学知识图谱中提取得到,医学知识图谱中包括多个医学实体及各医学实体之间的相互关系。
Bi-LSTM-CRF模型的训练精度要求可以根据用户的实际需求进行设置,
步骤S3:基于所述关键信息和所述多个词向量,利用预训练的GCNN模型获取疾病信息;
GCNN模型(Gated Convolutional Neural Netwaorks,门控卷积神经网络模型)在传统的卷积层中添加了门控单元,相比较传统的CNN模型,GCNN模型通过门控单元保留了非线性的能力,可以过滤掉无用信息,缓解梯度传播、降低梯度弥散,可以更好地抽取到有用的特征。在本申请实施例中,先利用包括多种疾病信息的文本训练集对GCNN模型进行训练,提高GCNN模型精度后,利用预训练的GCNN模型根据关键信息和文本向量进行疾病分类,得到疾病信息。
步骤S4:基于所述疾病信息触发第一问诊模式,在所述第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题,采集用户答复所述若干个第一问诊问题的第一反馈信息;
第一问诊模式是基于疾病信息进行的相关问诊问题的询问,可以根据疾病信息中的疾病名称触发。在一个实施例中,当触发第一问诊模式时,可以将每一个问诊问题配置为问诊窗口或问诊对话框,并通过电子设备的显示器向用户输出展示,获取用户输入的对每一个问诊问题的反馈信息,以此实现对用户的智能预问诊。
在一个实施例中,基于所述疾病信息配置生成若干个第一问诊问题的步骤包括:
将所述疾病信息输入预训练的文本生成模型,生成若干个第一问诊问题并按照预设的顺序依次进行配置。
在一个实施例中,所述文本生成模型基于Seq2seq算法,利用包括大量疾病和症状信息及询问语句的语料训练得到,Seq2seq算法包括一个编码器和解码器,在编码器中将输入的序列进行编码,按照预设的转换函数进行转换并在解码器中进行解码,得到不同形式的输出序列。在本申请实施例中,通过获取输入信息中的疾病名称、药品名称或症状名称等触发词,利用预训练的文本生成模型,生成对应的问诊问题并进行配置,
在一个实施例中,所述基于互联网医院的智能预问诊方法还包括以下步骤:
当采集到最后一个第一问诊问题的反馈信息,结束所述第一问诊模式。
本申请实施例在结束第一问诊模式后,再整合统计各问诊问题及其对应的反馈信息生成电子病历,从而大幅提高互联网医院的在线问诊效率,减少患者的等待时间,减少医生的重复劳动。
步骤S5:根据所述若干个第一问诊问题和所述第一反馈信息,生成电子病历。
在一个实施例中,可以根据每一个问诊问题的配置顺序依次对每一个问诊问题及其对应的反馈信息进行组合,生成电子病历。在其它实施例中,也可以通过将问诊问题及其对应的反馈信息按照预设规则的重要性排序进行组合,或者,还可以根据用户的实际情况进行具体设置。
在本申请实施例中,通过将输入的主诉信息并转换为词向量,并利用预训练的Bi-LSTM-CRF模型和预训练的GCNN模型获取疾病信息,根据疾病信息触发第一问诊模式,在第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题实现智能预问诊,通过采集用户对所述若干个第一问诊问题的反馈信息,根据各问诊问题及其对应的反馈信息自动生成电子病历,便于医生提前了解患者病情,简化问诊流程,提高问诊效率。
在一个实施例中,在利用预训练的GCNN模型获取疾病信息的步骤之后,还包括:
若利用预训练的GCNN模型未获取到疾病信息,则触发第二问诊模式,在所述第二问诊模式下,从数据库中获取若干个第二问诊问题并进行配置;
采集用户对所述若干个第二问诊问题的第二反馈信息;
根据所述若干个第二问诊问题和所述第二反馈信息,生成电子病历。
第二问诊模式用于实现通用问诊问题的询问,其中,所述若干个第二问诊问题为预先存储在数据库中的多个通用问诊问题,其可以包括预先对大量病历进行分析处理得到的多个通用问诊问题。
在一个实施例中,配置所述若干个第二问诊问题的步骤包括:
按照预设的顺序,依次配置每一个第二问诊问题;
当采集到最后一个第二问诊问题的反馈信息,结束所述第二问诊模式。
在一个实施例中,采集用户对所述若干个第二问诊问题的第二反馈信息的步骤包括:
优选地,在依次配置每一个第二问诊问题步骤中,当采集到用户对当前问诊问题的反馈信息后,再按照预设的顺序,配置下一个第二问诊问题,直至采集到最后一个第二问诊问题的反馈信息,此时,结束所述第二问诊模式。其中,所述若干个第二问诊问题的顺序可以根据其重要性或者常用性进行排序,也可以根据用户的实际情况进行设置。
当预训练的GCNN模型未获取到疾病信息,此时,判断无法识别用户的主诉疾病,进入第二问诊模式执行通用问诊流程,通过从数据库中调用若干个第二问诊问题并进行配置,采集用户答复所述若干个第二问诊问题的第二反馈信息,再根据采集到的问诊问题及其对应的第二反馈信息生成电子病历,实现通用问诊模式下的预问诊,简化问诊流程。
在一个实施例中,还包括以下步骤:
获取用户的身份信息;
从数据库中加载与所述身份信息对应的历史电子病历;
当当前问诊问题与所述历史电子病历中的问诊问题相同时,显示该问诊问题对应的历史反馈信息;
当检测到用户的点击操作且该点击操作落在历史反馈信息的显示区域内时,将所述历史反馈信息作为当前问诊问题的反馈信息。
需要说明的是,当前问诊问题可以是第一问诊模式下的第一问诊问题,也可以是第二问诊模式下的第二问诊问题。根据用户的身份信息可以判断用户是否为老用户,如果用户是老用户,那么系统会加载出用户的历史电子病历,该历史电子病历上保存有用户的历史问诊记录,对于其中常用的问诊问题包括用户信息(例如性别、年龄)和/或病史信息(过敏史、孕育史、既往史),通过显示历史反馈信息,用户可以根据需要选择将历史反馈信息用于本次问诊,以避免提问重复的问题,提高问诊效率。
如图3所示,本申请实施例还提供了一种基于互联网医院的智能预问诊系统,包括:
词向量获取模块1,用于响应于问诊请求,获取输入的主诉信息并转换为多个词向量;其中,所述主诉信息为用户输入的描述疾病情况的信息;
关键信息获取模块2,用于基于所述多个词向量,利用预训练的Bi-LSTM-CRF模型获取关键信息;其中,所述关键信息包括症状、疾病和药名;
疾病信息获取模块3,用于基于所述关键信息和所述多个词向量,利用预训练的GCNN模型获取疾病信息;
问诊模块4,用于基于所述疾病信息触发第一问诊模式,在所述第一问诊模式下,基于所述疾病信息配置生成若干个第一问诊问题,采集用户答复所述若干个第一问诊问题的第一反馈信息;
基于互联网医院的智能预问诊模块5,用于根据所述若干个第一问诊问题和所述第一反馈信息,生成电子病历。
需要说明的是,上述实施例提供的基于互联网医院的智能预问诊系统在执行基于互联网医院的智能预问诊方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分为不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于互联网医院的智能预问诊系统与基于互联网医院的智能预问诊方法属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述基于互联网医院的智能预问诊方法的步骤。
本申请实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读储存介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述基于互联网医院的智能预问诊方法的步骤。
本申请实施例的基于互联网医院的智能预问诊方法,通过对用户输入的主诉信息进行智能预问诊,获取用户的反馈信息并利用自然语言处理技术将用户的描述转换成符合医生阅读、书写习惯的电子病历,减少问诊时间和医生的问诊流程,可以有效提高问诊效率。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。