一种能源行业公共数据模型构建方法
技术领域
本发明涉及能源信息管理
技术领域
,具体的,涉及一种能源行业公共数据模型构建方法。背景技术
数据是大数据中心的核心资产,随着信息化进程的不断推进,长期的业务运行和实践积累了大规模的领域数据,数据生成频率也日益增高,形成动态大数据集。但是数据打通和共享是长期困扰企业数字化建设的一道难题。其中,数据碎片化、多源化及数据结构差异大等问题导致大数据资源很难互联互通、共享以及最大化的被发掘和利用。当前大部分企业信息系统的建设面临着“各自为政、条块分割、烟囱林立”的问题。另外,传统的通过整合和组织系统内部的接口和数据映射的方式,导致开发接口多且复杂,开发成本高,可管理性和可扩展性不足,对于存量应用和技术栈异构环境不支持,需要大量定制技术方案;缺乏对研发模型全生命周期的管理和维护等。同时在人员能力方面也有着许多要求,如研发人员受限于对技术栈的掌握水平不同等;尤其是面向特定交换需求的专用数据交换系统,在应对新增异构数据资源时扩展能力显得捉襟见肘,不同交换系统间的交换功能难以互通共享,难以形成支持跨交换系统的数据交换平台;数据共享交换功能复用困难,面对新生数据交换需求不能快速形成解决方案,系统伸缩性不足。以上种种都会给企业进行软件研发、开展信息化建设和数字化转型带来负面影响。据此,有必要建立适应能源数据中心建设现状的、跨能源品种、兼容不同工艺流程等实际需求的、实体对象释义具有清晰边界的能源行业公共数据模型,对下实现多数据源的规范接入,对上实现数据集市层表的标准化建设。
发明内容
本发明的目的提出一种能源行业公共数据模型构建方法,解决了能源大数据中心业务实体定义无法清晰划分、共享层模型共享性能差、多源数据无法统一接入的问题,为实现集约化、集团化的信息化建设提供支持,为智能电网的发展提供有效的数据支撑。
为实现上述技术目的,本发明提供的一种技术方案是,一种能源行业公共数据模型构建方法,包括如下步骤:
确定公共数据模型中的数据主题域,数据主题域内包括有能源基础信息模型、业务实体台账模型以及社会运行数据模型,能源大数据中心接入包括能源基础信息模型、业务实体台账模型和社会运行数据模型在内的各类模型数据;
构建能源大数据中心的实体对象池,实体对象池的元素包括实体对象以及其相关属性;
构建能源专业词库的知识图谱搜索引擎;
构建公共数据模型中逻辑结构模型,所述逻辑结构模型划为核心集和领域集,所述核心集包括有定义类型结构的结构模型和基础模型,所述领域集包括有领域模型;
根据知识图谱搜索引擎,判断领域模型中逻辑实体i与领域模型中逻辑实体j是否存在逻辑关系;
从业务需求出发,由需求提出方提炼关键词,并依据关键词在实体对象池中进行检索;依托知识图谱搜索技术,优先反馈实体对象池中相似度最高的实体,并展示相应属性,根据匹配度判定逻辑判断其是否满足需求,根据判定结果实时更新领域集;
通过低代码平台将逻辑结构模型转化为表单设计器中的表单数据,表单设计器中对表单数据分别进行数据结构建模、业务规则建模及界面布局建模;其中,数据结构建模用于存储物理数据库中的表结构,利用构建逻辑结构模型步骤,低代码平台将逻辑结构模型转成物理模型,生成数据库的表结构;同时,利用低代码平台提供的可视化工具,允许用户对该物理模型进行修改;业务规则建模用于存储表单的业务组件信息及业务逻辑信息,界面布局建模用于存储各类型终端对应的表单布局样式。
作为优选,所述能源基础信息模型包括有能源数据模型、能源设备数据模型和能源流动数据模型;根据能源、能源设备、能源流动网络和能源系统获取到的能源参数分别构建所述能源数据模型、能源设备数据模型、能源流动数据模型。
作为优选,构建能源数据模型,包括如下步骤:
确定能源类别,对能源类别进行编码(依据国家标准《GBT 29870-2013_能源分类与代码》进行定义);根据能源类别的不同对能源物质进行能源分类,能源物质包括交流电、直流电、燃气、燃油、蒸汽、热水和冷水中的任一种,
将每类能源分类的编码作为公共数据模型的第一元数据并存储;
能源数据模型中包含能源入口标识和能源出口标识的能源介质类型。
作为优选,构建能源设备数据模型,包括如下步骤:
确定能源设备类别,对能源设备进行设备分类,并进行设备类型编码,所述设备类型编码包括能源设备分类的类型编码、能源设备的能源入口标识和能源出口标识的类型编码;
针对每类能源设备,进行设备属性编码;
将设备属性编码和设备类型编码作为公共数据模型的第二元数据并存储;
对每一类能源设备,建立其能源入口和能源出口的标准描述,包含能源入口的能源介质类型和数量以及能源出口的能源介质类型和数量,能源介质类型的描述采用能源分类元数据;将能源设备分类的标准编码作为综合能源数字化平台的元数据,标准编码用于描述能源设备的类型;
对每一类能源设备,建立其属性描述的标准编码;对每一类能源设备,将其属性分为量测属性和固有属性,采用标准编码metric和attr代表两种属性;每一类能源设备,按照能源设备分类原则,建立其量测属性和固有属性的详细分类,并将这些详细分类编码化;将每一类能源设备的标准编码作为公共数据模型的元数据。
作为优选,构建能源流动数据模型,包括如下步骤:
针对相同类型的能源物质,建立不同能源设备的能源入口和能源出口的连接关系,构建能源流动网络信息模型;
能源入口和能源出口采用不同的标记进行标注;能源物质在生产、输送、分配和消耗环节的能源设备当中流转,形成一个能源流动网络,能源流动网络刻画了综合能源世界的连接结构;
构建能源量测模型,所述能源量测模型表征不同能源业务实体的能源入口和能源出口的量测值。
作为优选,所述业务实体台账模型对产生或/和消费能源的各层级实体分类并编码,提炼业务实体关键属性,建立业务实体台账信息模型;
所述社会运行数据模型包括社会各行业、管理部门的实时运行数据,实时运行数据包括车流数据、期货以及证券价格数据。
作为优选,实体对象池中元素的来源包括:
a、能源行业企业原先信息化系统的各种实体业务,进行数据治理和抽象化,抽取相关的元素,建立公共信息模型的实体对象池;
b、从互联网或其他数字资源中,获取相关实体业务相关实例化文件,利用图片识别技术对图片进行信息抽取、关键词提取和自动摘要生成,最后储存在公共信息模型的实体对象池中,其中图片识别技术作为本领域人员掌握的基本技能,图片识别技术的基本步骤如下:信息获取图像采集 -> 图像预处理(如二值化、反色等处理方法)得到特征数据 ->训练过程(分类器涉及和分类决策) -> 识别。
作为优选,构建能源专业词库的知识图谱搜索引擎包括如下步骤:
A1、根据公共数据模型的主题域建模,将数据源根据类型进行数据整合,得到集合S={S1,S2,......,Sn},其中n属于正整数,n为确定的主题域个数,构成知识图谱的内容;根据相关主题域Si的数据,i属于正整数,且i∈[1,n],得到Et1∈Si,Et2∈Si,......Etm∈Si,其中Et为Si主题域的实体E在t时刻产生的数据,m属于正整数,t属于正数,且t>0;
A2、能源行业主题域实体识别,对能源相关设备的关联关系信息梳理,按照不同的主题,分别构建实例集合E={E1 ,E2 ,...Ee},其中e属于正整数,且e∈[1,n];如S2代表锅炉房消耗主体域,E1为天然气消耗实体,E2为水表消耗实体,E3为电量消耗实体;
A3、主题域实体属性识别,对实体对象的属性进行整合,构建实体属性集合P={P1,P2 ,... ,Px} ,其中x属于正整数,且x∈[1,n];如人员实体时,P={P1(身份证号)、P2(岗位)、P3(邮箱)、P4(电话)、P5(专业技能水平)}等集合信息;
A4、全业务域知识图谱化;基于A1、A2、A3步骤的梳理,通过实体对象池中的图数据库,实现实体、关系、属性的固化存储,构架能源行业域的网络知识图谱,实现全业务域知识的图谱化管理;
A5、采用IK分词器构建搜索引擎的中文分词器,IK分词器分为ik_max_word分词器和ik_smart分词器,其中ik_max_word将文本做最细粒度的拆分,如“XX,供电公司,供电,公司”;ik_smart将文本做最粗粒度的拆分,如:“XX,供电公司”;
A6、构建专业词库,梳理和固化能源行业的专业词库,辅助搜索引擎的分析和NLP自然语言A7、实现基于电力专业词库,集合IK分词器的决策树随机森林算法,实现知识图谱数据的搜索匹配;主要包含步骤有NLP自然语言处理;关系关键之识别;属性识别;最终返回相关对象的知识图谱;比如某供电局管辖的某变电站所属的某变压器的设备信息==》XX供电局(实体)管辖(关系)的XX变电站(实体)所属(关系)的XX变压器(实体)的设备信息(关系)。
作为优选,领域模型中逻辑实体i与领域模型中逻辑实体j是否存在逻辑关系的判定包括如下步骤:
若逻辑实体i与逻辑实体j存在依存关系, 则将逻辑实体i的主键作为逻辑实体j的外键,i≠j且i,j∈[1,n],n为所述领域模型中逻辑实体总数;
若逻辑实体i中的记录数据与逻辑实体j中的记录数据为一对一的关系,则逻辑实体i与逻辑实体j的二元关系为1:1 ;
若逻辑实体i中的记录数据与逻辑实体j中的记录数据为一对x的关系,则逻辑实体i与逻辑实体j的二元关系为l:x;
若逻辑实体i中的记录数据与逻辑实体j中的记录数据为x对y的关系,则逻辑 实体i与逻辑实体j的二元关系为x:y。
作为优选,根据匹配度判定逻辑判断其是否满足需求并根据判定结果实时更新领域集包括如下步骤:
根据业务需求,提炼出关键字,通过知识图谱搜索引擎在实体对象池中找到对应的业务关键字,根据业务需求和领域创建对应的业务关键字,并将所述业务关键字以及其属性存储在实体对象池中以及知识图谱中;
当根据关键字在逻辑模型中未检索到对应的领域模型时,根据业务需求、领域关键字以及属性,在领域模型资料库中创建领域模型,并将新建领域模型存储至领域模型集中。
作为优选,能源行业公共数据模型的逻辑模型由结构模型、基础模型和领域模型三部分组成;
结构模型是公共数据模型的定义基础,通过引用XML Schema的语法和基本数据类型可以定义基本属性(如id、ref、metadata、relationshipMetadata等)和基本数据类型(如抽象数据类型、关系数据类型、元数据类型等)。其他所有模型都必须以结构模型为基础进行定义,保证接收方按照结构模型可以正确解读;
基础模型是通用的数据类型的集合,这些数据类型是信息共享环境中通用概念的基本定义,如几乎所有业务系统都包含对人员的描述,可将所有人员部分抽象成为人员类型;
领域模型是根据业务领域使用需要,在基础模型上针对领域常用类型进行扩展的类型集合构成的模型。
作为优选,所述逻辑结构模型划为核心集和领域集两类,核心集包括有定义类型结构的结构模型和基础模型,通过定义最基本的模型实现数据共享的简洁性要求;所述领域集包括有领域模型;核心集是最权威的定义,也是强制所有参与数据共享的业务系统需要支持的定义;核心集中数据模型的重要性更强,发生新建、修改、删除、增补时需通过基于知识图谱技术的重要性评价模块,并由专家团队审批后方可执行,以此为基础衍生出领域集。领域集通过对基础模型内容按照结构模型的规则扩展形成针对特定领域内信息共享具体要求的领域模型的集合,满足信息共享完备性的要求,针对不同特点定义不同特性的属性,以适应具体信息共享标准需要。
作为优选,对建立好的能源行业公共数据模型进行运维时,将模型名称或者属性名称作为公共数据模型的数据,进行匹配度判定;
其中,将模型名称作为公共数据模型的输入数据进行匹配度判定,遵循如下判定逻辑:
全匹配:如果在公共数据模型中找到完全相同的表达方式,即命名或者其他取值范围完全相同,则认为二者语义结构是完全相同的,可以直接使用进行维护其属性;此外,若名称虽然与公共数据模型中名称不同但语义与结构完全相同,亦判定为全匹配;
部分匹配:如果在公共数据模型中不能找到完全相同的表达方式,即命名或者其他取值范围不完全相同,则判断二者语义结构是否具有相似性,寻找出相似度最高的若干个推送给用户,用户可以对其属性进行编辑修改和保存;
不匹配:如果在公共数据模型中找不到相同或相似的模型,则可以先去实体对象池中去寻找匹配度较高的实体信息,并且依据数据抽取时,实体与属性的关联,推送该实体信息以及属性给用户,用户可以在此之上编辑模型或者属性,最后可以将该模型保存公共数据模型中。
作为优选,将属性名称作为公共数据模型的输入数据进行匹配度判定,遵循如下判定逻辑:
全匹配:如果在公共数据模型中找到完全相同的属性名称,即命名或者其他取值范围完全相同,则认为二者语义结构是完全相同的,则可以在公共数据模型中寻找该属性相关的模型,推送给用户进行选择,用户可以选择某模型后直接使用进行维护其属性;此外,若名称虽然与公共数据模型中的属性名称不同但语义与结构完全相同,亦判定为全匹配;
部分匹配:如果在公共数据模型中不能找到完全相同的表达方式,即命名或者其他取值范围不完全相同,则判断二者语义结构是否具有相似性,寻找出相似度最高的若干个属性并且关联相关的模型推送给用户,用户可以选择某模型并且对其属性进行编辑修改和保存;
不匹配:如果在公共数据模型中找不到相同或相似的属性,则可以先去实体对象池中去寻找匹配度较高的属性信息,并且依据数据抽取时,实体与属性的关联,推送该实体信息以及属性给用户,用户可以在此之上编辑模型或者属性,最后可以将该模型保存公共数据模型中。
本发明的有益效果:
1、本发明提出的一种能源行业公共数据模型构建方法,采用知识图谱和图像识别技术,从能源行业内外部获取与能源数据相关的复数个业务对象;以业务需求为输入,根据多个业务对象之间的关系和多个业务对象创建能源公共数据模型的逻辑模型;根据逻辑模型创建能源公共数据模型的物理模型;根据物理模型创建能源公共数据模型的数据库表,解决了能源大数据中心业务实体定义无法清晰划分、共享层模型共享性能差、多源数据无法统一接入的问题;
2、通过该能源公共数据模型的构建,建立了底层多数据源统一接入和上层应用标准化调用的技术基础;同时数据交换类应用通过数据共享库进行交互,节省交互资源、统一数据来源及接口访问标准,避免了业务应用一对一的接口程序开发,为终端用户提供一致的企业数据集成视图,节省了建设开发、运行维护等工作成本,达到更有效地利用信息化投资;为实现集约化、集团化的信息化建设提供支持,为智能电网的发展提供有效的数据支撑。
附图说明
图1为本发明的一种能源行业公共数据模型构建方法的流程图。
具体实施方式
为使本发明的目的、技术方案以及优点更加清楚明白,下面结合附图和实施例对本发明作进一步详细说明,应当理解的是,此处所描述的具体实施方式仅是本发明的一种最佳实施例,仅用以解释本发明,并不限定本发明的保护范围,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:本实施例为了在能源行业建立一个能源大数据中心,以实体对象池为支撑,多类型数据源为基础建立共享层模型,即本实施例所述的能源行业公共数据模型,以能源行业公共数据模型为基础,支撑上层的数据集市层模型;构建能源专业词库的知识图谱搜索引擎,用知识图谱、图像识别等方法,从能源行业内外部获取(互联网数据源处获取包括:专利、论文、期刊、论文、新闻等,还包括物联管理平台、政务数据接口)与能源数据相关的复数个业务对象;以业务需求为输入,根据多个业务对象之间的关系和多个业务对象创建能源公共数据模型的逻辑模型;根据逻辑模型创建能源公共数据模型的物理模型;根据物理模型创建能源公共数据模型的数据库表;知识图谱的建立包括知识获取、图谱华、知识理解以及图谱应用,所述知识获取包括数据的结构化抽取、知识的半结构化抽取、知识的无结构化抽取以及数据清洗;数据的图谱化包括知识表示、三元组化、实体融合以及关联建边;图谱的应用包括知识的推荐和搜索;构建知识图谱所采用的技术(体系)架构作为本领域人员的公知技术在此不再累述,应用于能源行业的知识图谱搜索引擎的建立实施例中有具体事例进行表征。
如图1所示,一种能源行业公共数据模型构建方法,包括如下步骤:
步骤S1、确定公共数据模型中的数据主题域,数据主题域内包括有能源基础信息模型、业务实体台账模型以及社会运行数据模型,能源大数据中心接入包括能源基础信息模型、业务实体台账模型和社会运行数据模型在内的各类模型数据;
其中,能源基础信息模型包括有能源数据模型、能源设备数据模型和能源流动数据模型;根据能源、能源设备、能源流动网络和能源系统获取到的能源参数分别构建所述能源数据模型、能源设备数据模型、能源流动数据模型。
构建能源数据模型,包括如下步骤:
确定能源类别,对能源类别进行编码(依据国家标准《GBT 29870-2013_能源分类与代码》进行定义);如表1所示为能源分类标准编码表,根据能源类别的不同对能源物质进行能源分类,能源物质包括交流电、直流电、燃气、燃油、蒸汽、热水和冷水中的任一种;
将每类能源分类的编码作为公共数据模型的第一元数据并存储;
能源数据模型中包含能源入口标识和能源出口标识的能源介质类型。
表1. 能源分类标准编码表
。
构建能源设备数据模型,包括如下步骤:
确定能源设备类别,如表2所示为能源设备标准编码表,对能源设备进行设备分类,并进行设备类型编码,所述设备类型编码包括能源设备分类的类型编码、能源设备的能源入口标识和能源出口标识的类型编码;
针对每类能源设备,进行设备属性编码;
将设备属性编码和设备类型编码作为公共数据模型的第二元数据并存储;
对每一类能源设备,建立其能源入口和能源出口的标准描述,包含能源入口的能源介质类型和数量以及能源出口的能源介质类型和数量,能源介质类型的描述采用能源分类元数据;将能源设备分类的标准编码作为综合能源数字化平台的元数据,标准编码用于描述能源设备的类型;
对每一类能源设备,建立其属性描述的标准编码;对每一类能源设备,将其属性分为量测属性和固有属性,采用标准编码metric和attr代表两种属性;每一类能源设备,按照能源设备分类原则,建立其量测属性和固有属性的详细分类,并将这些详细分类编码化;将每一类能源设备的标准编码作为公共数据模型的元数据。
表2. 能源设备标准编码表
。
构建能源流动数据模型,包括如下步骤:
针对相同类型的能源物质,建立不同能源设备的能源入口和能源出口的连接关系,构建能源流动网络信息模型;
能源入口和能源出口采用不同的标记进行标注;能源物质在生产、输送、分配和消耗环节的能源设备当中流转,形成一个能源流动网络,能源流动网络刻画了综合能源世界的连接结构;
构建能源量测模型,所述能源量测模型表征不同能源业务实体的能源入口和能源出口的量测值。
业务实体台账模型对产生或/和消费能源的各层级实体分类并编码,提炼业务实体关键属性,建立业务实体台账信息模型,其建立方式与能源设备数据模型的建立方式相同;其能源实体不限于诸如锅炉、空调等能源生产、转化、消费设备,也包括行政区域、行业等逻辑实体。
社会运行数据模型包括社会各行业、管理部门的实时运行数据,实时运行数据包括车流数据、期货以及证券价格数据。
步骤S2、构建能源大数据中心的实体对象池,实体对象池的元素包括实体对象以及其相关属性;实体对象池中元素的来源包括:
a、能源行业企业原先信息化系统的各种实体业务,进行数据治理和抽象化,抽取相关的元素,建立公共信息模型的实体对象池;
b、从互联网或其他数字资源中,获取相关实体业务相关实例化文件,利用图片识别技术对图片进行信息抽取、关键词提取和自动摘要生成,最后储存在公共信息模型的实体对象池中。
以锅炉房作为实体为例,可以从业务系统中检索锅炉房能耗消耗表,在实体对象池中,抽取该表数据,新增“锅炉房消耗”对象,同时新增“天然气”,”水表”,“电量”等对象;
在实体对象池中,抽取该表数据,新增“累计流量”,“剩余流量”,“功总”,“峰”,“谷”,“平”等属性;可以从互联网或者其他业务系统中,根据锅炉房消耗关键字检索数据,在返回的数据集合中获取相关实体业务相关实例化文件,利用图片识别技术对图片进行信息抽取、关键词提取和自动摘要生成,最后存入本地系统中。例如从互联网大量获取“锅炉房消耗”(表3所示为锅炉房能源消耗表),根据图片识别技术,对相关锅炉房消耗信息抽取,提取表中字段抬头信息。
表3.锅炉房能源消耗表
。
步骤S3、构建能源专业词库的知识图谱搜索引擎;包括如下步骤:
A1、根据公共数据模型的主题域建模,将数据源根据类型进行数据整合,得到集合S={S1,S2,......,Sn},其中n属于正整数,n为确定的主题域个数,构成知识图谱的内容;根据相关主题域Si的数据,i属于正整数,且i∈[1,n],得到Et1∈Si,Et2∈Si,......Etm∈Si,其中Et为Si主题域的实体E在t时刻产生的数据,m属于正整数,t属于正数,且t>0;
A2、能源行业主题域实体识别,对能源相关设备的关联关系信息梳理,按照不同的主题,分别构建实例集合E={E1 ,E2 ,...Ee},其中e属于正整数,且e∈[1,n];如S2代表锅炉房消耗主体域,E1为天然气消耗实体,E2为水表消耗实体,E3为电量消耗实体;
A3、主题域实体属性识别,对实体对象的属性进行整合,构建实体属性集合P={P1,P2 ,... ,Px} ,其中x属于正整数,且x∈[1,n];如人员实体时,P={P1(身份证号)、P2(岗位)、P3(邮箱)、P4(电话)、P5(专业技能水平)}等集合信息;
A4、全业务域知识图谱化;基于A1、A2、A3步骤的梳理,通过实体对象池中的图数据库,实现实体、关系、属性的固化存储,构架能源行业域的网络知识图谱,实现全业务域知识的图谱化管理;
A5、采用IK分词器构建搜索引擎的中文分词器,IK分词器分为ik_max_word分词器和ik_smart分词器,其中ik_max_word将文本做最细粒度的拆分,如“XX,供电公司,供电,公司”;ik_smart将文本做最粗粒度的拆分,如:“XX,供电公司”;
A6、构建专业词库,梳理和固化能源行业的专业词库,辅助搜索引擎的分析和NLP自然语言A7、实现基于电力专业词库,集合IK分词器的决策树随机森林算法,实现知识图谱数据的搜索匹配;主要包含步骤有NLP自然语言处理;关系关键之识别;属性识别;最终返回相关对象的知识图谱;比如某供电局管辖的某变电站所属的某变压器的设备信息==》XX供电局(实体)管辖(关系)的XX变电站(实体)所属(关系)的XX变压器(实体)的设备信息(关系)。
步骤S4、构建公共数据模型中逻辑结构模型,所述逻辑结构模型划为核心集和领域集,所述核心集包括有定义类型结构的结构模型和基础模型,所述领域集包括有领域模型;
结构模型是公共数据模型的定义基础,通过引用XML Schema的语法和基本数据类型可以定义基本属性(如id、ref、metadata、relationshipMetadata等)和基本数据类型(如抽象数据类型、关系数据类型、元数据类型等);其他所有模型都必须以结构模型为基础进行定义,保证接收方按照结构模型可以正确解读。
基础模型是通用的数据类型的集合,这些数据类型是信息共享环境中通用概念的基本定义,如几乎所有业务系统都包含对人员的描述,可将所有人员部分抽象成为人员类型;
领域模型是根据业务领域使用需要,在基础模型上针对领域常用类型进行扩展的类型集合构成的模型。
逻辑结构模型划为核心集和领域集两类,核心集包括有定义类型结构的结构模型和基础模型,通过定义最基本的模型实现数据共享的简洁性要求;所述领域集包括有领域模型;核心集是最权威的定义,也是强制所有参与数据共享的业务系统需要支持的定义;核心集中数据模型的重要性更强,发生新建、修改、删除、增补时需通过基于知识图谱技术的重要性评价模块,并由专家团队审批后方可执行,以此为基础衍生出领域集。领域集通过对基础模型内容按照结构模型的规则扩展形成针对特定领域内信息共享具体要求的领域模型的集合,满足信息共享完备性的要求,针对不同特点定义不同特性的属性,以适应具体信息共享标准需要。
步骤S5、根据知识图谱搜索引擎,判断领域模型中逻辑实体i与领域模型中逻辑实体j是否存在逻辑关系;从业务需求出发,由需求提出方提炼关键词,并依据关键词在实体对象池中进行检索;依托知识图谱技术,优先反馈实体对象池中相似度最高的实体,并展示相应属性,根据匹配度判定逻辑判断其是否满足需求,根据判定结果实时更新领域集;
运维人员在对公共数据模型进行运维时,可以输入模型名称或者属性名称,能源行业公共数据模型设计时从业务需求出发,由需求提出方提炼关键词,并依据关键词在实体对象集中进行检索。依托知识图谱技术,优先反馈实体对象集中相似度最高的实体,并展示相应属性,辅助业务人员判断是否满足其需求。
匹配实体名称流程如下:
全匹配:如果能在知识图谱搜索引擎支撑下,在实体对象集中找到完全相同的表达方式,即命名完全相同,则认为二者语义结构是完全相同的,可以直接使用并且能够维护其属性。此外,若名称虽然与中名称不同但语义与结构完全相同,也可认为是全匹配;
部分匹配: 如果能在知识图谱搜索引擎支撑下,在实体对象集中不能找到完全相同的表达方式,即命名或者其他取值范围等完全相同,则判断二者语义结构是否具有相似性,寻找出相似度最高的若干个推送给用户,用户可以对其属性进行编辑修改和保存;
不匹配: 如果能在知识图谱搜索引擎支撑下,在实体对象集中不能找到完全相同的表达方式,则用户需要手动新增实体以及属性,最后可以将该实体以及属性保存至实体对象池中。
匹配对象属性名称流程如下:
全匹配: 如果能在知识图谱搜索引擎支撑下,在实体对象集中找到完全相同的表达方式,即命名完全相同,则认为二者语义结构是完全相同的,则可以在实体对象池中寻找该属性相关的实体,推送给用户进行选择,用户可以选择某实体后直接使用进行维护其对象属性。此外,若名称虽然与对象实体集中的属性名称不同但语义与结构完全相同,也可认为是全匹配;
部分匹配: 如果能在知识图谱搜索引擎支撑下,在实体对象集中不能找到完全相同的表达方式,即命名或者其他取值范围等完全相同,则判断二者语义结构是否具有相似性,寻找出相似度最高的若干个属性并且关联相关的实体推送给用户,用户可以选择某实体并且对其属性进编辑修改和保存;
不匹配: 如果能在知识图谱搜索引擎支撑下,在实体对象集中不能找到完全相同的表达方式,则用户需要手动新增实体以及属性,最后可以将该实体以及属性保存至实体对象池中。
步骤S6、构建物理模型;使用低代码平台,利用低代码平台的逻辑模型解析器,对所获取的逻辑模型进行解析,生成伪代码脚本、自动执行脚本,转化为表单设计器中的表单数据,对表单数据的数据结构进行建模,表单设计器中对表单的建模包含数据结构建模、业务规则建模及界面布局建模,其中,数据结构建模用于存储物理数据库中的表结构,例如,根据逻辑模型中实体“锅炉房消耗”,建立“锅炉房消耗表”,同时,根据逻辑模型“锅炉房消耗”建表,并且建立主键,根据“锅炉房”所关联的实体“天然气消耗”,“水表消耗”,“电量消耗”分别也建表,使用锅炉房的主键作为这几张表的外键,进行关联。另外,根据这几个实体所对应的属性,建立各个表的字段。利用构建逻辑模型步骤,该工具平台可以自动将逻辑模型转成物理模型,生成数据库的表结构。同时,利用低代码平台提供的可视化工具,用户可以对该物理模型进行修改;业务规则建模用于存储表单的业务组件信息及业务逻辑信息,界面布局建模用于存储各类型终端对应的表单布局样式。
以上所述之具体实施方式为本发明一种能源行业公共数据模型构建方法的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明之形状、结构所作的等效变化均在本发明的保护范围内。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:基于深度学习的数据处理方法、装置和系统