一种基于多层次多维度模型的密码服务动态监控系统
技术领域
本申请涉及电力系统
技术领域
,特别是涉及一种基于多层次多维度模型的密码服务动态监控系统。背景技术
为贯彻落实国家和公司的密码政策,实现密码基础设施资源集中统一建设、管理和维护,规范密码在各业务系统中的规范应用,国家电网公司已开发建设了统一密码服务平台。该平台为各业务系统提供了密码机、微服务、数据库等软硬件设施,用于支撑数字证书颁发、用户身份鉴别、实名认证、业务数据加解密等密码服务。为了保障密码服务平台中各类软硬件设备和服务的正常运行,监测各类软硬件设备的运行状态和及时处理异常信息变得尤为重要。
目前,多数监控系统主要采取的是人工监测设备和服务是否正常,出现异常后需要运维人员去后台查看错误日志进行系统运维。整个运维过程效率较低,可操作性较差。
发明内容
本公开的实施例提供了一种基于多层次多维度模型的密码服务动态监控系统,以至少解决现有技术中存在的多数监控系统主要采取的是人工监测设备和服务是否正常,出现异常后需要运维人员去后台查看错误日志进行系统运维。整个运维过程效率较低,可操作性较差的技术问题。
根据本公开实施例的一个方面,提供了一种基于多层次多维度模型的密码服务动态监控系统,包括:所述密码服务动态监控系统包括各级密码服务动态监控系统,所述各级密码服务动态监控系统为总部级监控系统、数据中心监控系统以及省级监控系统,所述各级密码服务动态监控系统分别包括数据采集模块、管理配置模块、系统监控模块、系统运维模块、异常报警模块、数据库以及信息展示模块;所述总部级监控系统用于通过视频、数据和控制连接方式,集中监控并实时展示数据中心监控系统以及省级监控系统的密码服务系统运行状况、密钥发行状态、设备服务状态、密管系统运行状态,当设备发生告警时,前端的监控报警采集服务将报警信息传送到监控系统展示区,进行远程指挥处理;所述数据中心监控系统用于收集所辖范围内的省级密码服务系统运行状态信息,并根据问题的级别进行报警、数据上传以及系统运维,接收所述总部级监控系统的远程指挥及调控;所述省级监控系统主要用于收集省级密码服务系统运行状态信息,并根据问题的级别进行报警、数据上传以及系统运维,接收所述数据中心监控系统的远程指挥及调控。
在本发明中,基于多层次多维度模型的密码服务动态监控系统,能够对密码服务系统及软硬件设备的运行状态进行动态监控,及时发现异常信息并告警,并采用可视化界面帮助运维人员诊断和解决告警信息,从而降低统一密服平台运维人员的工作量,提高运维工作效率,降低系统运维的复杂度。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例所述的多层次多维度密码服务监控模型示意图;
图2是根据本公开实施例所述的各级密码服务动态监控系统逻辑架构图;
图3是根据本公开实施例所述的基于多层次多维度模型的密码服务动态监控方法示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
根据本实施例,提供了一种多层次多维度模型的密码服务动态监控系统。所述密码服务动态监控系统包括各级密码服务动态监控系统,所述各级密码服务动态监控系统为总部级监控系统、数据中心监控系统以及省级监控系统,所述各级密码服务动态监控系统分别包括数据采集模块、管理配置模块、系统监控模块、系统运维模块、异常报警模块、数据库以及信息展示模块;所述总部级监控系统用于通过视频、数据和控制连接方式,集中监控并实时展示数据中心监控系统以及省级监控系统的密码服务系统运行状况、密钥发行状态、设备服务状态、密管系统运行状态,当设备发生告警时,前端的监控报警采集服务将报警信息传送到监控系统展示区,进行远程指挥处理;所述数据中心监控系统用于收集所辖范围内的省级密码服务系统运行状态信息,并根据问题的级别进行报警、数据上传以及系统运维,接收所述总部级监控系统的远程指挥及调控;所述省级监控系统主要用于收集省级密码服务系统运行状态信息,并根据问题的级别进行报警、数据上传以及系统运维,接收所述数据中心监控系统的远程指挥及调控。
例如,参考图1所示,所述密码服务动态监控系统主要由总部级监控系统,(上海、北京、西安)三地数据中心监控系统和省级监控系统组成。各级密码服务动态监控系统主要由数据采集、管理配置、数据监控、异常报警、系统运维和信息展示等功能模块组成。
总部级密码服务动态监控系统主要用于对各层级密码服务状态进行集中展示及指挥控制,通过视频、数据和控制连接方式来集中监控、实时展示三地数据中心及其他省公司的密码服务系统运行状况、密钥发行状态、设备服务状态、密管系统运行状态等。当设备发生告警时,前端的监控报警采集服务能够精确地将报警信息(图像)传送到监控系统展示区,领导和专家可远程指挥处理。
三地数据中心监控系统主要用于收集所辖范围内的省级密码服务系统运行状态等信息,并根据问题的级别进行报警,数据上传,系统运维和接收总部级密码服务动态监控系统的远程指挥及调控。
省级监控系统主要用于收集省级密码服务系统运行状态等信息,并根据问题的级别进行报警,数据上传,系统运维和接收总部级和三地数据中心级密码服务动态监控系统的远程指挥及调控。
参考图2所示,图2为各级密码服务动态监控系统逻辑架构。各级密码服务动态监控系统主要由数据采集、管理配置、数据监控、异常报警、系统运维和信息展示等功能模块组成。
所述数据采集模块主要用于采集系统日志、前置路由、数据库资源及运行状态、微服务状态、密码资源调用状态等信息。
所述管理配置模块主要用于配置监控指标、根据业务需求新增监控任务、管理监控运维系统等。
所述系统监控模块主要从不同来源监控多种服务的运行状态和指标,通过监控服务,获取设备与服务的异常信息;通过收集系统的运行日记,经过清洗与分析后,获取其中的异常信息,如:告警时间、告警类型、告警级别、告警状态、告警模块、告警详细信息等,基于监控数据生成报警信息或运维信息。
所述系统运维模块主要用于根据监控数据和报警数据通过弹窗等方式推送给运维人员,由运维人员对对异常进行处理。
所述异常报警模块主要用于根据报警设备、报警登记、报警指标、报警阈值、持续次数,设置报警规则,根据报警规则判断是否要生成不同等级的报警数据,并存入数据库。所述异常报警模块支持主动报警和异常日志报警相结合的多维度报警方式。
所述数据库主要用于分类存储监控数据、报警数据和运维数据等信息。
所述信息展示模块主要用于以图形化的方式向用户展示经过分类、汇总、整理后的结构化监测数据、报警信息和运维信息等,快速诊断密码系统运行状态和报警原因,对相关人员进行提醒并及时对报警进行处理。
参考图3所示,图3是基于多层次多维度模型的密码服务动态监控方法。所述基于多层次多维度模型的密码服务动态监控方法主要通过配置各级密码服务监控系统监控策略,采集统一密码服务平台的各项运行数据,进行监控分析,及时发现问题并进行报警,将报警信息通知运维人员,帮助运维人员快速定位与解决问题,包括监控策略配置、制定报警规则、数据采集、数据监控、异常报警、系统运维和信息展示等步骤。
所述监控策略配置为总部级监控系统、三地数据中心监控系统和省级监控系统多层次多维度进行密码服务状态监控。总部级服务动态监控系统进行各层级密码服务状态集中展示和指挥控制;三地数据中心监控系统收集并监控省级密码服务监控系统,将监控数据上传给总部级监控系统,并接受总部级的指挥控制;省级监控系统向三地数据中心上传监控数据,并接受总部级和数据中心及的指挥控制。各级监控系统主要根据密码服务需求进行密码机、前置路由、微服务、数据库和密码资源运行状态监控,并根据实际业务增减监控业务。
所述报警规则制定过程为:首先确定报警参数,即报警指标Ini、报警阈值Vt、持续次数Ts,根据实际业务需求,确定各参数的权重wi,通过计算加权平均和的方式计算报警值Va,并设置报警规则。当Va大于等于设定的报警阈值Vt,且持续次数Ts大于预先设定的次数阈值T0时进行系统报警,并将报警信息存入系统数据库。
所述报警值计算方法为:
所述数据采集过程为:所述监控系统通过接口方式定期主动获取密码机、前置路由、微服务、数据库和密码资源运行状态等监测数据并存入数据库。
所述监控分析通过监控服务,获取设备与服务的异常信息,或者通过收集系统的运行日记,经过清洗与分析后,获取其中的异常信息。具体过程为:监控系统获取密码机、前置路由、微服务、数据库和密码资源等设备或系统的服务状态S1、接口状态S2、CPU利用率S3、内存利用率S4、连接利用率S5等性能数据后,根据业务需求确定各参数的权重W,并进行优先级P判断,根据各参数权重和优先级计算设备或系统的综合运算性能,根据其综合性能,确定设备或系统的运行状态等级,并进行设备报警或运维。当设备或系统不影响正常业务运行时,仅对其进行报警处理;当设备或系统影响正常运行时,进行报警并运维处理。
所述优先级P需要根据监控任务的紧急程度进行确定,监测任务可等待的时间的时间越短,优先级越高,计算方法为
式中,Tiwait为任务等待时间;Tileft为空余时间,Tirun为任务运行时间。
所述,综合运算性能计算方法为:
所述系统运维过程为:所有异常均以报警信息通过弹窗等方式推送给运维人员,由运维人员对对异常进行处理;所有运维数据均需按时存入数据库。
所述信息展示过程为:信息展示模块进行数据处理后,以图形化的方式向用户展示经过分类、汇总、整理后的结构化监测数据、报警信息和运维信息等,快速诊断密码系统运行状态和报警原因,对相关人员进行提醒并及时对报警进行处理。
从而,基于多层次多维度模型的密码服务动态监控系统,能够对密码服务系统及软硬件设备的运行状态进行动态监控,及时发现异常信息并告警,并采用可视化界面帮助运维人员诊断和解决告警信息,从而降低统一密服平台运维人员的工作量,提高运维工作效率,降低系统运维的复杂度。
可选地,所述数据采集模块用于采集系统日志、前置路由、数据库资源及运行状态、微服务状态、密码资源调用状态。
可选地,所述管理配置模块用于配置监控指标,根据业务需求新增监控任务、管理监控所述系统运维模块。
可选地,所述系统监控模块用于监控多种服务的运行状态和指标,通过监控服务,获取监控数据,通过收集系统的运行日记,经过清洗与分析,获取设备与服务的异常信息,基于所述监控数据生成报警信息或运维信息,所述异常信息包括告警时间、告警类型、告警级别、告警状态、告警模块以及告警信息。所述系统运维模块用于根据监控数据和报警数据,将异常信息发送给运维人员,由运维人员对对异常进行处理。
可选地,所述异常报警模块用于根据报警设备、报警登记、报警指标、报警阈值以及持续次数,设置报警规则,并根据所述报警规则判断是否要生成不同等级的报警数据,并将所述报警数据存入数据库,所述异常报警模块支持主动报警和异常日志报警相结合的多维度报警方式。
可选地,所述信息展示模块用于以图形化的方式向用户展示经过分类、汇总、整理后的结构化的监测数据、报警信息和运维信息,快速判断密码系统运行状态和报警原因,对相关人员进行提醒并及时对报警进行处理。
可选地,根据报警设备、报警登记、报警指标、报警阈值以及持续次数,设置报警规则,包括:确定报警指标Ini、报警阈值Vt、持续次数Ts的权重wi;根据报警指标Ini、报警阈值Vt、持续次数Ts以及权重wi,通过计算加权平均和的方式计算报警值Va:
当所述报警值Va大于等于设定的报警阈值Vt,且持续次数Ts大于预先设定的次数阈值T0时进行系统报警,并将报警信息存入数据库。
可选地,通过监控服务,获取监控数据,通过收集系统的运行日记,经过清洗与分析,获取设备与服务的异常信息包括:确定设备或系统的服务状态S1、接口状态S2、CPU利用率S3、内存利用率S4、连接利用率S5;根据业务需求确定服务状态S1的权重W1、接口状态S2的权重W2、CPU利用率S3的权重W3、内存利用率S4的权重W4、连接利用率S5的权重W5,进行优先级P判断,确定设备或系统的综合运算性能;根据所述综合运算性能,确定设备或系统的运行状态等级,进行设备报警或运维;当设备或系统不影响正常业务运行时,进行报警处理;当设备或系统影响正常运行时,进行报警并运维处理。
可选地,进行优先级P判断的计算方法为:
其中,Tiwait为任务等待时间;Tileft为空余时间,Tirun为任务运行时间。
可选地,确定设备或系统的综合运算性能,包括:
根据以下公式,确定设备或系统的综合运算性能:
其中,S为设备或系统的综合运算性能,f(p1)为服务状态的优先级,f(p2)为接口状态的优先级,f(p3)为CPU利用率S3的优先级,f(p4)为内存利用率S4的优先级,f(p5)为连接利用率S5的优先级。
从而,基于多层次多维度模型的密码服务动态监控系统,能够对密码服务系统及软硬件设备的运行状态进行动态监控,及时发现异常信息并告警,并采用可视化界面帮助运维人员诊断和解决告警信息,从而降低统一密服平台运维人员的工作量,提高运维工作效率,降低系统运维的复杂度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。