一种基于数据挖掘的建筑能耗集成分析方法
技术领域
本发明涉及建筑节能
技术领域
,具体涉及一种基于数据挖掘的建筑能耗集成分析方法。背景技术
根据近年来的数据统计,在我国社会终端能耗的构成中,建筑能耗占地区城镇总能耗的33%以上,因此为了实现节约型社会的目标,降低建筑能耗十分重要,因此需要对建筑能耗的情况进行分析。在建筑能耗数据分析领域,为了从建筑能耗历史数据中挖掘出更全面的信息,集成化的建筑能耗分析方法逐渐兴起,常见的方法是通过分类、离群点分析、关联分析,以及预测等系列步骤进行建筑能耗分析;通过对建筑能耗的分析预测,可以在实施降低建筑能耗的方案时作为参考。
在现有技术中,CN102289585A公开了一种基于数据挖掘的公共建筑能耗实时监测方法,包括以下步骤:S1:建立建筑能耗模式判定树;S2:实时采集建筑能耗数据;S3:判别当前建筑能耗数据是否为能耗异常点,将当前建筑能耗数据与所属建筑能耗模式判定树进行模式匹配,判断当前建筑能耗数据是否为离群点。上述技术方案采用通过对历史能耗数据进行聚类分析识别建筑物特有的能耗模式,对数据分类后获得建筑能耗模式判定树,在建筑能耗实时监测过程中对动态采集的能耗数据进行模式匹配,与相同模式历史数据进行离群点分析,可判别当前建筑能耗数据是否异常。
但是,上述技术方案在对建筑能耗进行分析时,仅仅是对当前建筑能耗数据是否异常进行了分析,不能对建筑能耗进行预测,无法满足对建筑能耗进行全面分析预测的实际需求。
发明内容
针对现有技术存在的不足,本发明提出一种基于数据挖掘的建筑能耗集成分析方法,以解决现有技术中存在的对建筑能耗进行分析时,仅仅是对当前建筑能耗数据是否异常进行了分析,不能对建筑能耗进行预测,无法对建筑能耗进行全面分析预测的技术问题。
本发明采用的技术方案是,一种基于数据挖掘的建筑能耗集成分析方法,,包括以下步骤:
S1、采用高斯混合模型对建筑能耗模式进行识别;
S2、根据建筑能耗模式,采用决策树算法对建筑能耗历史数据进行分类;
S3、采用基于密度的局部离群点检测算法对分类后的建筑能耗历史数据进行离群点分析,识别出建筑能耗异常数据;
S4、将建筑能耗异常数据从建筑能耗历史数据中删除,得到建筑能耗正常数据;
S5、根据建筑能耗正常数据,采用灰度关联分析算法找出建筑能耗影响因素;
S6、根据建筑能耗正常数据和建筑能耗影响因素,使用共轭梯度法对人工神经网络进行训练,得到建筑能耗集成分析预测模型;
S7、根据实时建筑能耗数据,使用建筑能耗集成分析预测模型对未来的建筑能耗情况进行预测。
进一步的,采用高斯混合模型对建筑能耗模式进行识别,包括:
S1-1、设置类别数值,随机初始化每个单一高斯分布的期望和方差以及单一高斯分布在整体分布中所占的权重;
S1-2、计算每个建筑能耗历史数据属于每个高斯分布的概率;
S1-3、根据权重值和步骤S1-2中计算出的概率,计算一个总值,计算的目标是使总值最大;
S1-4、重复步骤S1-2、S1-3,直到总值的变化幅度小于或等于幅度阈值为止。
进一步的,决策树算法为C4.5决策树算法。
进一步的,对分类后的建筑能耗历史数据进行离群点分析,包括:
S3-1、输入邻域中数据点的最小数目;
S3-2、对建筑能耗历史数据中的每个数据点P进行邻域查找;
S3-3、计算数据点P的局部可达密度;
S3-4、根据局部可达密度计算数据点P的局部离群点因子;
S3-5、将局部离群点因子大于数据异常阈值的数据点判定为离群点。
进一步的,人工神经网络为前馈神经网络。
进一步的,建筑能耗影响因素包括:湿球温度,干球温度,湿度,风速,是否为节假日、非节假日的工作状态。
进一步的,建筑能耗集成分析预测模型的构建方法,包括:
S6-1、构建训练集和测试集;
S6-2、设置前馈神经网络的超参数,隐藏层的节点数为9;
S6-3、使用训练集,将湿球温度、干球温度、湿度、风速、工作状态作为输入,将建筑能耗正常数据作为输出,使用共轭梯度法对前馈神经网络进行训练;
S6-4、使用测试集对训练后的前馈神经网络进行测试,优化前馈神经网络的超参数,得到建筑能耗集成分析预测模型。
第二方面,提供了一种基于数据挖掘的建筑能耗集成分析系统,包括建筑能耗数据采集模块、建筑能耗集成分析预测模块;
建筑能耗数据采集模块用于采集建筑能耗历史数据和建筑能耗实时数据;
建筑能耗集成分析预测模块使用第一方面提供的建筑能耗集成分析预测模型对未来的建筑能耗进行预测。
第三方面,提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现第一方面提供的基于数据挖掘的建筑能耗集成分析方法。
第四方面,提供了一种存储有计算机程序的计算机可读存储介质,计算机程序被处理器执行时实现第一方面提供的基于数据挖掘的建筑能耗集成分析方法。
由上述技术方案可知,本发明的有益技术效果如下:
1、采用高斯混合模型对建筑能耗模式进行识别,可以克服其它聚类算法单纯以距离的方式对建筑能耗数据进行分类的缺陷,更贴近于实际情况。
2、利用共轭梯度法进行前馈神经网络参数进行训练时,只需要对函数进行一阶求导,而不需要进行函数二阶求导以及求矩阵的逆的运算。这样既避免了只参考函数的梯度造成的收敛速度慢的缺点,又避免了进行复杂的运算而消耗过多的存储和计算资源。
3、可以通过使用前馈神经网络对建筑能耗进行较为准确的预测,实现对建筑能耗进行全面分析预测的效果。
附图说明
为了更清楚地说明本发明
具体实施方式
或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明实施例1的建筑能耗集成分析方法流程图;
图2为本发明实施例1的建筑能耗集成分析预测模型构建流程示意图;
图3为本发明实施例1的前馈神经网络结构示意图;
图4为本发明实施例1的建筑能耗预测值和真实值的对比效果图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例1
本实施例提供了一种基于数据挖掘的建筑能耗集成分析方法,使用建筑能耗集成分析预测模型对未来的建筑能耗情况进行预测,具体如下:
S1、采用高斯混合模型对建筑能耗模式进行识别
建筑能耗数据由于和人类的生产生活密切相关,因此能耗数据的分布符合高斯分布。高斯混合模型就是识别一个事物中符合的多个高斯分布模型,以加权的方式显示所有数据的分布规律。相比于聚类算法,如DBSCAN聚类算法、K-medoids聚类算法,高斯混合模型更贴近于实际情况,而不仅仅是单纯以距离的方式对建筑能耗数据进行分类。
在具体的实施方式中,采用高斯混合模型对建筑能耗模式进行识别时,按以下方式进行:
S1-1、设置类别数值,随机初始化每个单一高斯分布的期望和方差以及单一高斯分布在整体分布中所占的权重。
由于建筑在不同的日期能耗差异比较大,比如工作场地类建筑在工作日能耗较大,休息日能耗较小;而住宅类建筑在工作日能耗较小,休息日能耗较大;因此,在具体的实施方式中,将建筑能耗的类别模式分为2类,一类为节假日模式,另一类为非节假日模式。
S1-2、计算每个建筑能耗历史数据属于每个高斯分布的概率,以该点是否靠近某个高斯分布的中心作为衡量的标准。
S1-3、根据权重值和步骤S1-2中计算出的概率计算一个总值,计算的目标是使总值最大。
S1-4、重复步骤S1-2、S1-3,直到总值的变化幅度小于或等于幅度阈值为止。在具体的实施方式中,为减少运算,总值不再产生大的变化即可,比如变化幅度小于10%。
通过对建筑能耗模式进行识别,可以将建筑能耗历史数据进行分类,可以使后续的数据处理结果更准确,效率更高。
S2、根据建筑能耗模式,采用决策树算法对建筑能耗历史数据进行分类
决策树算法能够在较短时间对大型数据源做出可行的分类,高效且准确。在具体的实施方式中,根据建筑能耗的数据特点,采用C4.5决策树算法可以快速有效的对建筑能耗历史数据进行分类。C4.5决策树算法使用信息增益率来选择属性,通过信息增益率可以为决策树确定最佳分组变量和分割点。
S3、采用基于密度的局部离群点检测算法对分类后的建筑能耗历史数据进行离群点分析,识别出建筑能耗异常数据
局部离群点检测算法通过对象P的异常因子来表示对象P的异常程度,异常因子越大,异常的可能性就越大。在具体的实施方式中,对分类后的建筑能耗历史数据进行离群点分析,方法如下:
S3-1、输入邻域中数据点的最小数目;
S3-2、对建筑能耗历史数据中的每个数据点P进行邻域查找;
S3-3、计算数据点P的局部可达密度;
S3-4、根据局部可达密度计算数据点P的局部离群点因子;
S3-5、将局部离群点因子大于数据异常阈值的数据点判定为离群点;
通过本步骤的方法,将离群点对应的数据定义为建筑能耗异常数据。
S4、将建筑能耗异常数据从建筑能耗历史数据中删除,得到建筑能耗正常数据
在具体的实施方式中,为使后续的数据分析结果更加准确,需要将建筑能耗异常数据从建筑能耗历史数据中删除,使用建筑能耗正常数据进行后续的数据分析。
S5、根据建筑能耗正常数据,采用灰度关联分析算法找出建筑能耗影响因素
灰度关联分析算法可以减少信息不对称带来的损失,对样本数据要求较低,计算速度快。在进行灰度关联分析时,如果母因素与子因素变化的趋势,其同步变化程度较高,即二者的关联程度较高。计算母因素与子因素的关联程度,值越大说明子因素对母因素的影响越大。
在具体的实施方式中,影响建筑能耗的因素主要包括外部气候条件、工作状态。外部气候条件包括温度、湿度、风速等等。工作状态按步骤S1对建筑能耗模式的识别,可分为节假日模式、非节假日模式。
根据建筑能耗正常数据,选择与之同一时期的外部气候条件数据,采用灰度关联分析算法计算外部气候条件与建筑能耗的关联度,选取建筑能耗正常数据为母因素,外部气候条件为子因素,通过计算得到外部气候条件中的湿球温度、干球温度、湿度、风速上述4种因素与建筑能耗的关联度在0.6以上,说明这4种因素对建筑能耗的影响比较大。需要说明的是,湿球温度、干球温度比起当天最高气温、当天最低气温,与建筑能耗的关联度更高。
通过本步骤的方法,确定湿球温度、干球温度、湿度、风速,以及是否为节假日、非节假日的工作状态,上述5种因素作为建筑能耗影响因素。
S6、根据建筑能耗正常数据和建筑能耗影响因素,使用共轭梯度法对人工神经网络进行训练,得到建筑能耗集成分析预测模型
在本实施中,人工神经网络选用基于共轭梯度法的前馈神经网络。利用共轭梯度法进行求解神经网络参数的过程中,只需要对函数进行一阶求导,而不需要进行函数二阶求导以及求矩阵的逆的运算。这样既避免了只参考函数的梯度造成的收敛速度慢的缺点,又避免了进行复杂的运算而消耗过多的存储和计算资源。除上述特点外,共轭梯度法还具有不易受其他因素影响,步收敛性高以及不需要进行初始值的设置等优势。建筑能耗集成分析预测模型的构建方法,如图2所示,具体如下:
S6-1、构建训练集和测试集
在具体的实施方式中,使用建筑能耗正常数据、外部气候条件数据、工作状态数据构建训练集和测试集时,训练集和测试集的比例优选为3:1。
S6-2、设置前馈神经网络的超参数
在具体的实施方式中,将隐藏层的节点数目设置为9时,整体网络的产生的误差都较小。根据输入层和隐藏层节点的数目,进行权值的初始化。前馈神经网络的结构图如图3所示。
S6-3、使用训练集,将湿球温度、干球温度、湿度、风速、工作状态作为输入,将建筑能耗正常数据作为输出,使用共轭梯度法对前馈神经网络进行训练
训练的激活函数采用Sigmoid函数,采用均方方差MSE作为损失函数,并增加正则项作为附加评价标准,防止训练过程中的过拟合。具体的,取一个学习样本,正向传入输入层;将样本进行归一化,区间缩放至[0.1,0.9]区间内;聚类分类添加工作状态(即能耗模式分类);计算各层神经元的输入和输出;计算输出误差;使用共轭梯度法对前馈神经神经网络进行训练,反向调节网络中的权值和阈值;多次迭代,直到训练完成。
S6-4、使用测试集对训练后的前馈神经网络进行测试,优化前馈神经网络的超参数,得到建筑能耗集成分析预测模型。
为验证模型的预测效果,在使用测试集对训练后的前馈神经网络进行测试时,其预测值和真实值的对比效果,如图4所示,其预测的准确率在90%以上。
通过本步骤的方法,可以得到建筑能耗集成分析预测模型。
S7、根据实时建筑能耗数据,使用建筑能耗集成分析预测模型对未来的建筑能耗情况进行预测
获取一段时期内的实时建筑能耗数据,比如一周,将这一周的实时建筑能耗数据输入到建筑能耗集成分析预测模型中,对未来一段时期的建筑能耗情况进行预测,模型的输出即为未来建筑能耗的预测结果。
通过本实施例的技术方案,可以通过使用前馈神经网络对建筑能耗进行较为准确的预测,实现对建筑能耗进行全面分析预测的效果。
实施例2
提供了一种基于数据挖掘的建筑能耗集成分析系统,包括建筑能耗数据采集模块、建筑能耗集成分析预测模块;
建筑能耗数据采集模块用于采集建筑能耗历史数据和建筑能耗实时数据;
建筑能耗集成分析预测模块使用实施例1提供的建筑能耗集成分析预测模型对未来的建筑能耗进行预测。
实施例3
提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现实施例1提供的基于数据挖掘的建筑能耗集成分析方法。
实施例4
提供了一种存储有计算机程序的计算机可读存储介质,计算机程序被处理器执行时实现实施例1提供的基于数据挖掘的建筑能耗集成分析方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:图书聚类方法、装置、设备和存储介质