计及特征量信息表达差异的非侵入式负荷辨识方法及系统

文档序号:8624 发布日期:2021-09-17 浏览:20次 英文

计及特征量信息表达差异的非侵入式负荷辨识方法及系统

技术领域

本公开属于智能用电及能效监测

技术领域

,尤其涉及计及特征量信息表达差异的非侵入式负荷辨识方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的

背景技术

信息,不必然构成在先技术。

电力物联网已成为电力系统的战略发展目标之一,是高效利用各种手段实现电力信息采集、分析、管理和应用的关键技术。基于用户负荷端口处获取的高质量监测信息,可分析辨识用户电力设备的使用状态,即实现用户的非侵入式负荷监测,从而为用户管理自身用能及电费开支、电力公司加强负荷侧管理等提供强有力的支持。因此,非侵入式负荷辨识的研究广受关注,亟待深入推进。

非侵入式负荷辨识一般是建立在负荷类别已知,且负荷特征量确定的基础上,可归类于模式识别问题。神经网络和深度学习技术因具有自学习能力和联想存储能力,在非侵入式负荷辨识中有广泛的应用。文献“宋旭帆,周明,涂京,李庚银.基于k-NN结合核Fisher判别的非侵入式负荷监测方法[J].电力系统自动化,2018,42(06):73-80”利用KNN算法的简便性结合核Fisher分类的非线性判别能力来辨识特征相近的家用电器的种类,取得了较好的辨识效果。然而,在应用该方法分析电器存在叠加模式的问题时,对应特征量相差较大的电器设备可能存在的特征掩盖情况,虽然也属于特征相近的辨识问题但该方法效果不佳。事实上,居民家用电器大部分还是属于小功率设备,发生功率转换时变化相对较小,而大功率设备在发生工作状态的变化时存在较为明显的转移功率,这会导致时间轴上其他设备的特征局部或整体被掩盖,因此需要研究拓展辨识方法以增强其泛化性,即应充分提高辨识方法适应于多种场景的能力。

模糊聚类算法作为无监督学习方法,不用进行训练集的学习即可实现负荷辨识,这意味着模糊聚类算法相比于有监督学习方法对样本集的限制更少,即适用性更强。其中,应用最为广泛的模糊C均值聚类算法在非侵入式负荷辨识中已有较好的应用,但存在着聚类中心与模糊指数的主观性选择、易受噪声干扰等问题。为避免确定聚类中心时的主观随意性,可通过引入快速爬山函数法,使用K均值算法及粒度原理,融入聚类有效性函数等改进措施确定聚类中心,这些改进策略使得聚类中心的选择更为客观,而聚类中心作为辨识算法确定电器模式种类的主要依据,对最终的辨识效果有较大影响,因此相关研究主要通过优化算法的参数设置来增强其泛化性。文献“石亮缘,周任军,张武军,余虎,李彬,王珑.采用深度学习和多维模糊C均值聚类的负荷分类方法[J].电力系统及其自动化学报,2019,31(07):43-50”将常规欧式距离与计及趋势序列特征的改进动态时间弯曲距离结合成新的相似性距离,在原来算法的基础上突出了趋势特征的重要性,使得算法分类结果更合理,拓宽了算法的适用范围。上述研究在一定程度上改进了模糊C均值聚类算法,但在FCM算法欧式距离计算中对特征量进行等重要性处理会造成不利影响,没有从根源上考虑特征量信息表达差异对辨识的影响,难以满足负荷特征复杂多样情况下的辨识要求。

发明内容

为克服上述现有技术的不足,本公开提供了计及特征量信息表达差异的非侵入式负荷辨识方法,本发明在负荷辨识过程中充分考虑了特征量的信息表达能力可有效提高算法的泛化应用能力和辨识准确率。

为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:

第一方面,公开了计及特征量信息表达差异的非侵入式负荷辨识方法,包括:

利用非侵入式获取设备的用电数据并进行特征提取和特征筛选,形成最优特征子集;

基于熵权法原理求解最优特征子集对应的权重向量,同时对隶属度矩阵和聚类中心进行初始化处理;

在计算聚类算法的欧式距离时作特征加权处理,将权重向量以乘子的形式融入距离计算,形成样本点与聚类中心的加权距离矩阵;

依据特征加权改进得到的隶属度更新公式和聚类中心更新公式计算待识别样本的隶属度及聚类中心,多次迭代形成最优隶属度矩阵,输出待辨识样本的类别及工作状态。

进一步的技术方案,对获取设备的用电数据并进行特征提取和特征筛选时,首先对设备用电数据进行暂稳态特征提取,建立了初始特征集,于特征筛选方法对初始特征集进行特征优选,获得最优特征子集用于后续负荷辨识。

进一步的技术方案,从最优特征子集中计算其中的各类特征的熵值,基于各类特征的熵值计算得到表达特征重要性的权重系数,最终获得非侵入式负荷样本的各维特征值对应的权重系数,由权重系数构成权重向量。

第二方面,公开了计及特征量信息表达差异的非侵入式负荷辨识系统,包括:

最优特征子集获取模块,被配置为:利用非侵入式获取设备的用电数据并进行特征提取和特征筛选,形成最优特征子集;

权重向量获取模块,被配置为:基于熵权法原理求解最优特征子集对应的权重向量,同时对隶属度矩阵和聚类中心进行初始化处理;

加权距离矩阵模块,被配置为:在计算聚类算法的欧式距离时作特征加权处理,将权重向量以乘子的形式融入距离计算,形成样本点与聚类中心的加权距离矩阵;

识别模块,被配置为:依据特征加权改进得到的隶属度更新公式和聚类中心更新公式计算待识别样本的隶属度及聚类中心,多次迭代形成最优隶属度矩阵,输出待辨识样本的类别及工作状态。

以上一个或多个技术方案存在以下有益效果:

基于对于居民用户非侵入式负荷辨识的研究,现有方法在泛化性和准确度上还有待提升,针对各电气特征量在表达不同设备用电特性上的差异性,本发明在考虑特征差异化表达的前提下以熵权法配置更贴近特征量实际重要性分布的权重系数,将特征权重引入辨识算法的目标函数中,优化改进得到计及特征加权的样本点与聚类中心的距离加权修正矩阵,能够实现特征与辨识算法的紧密结合,可有效增强算法的泛化应用能力和辨识准确率。

基于特征量在负荷辨识过程中并不是处于同等地位,这是由不同特征量所携带用电信息的差异性决定的。本发明利用熵权法配置特征量的权重系数可以客观衡量特征量在辨识应用中的差异化地位,进一步地,提出一种基于距离改进的模糊C均值聚类非侵入式负荷辨识算法,构建考虑特征加权修正的距离度量矩阵,实现了辨识算法中隶属度矩阵和聚类中心的修正,与特征量信息表达能力的密切结合,使得算法具备较强的泛化应用能力和更高的辨识准确度,本发明提出的特征加权改进策略在实际数据的验证中被证明是可行的,且具备创新性。

本申请利用熵权法完成特征重要性评估,求取各特征的权重系数,并以此体现负荷特征对用电信息的差异化表达;将特征权重引入辨识算法的目标函数中,优化改进得到计及特征加权的样本点与聚类中心的距离加权修正矩阵;这样的做法考虑了各类特征表征原始用电信息的差异性对样本类中心距离的影响,克服了实际辨识中所存在特征掩盖的问题。

本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1为本公开实施例居民用户非侵入式负荷辨识应用流程图;

图2为本公开实施例场景1非侵入式负荷辨识结果;

图3为本公开实施例场景2非侵入式负荷辨识结果;

图4为本公开实施例场景3非侵入式负荷辨识结果;

图5标准FCM算法与本发明所提方法的负荷辨识正确率结果对比。

具体实施方式

应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例一

本实施例公开了计及特征量信息表达差异的非侵入式负荷辨识方法,利用特征量信息表达差异的非侵入式负荷辨识模糊C均值聚类,通过分析揭示以等特征重要性的欧氏距离为相似性判据的局限性,提出以熵权法配置特征的权重系数,并构建考虑特征加权修正的距离度量矩阵,实现了辨识算法中隶属度矩阵和聚类中心的修正与特征量信息表达能力的密切结合。同时,针对不同电器模式混合后的多种情况,设置了3种实例应用场景进行验证。本发明在负荷辨识过程中充分考虑了特征量的信息表达能力可有效提高算法的泛化应用能力和辨识准确率。

本公开实施例子具体包括以下步骤:

(1)对设备用电数据进行特征提取和特征筛选,形成最优特征子集;

(2)基于熵权法原理求解最优特征子集对应的权重向量W,同时对隶属度矩阵和聚类中心进行初始化处理;

(3)在计算模糊C均值聚类算法的欧式距离时作特征加权处理,将权重向量W以乘子的形式融入距离计算,形成样本点与聚类中心的加权距离矩阵;

(4)依据特征加权改进得到的隶属度更新公式和聚类中心更新公式计算待识别样本的隶属度及聚类中心,多次迭代形成最优隶属度矩阵,输出待辨识样本的类别及工作状态;

在该实施例子中,通过辨识算法可获取待辨识样本的最优隶属度矩阵,依据矩阵中最大的隶属度值,可找到所对应的电器种类及工作状态。

(5)构建3种实例应用场景,验证本发明所提方法的辨识效果。整个过程原理:

步骤(1)对设备用电数据进行暂稳态特征提取,其中稳态特征提取了14种,暂态特征提取了6种,由此建立了初始特征集,一共包含20种特征量,暂稳态特征作为负荷辨识算法的输入量,进一步地,基于特征筛选方法对初始特征集进行特征优选,从20种特征量中选择6种形成最优特征子集用于后续负荷辨识。

上述用电数据包括电流,电压,功率,功率因数,周波电流,周波电压,谐波电流,谐波电压。

特征量选择是否恰当决定着非侵入式负荷辨识效果的优劣,为在特征选择中排除冗余提高相关性,所以对初始特征集进行优选,形成最优特征子集,最终用于提高负荷辨识的准确率。

步骤(2)中的熵权是在一组特定的评估对象之后确定各种评估指标的值。从价值的角度看,熵权表示各指标针对特定问题时提供的有用信息的量的大小。相比于主观的权值获取方法,采用熵权法配置的权值更贴近实际的重要性分布情况,所得结果更为客观、科学,具备更好的可解释性和更高的精度,并且熵权法的应用场景非常广泛,适用于绝大多数需要确定权重的问题,因此本发明选择引入熵权法来实现特征重要性评估。将其应用于非侵入式负荷领域,特征表达样本原始用电信息的差异越大,则计算得到的熵值越小,表示该类特征能提供更多有用的信息量,作为分类问题的评价指标时更为重要,即该类特征的权重系数就越大。

运用熵权法配置衡量特征表达重要性程度的各类特征的权重系数首先要计算各类特征的熵值如式(1)所示:

式(1)中,针对样本的f维特征,在表达C类样本类别用电信息的问题中,ei表示第i类特征的熵值,i=1,2,…,f,rij代表实际量测数据,具体为第j类样本的第i维特征量,pij表示第i类特征表达第j类样本的有用信息占总用电信息的比重。

其次,根据式(3)计算各类特征的熵权并由此得到表达特征重要性的权重系数:

由此在给出非侵入式负荷样本的各维特征值后依次根据式(1)至式(3)可以求出特征量对应的权重向量W=[ω12,…ωf]。

步骤(2)通过设置零向量对负荷辨识算法的隶属度矩阵和聚类中心进行初始化处理。

步骤(3)在标准模糊C均值聚类算法的基础上作特征加权改进,实现了负荷辨识与特征量信息表达能力的密切结合。其中,模糊C均值聚类算法是一种基于目标函数寻优从而找出对事物的最佳分析方案的聚类算法,常用于模式识别领域,主要通过待辨识样本的模糊隶属关系来确定样本所属类别。其目标函数如式(4)所示:

依据用电数据提取的特征量是该目标函数dij,展开式中的xi,权重向量是在后续对dij进行修正时代入的量。

式中,设X={x1,x2,…,xN}为样本集合,每一个xi都可以依据熵权法求得对应的一个权重系数ω(k),N为样本个数,总样本共分为C类,又被称为聚类中心数,m是一个模糊化程度的参数,又被称为隶属度的加权指数,一般在计算时设定为m=2,xi=[xi1,xi2,…,xit]是样本集中第i个样本,t表示特征类别的数目,cj=[cj1,cj2,…,cjt]表示第j个聚类中心,uij表示第i个样本属于第j类的隶属度,令hij=xi-cj,则dij=||hij||=||xi-cj||代表样本xi到聚类中心cj的欧式距离。

该目标函数的约束条件要满足针对单个样本,它对于每个聚类中心的隶属度之和为1,即uij∈[0,1],1≤i≤N,1≤j≤C。

结合隶属度约束条件,在式(4)中引入拉格朗日乘子λ,构建拉格朗日函数,并对其求偏导,使偏导值为0,可推导得到隶属度更新公式(5)以及聚类中心更新公式(6):

在运用模糊C均值聚类算法进行求解时,实际上就是不断根据式(5)和式(6)迭代计算隶属度和聚类中心的过程,当最终结果满足迭代终止条件或者达到迭代次数,即其中l是迭代次数,ε是误差阈值,显然,当完成迭代后,按照公式(5)计算的隶属度即为最优隶属度矩阵,找到样本在隶属度矩阵中的对应的最优隶属度向量即可实现负荷辨识。

模糊C均值聚类算法中所涉及的隶属度作为模糊理论中一个非常重要的概念,体现了将负荷分类判断的绝对化(非0即1)变为模糊化认识的转变过程,针对待识别的样本,隶属度表现为该样本属于每个聚类类别的程度,依据隶属度矩阵中最大的隶属度值,可找到所对应的电器种类及工作状态。假设提供一个样本集样本类别的数量为C,经聚类识别后,样本集被分解为每个类别下的子集X1,X2,…,这些子集之间的关联关系如式(7)所示:

当输入一个待识别的样本xj,xj表示样本集中第j个样本,由于隶属度是一种度量样本元素与样本类别之间相似度的物理量,在实际计算中由隶属函数求得:

式(8)表示待识别样本xj属于第i类样本子集Xi的隶属度函数,uij是一个标量,取值在[0,1]之间,由此根据样本xj的隶属度uij在[0,1]中的偏移程度即可判断出xj所属类别,并且在计算时要满足所有待识别样本的隶属度值之和为1。单个样本经隶属函数计算得到一个隶属度值,当待识别样本是集合的形式时,即X′={x1,x2,…xj…,xg},g表示待识别样本的个数,由上式计算可得隶属度矩阵。

步骤(3)中特征加权改进策略的具体细节为:

标准模糊C均值聚类算法通常是计算各样本点到每个聚类中心之间的距离,并以此作为样本点的归类依据,并且在目标函数的优化过程中,认为不同负荷特征影响聚类损失的程度仅与特征量大小有关,即不同特征的权重值相等,忽视了特征类别的影响;然而不同特征在负荷辨识中表现的重要性不同,因此为了凸显不同特征对辨识效果的影响,本发明利用各类特征量的权重系数对标准FCM算法的距离度量矩阵进行修正,在计算欧式距离时作特征加权处理即将dij改进为d′ij,形成样本点与聚类中心的加权距离矩阵。

结合特征权重的欧式距离本质上是对hij中各元素的改进,针对相同的样本x,由于样本内部元素的差异性(特征的种类)导致组成输入矩阵的各元素值发生改变,即hij=xi-cj改进为hij={ω(k)(xik-cjk),k=1,2,…t},ω(k)为式(3)中计算得到的各类特征的权重系数,则dij=||hij||改进为d′ij=||h′ij||,具体变换如下:

hij=[xi1-cj1,xi2-cj2,…,xit-cjt] (9)

则样本xi到聚类中心cj的欧式距离dij计算如式(10)所示:

标准距离度量矩阵d如式(11)所示:

d=[d1,d2,…di…dN] (11)

式(11)中,di表示第i个样本点距离其归属聚类中心(距离最近的聚类中心)的欧式距离,di=min[di1,di2,…,dij,…,diC],其中dij的计算如式(10)所示,经加权修正后变为式(12):

将式(12)回代至式(11)中从而将标准距离度量矩阵d改进为加权距离矩阵d′,由此导致后续推导中的隶属度更新公式改变,从聚类中心更新公式(6)中可以看到公式中不含dij,并且在算法辨识过程中,样本分类数是给定的,负荷种类不会发生改变,因此本次计及特征权重的改进并不会影响聚类中心的计算。

步骤(3)考虑各类特征表征原始用电信息的差异性对样本类中心距离的影响对标准FCM算法进行改进,克服了隶属度难以反映待识别样本所属类别的问题,增强了负荷辨识的可解释性。从距离度量矩阵变换过程可以看出,特征权重系数的引入是对隶属度更新公式作了精细化调整,在一定程度上能够提高聚类的质量。

步骤(4)的计算流程为:

基于距离改进模糊C均值聚类的居民用户非侵入式负荷辨识应用的具体流程如图1所示。

(1)对于量测的原始用电数据,经数据预处理后,利用最小生成树原理对其进行暂稳态区间的划分,并采用特征提取和特征选择方法进行最优特征子集的获取;

(2)结合熵权法原理和轮廓系数的评估,获得特征集对应的权重向量W,同时对隶属度矩阵和聚类中心进行初始化处理;

(3)依据特征加权改进得到的隶属度更新公式和聚类中心更新公式计算待识别样本的隶属度及聚类中心;

(4)进行迭代条件判断,若其中l是迭代次数,ε是误差阈值,或者迭代次数大于设定值,则转入下一步,否则返回步骤(3)继续进行隶属度与聚类中心的更新;

(5)依据迭代完成得到的最优隶属度矩阵输出待辨识样本的类别与状态,并计算得到最终辨识正确率,其中,依据最优隶属度矩阵中最大的隶属度值,可找到所对应的电器种类及工作状态。

步骤(5)的验证数据来源于某公司举办的竞赛数据源,数据采样频率为6400Hz,所测家用电器一共有11种,分别为电风扇(YD1)、微波炉(YD2)、热水壶(YD3)、电脑(YD4)、白炽灯(YD5)、节能灯(YD6)、打印机(YD7)、饮水机(YD8)、挂式空调(YD9)、吹风机(YD10)、电视机(YD11)。构建了3种实例应用场景具体为:

场景1:若干个有限多状态设备混合的负荷辨识场景(有限多状态设备具有多种功率运行模式,功率电平呈阶梯型变化)

场景2:若干个启停二状态设备混合的负荷辨识场景(启停二状态设备只有关闭和启动两种功率运行模式)

场景3:全模式设备(启停二状态设备+有限多状态设备+连续变状态设备)混合的负荷辨识场景(连续变状态设备具有连续可变化的功率运行模式,功率电平变化非常剧烈)

按照所述步骤(1)-(5)对采样数据进行辨识,具体结果如图2-图4所示。

从3种场景的辨识结果可以看到,本发明所提方法在多种应用情景下都具备较好的辨识效果,针对总用电数据的辨识分析,能够有效获取各设备的分时用电详情,算法泛化应用能力强。

对场景3作准确率对比验证分析,辨识准确率结果如图5所示。标准模糊C均值聚类算法缺少对特征之间联系的基本判断,本发明所提方法将计及特征权重的欧式距离作为划分不同聚类中心周围样本点的依据在一定程度上克服了这一缺陷,使得样本的分类效果更好,负荷辨识准确率有显著提高。

本申请利用熵权法完成特征重要性评估,求取各特征的权重系数,并以此体现负荷特征对用电信息的差异化表达;将特征权重引入辨识算法的目标函数中,优化改进得到计及特征加权的样本点与聚类中心的距离加权修正矩阵。

实施例二

本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。

实施例三

本实施例的目的是提供一种计算机可读存储介质。

一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述方法的步骤。

实施例四

本实施例的目的是提供计及特征量信息表达差异的非侵入式负荷辨识系统,包括:

最优特征子集获取模块,被配置为:利用非侵入式获取设备的用电数据并进行特征提取和特征筛选,形成最优特征子集;

权重向量获取模块,被配置为:基于熵权法原理求解最优特征子集对应的权重向量,同时对隶属度矩阵和聚类中心进行初始化处理;

加权距离矩阵模块,被配置为:在计算聚类算法的欧式距离时作特征加权处理,将权重向量以乘子的形式融入距离计算,形成样本点与聚类中心的加权距离矩阵;

识别模块,被配置为:依据特征加权改进得到的隶属度更新公式和聚类中心更新公式计算待识别样本的隶属度及聚类中心,多次迭代形成最优隶属度矩阵,输出待辨识样本的类别及工作状态。

以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。

本领域技术人员应该明白,上述本公开的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本公开不限制于任何特定的硬件和软件的结合。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:非合作目标柔性附着多节点融合估计方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!