基于线性回归的电表失准检测方法、装置及电子设备

文档序号:6560 发布日期:2021-09-17 浏览:28次 英文

基于线性回归的电表失准检测方法、装置及电子设备

技术领域

本发明涉及电表检测

技术领域

,具体涉及一种基于线性回归的电表失准检测方法、装置及电子设备。

背景技术

由于现在国家电网全面推进电表智能化改造,已有数以亿级的电表部署到全国各地。所谓的电表失准,就是电表所计量的用户实际用电量和电表所计量的电量,两者存在明显不一致。当用户实际用电量大于电表所计量的电量,这就是电表少计,这会损害供电公司经营收入;造成电表少计的原因,通常有电表故障或者是人为窃电;另一方面,如果用户实际用电量小于电表所计量的电量,这就是电表多计,这会损坏用户的消费权益,造成电表多计原因,通常都是电表故障。因此电表失准检测,对于降低电表轮换成本以及维护用电市场秩序具有重要意义。

针对电表失准检测,传统的检测方法可参照专利申请号202011332014.5,《一种依托大数据实时评价电表运行状态与更换的方法》,以台区关口总用电量作为因变量,台区下面各个电表的用电量作为自变量,构建多元线性回归模型,根据回归系数来判定电表是否存在失准。但传统的基于多元线性回归构建电表失准模型,通常存在以下问题:

1)传统的多元线性回归模型,通常要求方程数大于或等于变量数,对于电表失准模型而言,也就是要求采集用电量天数要≥台区下面的用户总数,但现有台区中可能存在有些台区下面的用户总数可以达到两百或三百,甚至更多,这样,传统的电表失准模型会需要采集电量的天数多达两百或三百天,甚至更多天,才能够满足模型可解的条件,如果采集用电量天数要<台区下面的用户总数,那么方程数小于变量数,则传统的多元线性回归模型不可解,不能实现对电表失准状态的检测。

2)传统的多元线性回归模型通常要求台区拓扑关系准确,也就是电表和台区之间的对应关系要求准确,但是要保持电表和台区之间的对应关系准确,需要采集天数尽可能少,如果采集天数过少,很有可能会出现采集天数小于台区下面的电表总数,从而导致线性回归模型不可解,因此,传统的多元线性回归模型如果要保证线性回归模型可解,就需要扩大采集天数,通常设置的天数为300天,但扩大采集天数就可能无法保证在采集的这段时间内电表和台区之间的对应关系不发生变更,即扩大采集天数时在采集的这段时间内电表和台区之间的对应关系可能会发生变更,从而不能满足电表和台区之间的对应关系准确的要求,降低了对电表失准状态检测的准确率。

发明内容

鉴于以上技术问题,本发明的目的在于提供一种基于线性回归的电表失准检测方法、装置及电子设备,解决传统的基于多元线性回归构建电表失准模型通常在采集用电量天数小于台区下面的用户总数时不能实现对电表失准状态的检测,或可以实现对电表失准状态的检测时要求采集用电量天数通常比较长,导致不能满足电表和台区之间的对应关系准确的问题。

本发明采用以下技术方案:

基于线性回归的电表失准检测方法,包括以下步骤:

对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据;

将满足预设条件的用户电表用电量数据作为候选自变量集合,根据所述候选自变量集合构建二次规划模型,所述二次规划模型满足以下公式:

其中,y为台区电量总线损;为候选自变量集合;为候选自变量集合中各用户电表用电量数据对应的回归系数集合;

对所述二次规划模型进行回归系数的求解,得到回归系数集合;

根据求解出的回归系数集合,判定各用户电表失准状态。

可选的,所述候选自变量集合以及回归系数集合分别满足以下公式:

其中,为满足预设条件的用户电表用电量数据;为回归系数集合;为第n天台区下第ik块电表日用电量;为第ik块电表计量用电量的回归系数;ik为候选自变量集合中用户电表编号。

可选的,所述根据求解出的回归系数,判定各用户电表失准状态,包括:

为正时,判定用户电表出现少计量,且用户电表失准程度与绝对值成正比;

为负时,判定用户电表出现多计量,且用户电表失准程度与绝对值成正比。

可选的,所述对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据,包括:

构造台区总线损和用户电表日用电量的增广矩阵A;

生成增广矩阵A的样本协方差矩阵C,所述样本协方差矩阵C用于表示台区总线损和用户电表计量电量之间的线性相关性;

获取样本协方差矩阵C的逆矩阵IC,所述逆矩阵IC用于表示台区总线损和用户电表计量电量之间的线性偏相关性;

获取逆矩阵IC的对角向量d,所述对角向量用于表示台区总线损和用户电表计量电量的方差;

根据所述逆矩阵IC和逆矩阵IC的对角向量d,得到用于表示台区总线损和台区下各个电表用电量之间的偏相关系数向量pc;

获取偏相关性阈值s,若台区下某电表用电量偏相关系数向量pc大于或等于偏相关性阈值s,则判定该电表的用电量数据为满足预设条件的用户电表用电量数据。

可选的,获取样本协方差矩阵C的逆矩阵IC包括:

在台区下电表个数≥采集电量天数时,通过增加对角矩阵的方式将样本协方差矩阵C转成可逆矩阵,获取转成的可逆矩阵的逆矩阵IC;

在台区下电表个数<采集电量天数时,所述样本协方差矩阵C为可逆矩阵,生成样本协方差矩阵C的逆矩阵IC。

可选的,所述获取偏相关性阈值s步骤包括:

获取在置信度为0.95下,台区总线损和用户电表计量电量的偏相关性阈值s。

可选的,所述对台区下所有用户电表用电量数据进行广义偏相关性分析步骤之前还包括:

对台区下所有用户电表用电量数据进行预处理;所述预处理包括以下的一种或多种:去除因日用电量采集失败因素引起的台区总线损偏高的用电量数据;获取台区总线损的时序数据检测异常点,去除检测异常点对应的日用电量数据。

一种基于线性回归的电表失准检测装置,包括:

分析单元,用于对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据;

二次规划模型构建单元,用于将满足预设条件的用户电表用电量数据作为候选自变量集合;根据所述候选自变量集合构建二次规划模型,所述二次规划模型满足以下公式:其中,y为台区电量总线损;为候选自变量集合;为候选自变量集合中各用户电表用电量数据对应的回归系数集合;

计算单元,用于对所述二次规划模型进行回归系数的求解,得到回归系数集合;

判定单元,用于根据求解出的回归系数集合,判定各用户电表失准状态。

一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于线性回归的电表失准检测方法。

一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现所述的基于线性回归的电表失准检测方法。

相比现有技术,本发明的有益效果在于:

本发明通过先进行广义偏相关性分析,再构建一个改进的线性回归模型,即带约束的二次规划模型进行求解,根据求解出的回归系数判断电表失准状态,不要求采集用电量天数≥台区下面的电表总数,可实现在台区下电表总数大于采集用电量天数时的电表失准检测,例如台区下电量表总数多达两百,甚至更多的情况下,但采集用电量天数较短情况下,比如90天,也可以有效的进行电表失准判定,实现对电表失准的检测。同时,由于本发明可在采集用电量天数较短情况下检测电表失准状态,可以减低电表和台区之间的对应关系出现变更的可能,能满足电表和台区之间对应关系准确的要求,从而提高失准检测的准确率。

附图说明

图1为本发明一实施例提供的一种基于线性回归的电表失准检测方法流程示意图;

图2为本发明一实施例提供的一种基于线性回归的电表失准检测装置的示意图;

图3为本发明一实施例提供的一种电子设备的结构示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:

实施例一:

请参照图1-3所示,图1示出了本发明的一种基于线性回归的电表失准检测方法,包括以下步骤:

步骤S1:对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据;

在本实施例中,所述台区下所有用户电表用电量可指在电力系统中,一台变压器的供电范围或区域下所有用户电表用电量数据。

具体的,台区总表和台区下面的所有用户电表存在拓扑连接关系,即一台台区总表下测量的总电量对应多个用户电表计量的电量。

需要说明的是,在本发明中,电表用电量即指电表计量电量,在本发明中不做区分。

其中,用电量数据具体可包括在预设时间内每天采集的台区下用户用电量。例如预设时间为90天,所述用电量数据包括这90天内每天采集的所有用户的用户电表显示的用电量。

具体的,所述对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据,可包括:

步骤S11:构造台区总线损和用户电表日用电量的增广矩阵A;

其中,A的行依次表示不同的采集电量日期,A的列依次表示对应日期的台区总表线损值y和用户电表计量电量X;具体计算式子如下:A=[y,X]

其中,

具体的,台区总表线损值y的计算原理如下:

由于台区总表计量输送到台区下面所有用户的总电量,每个用户电表则分别计量所对应用户的用电量,如果台区总表,台区下面所有用户电表计量准确,那么,台区总表的电量,应该等于台区下面所有用户电表计量电量之和,并加上一部分固有线路电量损耗(以下简称“固有线损”),也就是存在如下的理论等式:

q=s+x1+x2+...+xp (1)

其中,q表示台区总表的计量电量,xj(1≤j≤p)表示第j个用户电表的计量电量,s表示固有线损。但是在真实情况下,因为用户电表存在计量故障,或者人为窃电,等式(1)中每个xj需要乘以一个校准因子fj,所以等式(1)转化成了:

q=s+f1x1+f2x2+...+fpxp (2)

为了和后面算法的表示统一,令:

带入等式(2),可以得到如下等式:

y=s+c1x1+c2x2+...+cpxp (3)

在等式(3)中,y表示台区电量总线损,xj(1≤j≤p)表示第j个用户电表的计量电量,cj表示第j个用户电表用电量的回归系数,并且在理论情况上,如果用户电表j计量准确,那么系数cj=0;如果电表多计(用户实际用电量<电表计量电量),那么系数cj<0;如果电表少计(用户实际用电量>电表计量电量),那么系数cj>0。因此,准确求解系数cj成了关键所在。

通常而言,假设一段时间范围内,不失一般性,令时间范围为第1天到第n天,满足台区拓扑关系不变(即图2的连接关系没有变动),并且系数cj(1≤j≤p)稳定,那么,对于每天的电量总线损和用户电表电量都满足等式(3),联立起来如下:

等式(4)中,yi(1≤i≤n)表示第i天的台区总线损,xij(1≤i≤n,1≤j≤p)表示第i天,台区下的第j块电表日用电量,ε表示随机误差项,服从n元正态分布,满足:ε~N(0,σ2I);

等式(4)的线性方程组,如果采用通常的最小二乘算法,要求n≥p+1,也就是说,采集电量的天数>台区下面的用户电表总数,如果用户电表总数为200,那么采集电量的天数需要200天以上,但是如果采集天数过长,很难确保这段时间台区拓扑关系一直不变,一个台区下面出现有新增用户电表,或者已有电表进行销户等情况都会导致台区拓扑关系改变,导致求解系数cj不准确。

因此,本发明可通过先对台区下所有用户电表用电量数据进行广义偏相关性分析,以在后续步骤中实现在较短的电量采集天数时仍可对电表进行失准检测。因为一个台区下,通常出现失准的电表数只在少数,这意味着,在公式(1)中,其中ci(1≤i≤p)大部分都是0,如果我们可以提前排除大部分正常的电表,只让少部分电表作为线性回归模型的自变量,那么即使总用户数远大于采集电量的天数,但只要最终进入线性回归模型的电表数小于采集电量的天数,那么这个线性回归模型就是理论可解的。

例如,如果可以排除90%正常电表,只让剩下10%电表作为线性模型的自变量,那么即使采集电量的天数为90天,理论上可以对电表总数不超过900的所有台区,进行失准计算。

因此,采用本发明的二次规划模型求解系数可以实现在较短的电量采集天数下,例如n=90,对于n<p+1的情形,依然可以准确求解系数cj。同时,还可尽可能降低台区拓扑关系变更的可能,保证失准计算的准确率。

在上述实现过程中,通过对台区下所有用户电表用电量数据进行广义偏相关性分析,只保留满足预设条件的用户电表用电量数据,可以有效排除大部分正常的电表,只让少部分电表作为线性回归模型的自变量,为台区下电表数远大于采集电量天数的情况,提供了失准模型(即后续步骤中带约束的二次规划模型)计算的可能性。

步骤S12:生成增广矩阵A的样本协方差矩阵C,所述样本协方差矩阵C用于表示台区总线损和用户电表计量电量之间的线性相关性;具体计算式子如下:

C=cov(A)

步骤S13:获取样本协方差矩阵C的逆矩阵IC,所述逆矩阵IC用于表示台区总线损和用户电表计量电量之间的线性偏相关性;

可选的,获取样本协方差矩阵C的逆矩阵IC包括:

步骤S131:在台区下电表个数≥采集电量天数时,通过增加对角矩阵的方式将样本协方差矩阵C转成可逆矩阵,获取转成的可逆矩阵的逆矩阵IC;

因为,当台区下电表个数≥采集电量天数时,也就是p≥n时,样本协方差矩阵C一定不可逆。这里,可通过增加一个对角矩阵将样本协方差矩阵C转成可逆矩阵,具体的,所述对角矩阵的对角元素为r,其中r是一个很小的正数,例如r=1e-15,将样本协方差矩阵C转成可逆矩阵,再获取转成的可逆矩阵的逆矩阵IC;具体计算式子如下:

E=eig(C)

e=min(E)

if(e<r)

C=C+r*I

步骤S132:在台区下电表个数<采集电量天数时,所述样本协方差矩阵C为可逆矩阵,生成样本协方差矩阵C的逆矩阵IC,具体计算式子如下:

IC=inv(C);

步骤S14:获取逆矩阵IC的对角向量d,所述对角向量用于表示台区总线损和用户电表计量电量的方差;具体计算式子如下:

d=diag(IC);

步骤S15:根据所述逆矩阵IC和逆矩阵IC的对角向量d,得到用于表示台区总线损和台区下各个电表用电量之间的偏相关系数向量pc;具体计算式子如下:

f=d[0]*d

f=1/sqrt(f)

pc=-IC[0,1:]*f[1:];

步骤S16:获取偏相关性阈值s,若台区下某电表用电量偏相关系数向量pc大于或等于偏相关性阈值s,则判定该电表的用电量数据为满足预设条件的用户电表用电量数据,保留满足预设条件的用户电表用电量数据,作为候选自变量集合indexs,具体计算式子如下:

indexs={i|abs(pc[i])≥s,1≤i≤p};

可选的,所述获取偏相关性阈值s步骤包括:

获取在置信度为0.95下,台区总线损和用户电表计量电量的偏相关性阈值s。

具体的,根据统计分析原理,计算在置信度为0.95下,台区总线损和用户电表计量电量的偏相关性阈值s,具体计算式子如下:

s=t.ppf(0.95,n-p-2)

s=s2/(n-p-2)

其中,t.ppf(0.95,n-p-2)表示自由度为n-p-2的t分布,累计概率为0.95的分位点。

可选的,所述候选自变量集合以及回归系数集合分别满足以下公式:

其中,为满足预设条件的用户电表用电量数据;为回归系数集合;为第n天台区下第ik块电表日用电量;为第ik块电表计量用电量的回归系数;ik为候选自变量集合中用户电表编号。

步骤S2:将满足预设条件的用户电表用电量数据作为候选自变量集合;根据所述候选自变量集合构建二次规划模型,所述二次规划模型满足以下公式:

其中,y为台区电量总线损;为候选自变量集合;为候选自变量集合中各用户电表用电量数据对应的回归系数集合;

具体的,所述根据所述候选自变量集合构建二次规划模型的原理如下:

假设在步骤S1中通过广义偏相关性分析所得到候选自变量集合indexs={i1,i2,...,ik},那么公式(1)可以转换为:

其中i1...ik表示候选自变量集合所对应的用户电表编号。在真实的环境中,回归系数cik≥-1。所以线性回归模型可以转换一个带约束的二次规划模型,即:

其中,

其中,为满足预设条件的用户电表用电量数据;为回归系数集合;为第n天台区下第ik块电表日用电量;为第ik块电表计量用电量的回归系数;ik为候选自变量集合中用户电表编号。

在上述实现过程中,根据所述候选自变量集合构建二次规划模型,将基于最小二乘的线性回归模型,转换为带约束的二次规划模型,更符合真实环境的物理意义。

步骤S3:对所述二次规划模型进行回归系数的求解,得到回归系数集合;

在本实施中,构建的带约束的二次规划,在数学上属于带约束的凸优化问题,可以通过现有技术数学计算得到理论最优解,例如,可以采用(但不限于)拉格朗日方法,Lemke方法,内点法,有效集法,椭球算法等来实现求解。

步骤S4:根据求解出的回归系数,判定各用户电表失准状态。

在本实施中,所述步骤S4可具体包括:

为正时,判定用户电表出现少计量,且用户电表失准程度与绝对值成正比;

为负时,判定用户电表出现多计量,且用户电表失准程度与绝对值成正比。

作为另一实施例,本发明的所述对台区下所有用户电表用电量数据进行广义偏相关性分析步骤之前还包括:

步骤S0:对台区下所有用户电表用电量数据进行预处理;所述预处理包括以下的一种或多种:去除因日用电量采集失败因素引起的台区总线损偏高的用电量数据;获取台区总线损的时序数据检测异常点,去除检测异常点对应的日用电量数据。

在步骤S0中,由于真实的生产环境在某一天存在部分电表的日用电量采集失败的可能,导致所计算的台区总线损显著偏高,因此,可通过预处理对这部分日期所对应的线损电量数据过滤掉;另外,在台区下面所有电表日用电量完全采集成功的情况下,台区总表的电能示值也可能出现倒走,飞走的计量故障,因此,可通过预处理对台区总线损的时序数据进行异常点检测,比如可以使用(但不限于)μ±3σ准则查找异常点,然后删除异常点所对应日期的线损电量数据。

在上述实现过程中,先通过对线损电量数据预处理,再基于广义偏相关性分析得到候选电表,筛选出少量与台区线损存在高度偏相关性的电表,然后基于候选电表将台区总线损的线性回归模型转换为一个带约束的二次规划模型进行求解,实现在采集用电量天数较短情况下,也可以有效的进行电表失准判定。

本发明的方法模拟检测步骤如下:

采集若干台区的用户电表数据,其中采集电量的天数均=90天,并假定各台区下面10%的电表存在失准,然后依次设置各台区下面存在不同数量的电表总数,通过本发明方法去检测所存在失准的电表,每组电表数各循环模拟检测50次,具体的模拟实验结果如下表1所示:

表1:

从表1可以看出在台区下电表总数≤180,召回率≥60%,精确率≥80%;当台区电表总数达到200时,尽管召回率下将到50%以下,但是精确率仍维持在70%。

实施例二:

请参照图2所示,图2示出了本发明的一种基于线性回归的电表失准检测装置,包括:

分析单元10,用于对台区下所有用户电表用电量数据进行广义偏相关性分析,得到满足预设条件的用户电表用电量数据;

二次规划模型构建单元20,用于将满足预设条件的用户电表用电量数据作为候选自变量集合;根据所述候选自变量集合构建二次规划模型,所述二次规划模型满足以下公式:其中,y为台区电量总线损;为候选自变量集合;为候选自变量集合中各用户电表计量用电量的回归系数集合;

计算单元30,用于对所述二次规划模型进行回归系数的求解,得到回归系数集合;

判定单元40,用于根据求解出的回归系数集合,判定各用户电表失准状态。

在上述实现过程中,本发明通过分析单元10先进行广义偏相关性分析,再通过二次规划模型构建单元20构建一个改进的线性回归模型,即带约束的二次规划模型进行求解,根据求解出的回归系数判断电表失准状态,不要求采集用电量天数≥台区下面的电表总数,一方面可实现在台区下电表总数大于采集用电量天数时的电表失准检测,例如台区下电量表总数多达两百,但采集用电量天数较短情况下,比如90天,也可以有效的进行电表失准判定,实现对电表失准的检测。

同时,由于本发明可在采集用电量天数较短情况下检测电表失准状态,还可以减低电表和台区之间的对应关系出现变更的可能,从而提高失准检测的准确率。

实施例三:

图3为本申请实施例提供的一种电子设备的结构示意图,在本申请中可以通过图3所示的示意图来描述用于实现本申请实施例的本发明基于线性回归的电表失准检测方法的电子设备100。

如图3所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104,这些组件通过总线系统和/或其它形式的连接机构(未示出)互连。应当注意,图3所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备可以具有图3示出的部分组件,也可以具有图3未示出的其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。

本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。

对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:测距装置、测距系统以及测距方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!