计算机科学
COMPUTERSCIENCE
Vol.46No.6A
June2019
数字图像复制粘贴篡改取证
12
())华东政法大学刑事司法学院 上海2南京森林警察学院刑事科学技术学院 南京200042 (10046
2
邢文博1, 杜志淳1
摘 要 数字图像在被复制粘贴篡改时会对被复制部分进行缩放、旋转,然后粘贴在图像的不同部位,从而形成篡改图像.用s通过关键点的向量找出相互匹配的关键点对.用随机采样一致性算ift算法检测出图像中的sift关键点,法在匹配点对中随机采取3个匹配点对计算其仿射变换矩阵,并对匹配点对进行循环分类,分类完成后按照每一类的篡改图像与其逆仿射变换图像的局部相关图.将每一类匹配关键点对按照仿射变换关系分为两组,从每组的关键点位置设置二值图像并用结构元素进行膨胀,将二值图像膨胀位置在相关图像的相关值大于阈值的膨胀部分保留,小于阈值的膨胀部分舍去,迭代膨胀到二值图像不再膨胀为止.然后获取二值图像的边界,在原图像中标出复制粘贴篡改部分.实验表明该方法可以有效定位篡改图像中的复制粘贴区域.
关键词 数字图像取证,局部相关图,复制粘贴篡改sift关键点,RANSAC算法,中图法分类号 TP391 文献标识码 A
仿射变换模型对篡改图像进行仿射变换以及仿射变换的逆变换,然后求得篡改图像与其仿射变换图像的局部相关图、
DiitalImaeForensicsforCondPasteTameringgpyapg
1(,)SchoolofCriminalJusticeEastChinaUniversitfPoliticalScienceandLaw,Shanhai200042,Chinayog
121
XINGWenGbo DUZhiGchun
,
tedindifferentpartsoftheimae.ThesiftkeointsaredetectedintheimaebIFTalorithm,andthematchedkegypgySgy
,,Abstract WhenadiitalimaeistameredwithcondpastethecoiedpartmihtbezoomedrotatedandthenpasGggppyapg
2(,,)SchoolofCriminalScienceandTechnoloNaninorestPoliceColleeNanin10046,ChinagyjgFgjg2
ointsarefoundoutbatchinectorofthekeoints.ThematchedkeointsareclassifiedbheaffinetransforGpymgvypypyt
,mationmatrixwhichiscalculatedbRANdomSAmleConsensusnamelandomlxtractinhreematchedpointypyryegt
relationmafthetameredimaeanditsinverseaffinetransformationimaetoo.Eachclassofmatchedkeointsispopggypdividedintotwogrousaccordinoaffinetransformationrelations.Abinarmaeissetfromthekeointofeachpgtyigyprounddilatedwithstructuralelements.Thedilatedpositionofthebinarimaeiscontinuedtohavewhenitsvaluegpayg
airsinmatchedpointairs.Theaffinetransformationoftheimaeanditsinverseaffinetransformationarecarriedout.ppg
,ThenthelocalcorrelationmafthetameredimaeanditsaffinetransformationimaeisobtainedandthelocalcorGpopgg
inthelocalcorrelationmaisgreaterthanthethresholdandisgetridofwhenitsvalueinthelocalcorrelationmaispp’lessthanthethreshold.Thebinarimaeisdilatediterativelntilitsnolonerexandsanditsboundarismarkedygyugpyontheoriinalimae.Exerimentsshowthatthismethodcaneffectivellocatethecoastetamerinreasindiitalggpypyppgag,,,Kewords DiitalimaeforensicsSiftkeointsRANSACalorithm,LocalcorrelationmaCoGastedforerggypgppypgyy
成了人们最为关注的焦点.
imaes.g
1 概述
“图像是对客观实在的记录,眼见为实”是人们最朴素的价值观.现在人们看到的大多是数字图像,但数字图像更容易被图像处理软件篡改,篡改痕迹也很难被人们发现,被篡改的数字图像改变了图像所记录的客观真实.将被篡改的图像作为新闻报道的图片、摄影的参赛作品、法庭的视听资料证据()等,将会造成严重的影响.图1是2b004年美国总统小布并在网络上流传.因此,当数字图像作为证据使用时,图像是否是对客观实在的真实记录即数字图像的真实性,就什在竞选时被人进行多次复制粘贴篡改的一张宣传照片,
)原图像 (a()多次篡改图像b
图1 小布什竞选时被篡改的宣传照片
图像的复制粘贴篡改操作是一种比较常见的图像篡改方法.它通过复制同一幅图像中的一部分内容,并将其直接粘贴到图像中的另一部分,以便掩盖图像中的内容,或者增加图
:邢文博 男,博士生,主要研究方向为司法鉴定制度、图像取证、痕迹检验,杜志淳 男,教授,博士生导师,主要研EGmail704181858@q.com;q:究方向为司法鉴定制度,EGmailduzhichun@ecul.edu.cn.p
第6A期
邢文博,等:数字图像复制粘贴篡改取证
算法编程并进行图像测试;最后分得出结论.
381
像中的内容.以掩盖图像内容为目的的篡改多是复制图像中的背景部分,一般复制图像中相似背景部分(如蓝天、沙滩、草地、墙面等)进行上下左右平移粘贴.以增加图像内容为目的的篡改多是复制图像中的前景物体,甚至对复制部分进行旋转、缩放、模糊、加噪,然后再选择图像中的目标部位进行粘贴,以达到自己期望的图像效果.
3 篡改图像中sift匹配关键点对的RANSAC分类
[]
是LSIFT)owe2于1999年提出并于2004年完善的基于尺度
尺度不变特征变换(ScaleInvariantFeatureTransform,
空间对图像平移、缩放、旋转等仿射变换保持不变的图像局部关键点描述向量.它通过建立图像的尺度空间,并将尺度空间的极值点作为关键点,利用关键点处的梯度值和方向为每个特征点指定方向参数,并形成关键点的特征向量.
2 基于关键点匹配图像复制粘贴检测方法
是图像的原始图像块,D1是对原始图像块O旋转放大后的复制图像块,D2是对原始图像块O旋转缩小后的复制图像块.
图2是利用旋转缩放对图像进行复制粘贴篡改的模型,O3.1 图像中的sift特征点
人类在识别一个物体时,对一定距离范围内不同旋转角图2 旋转缩放对图像进行复制粘贴篡改的模型
图像的复制粘贴篡改检测算法包括基于块匹配的检测算法和基于图像中关键点的检测算法
[1]
测图像中的复制粘贴篡改.数字图像中的关键点有尺度不变.本文是基于关键点检
特征变换算法点
[2]
sift(ScaleInvariantFeatureTransform)关键ures
、)关键点加速鲁[3棒]
,性以特及征KA算Z法Es算ur法f(关Sp键ee点
ded[4]
.Up他R
们ob共us同tF的ea特
G征是检测出图像中的关键点具有旋转和缩放不变性.通过关键点向量的相似性找到匹配的关键点,图像中复制粘贴篡改部分具有密集的匹配关键点.键点用于图像的复制粘贴篡改H检ua测ng[5]
最先将图像的.Ardizzone[6]
对提s
if取t关到
关键点进行聚类,并采用类匹配方法检测多次复制粘贴篡改
区域.池静[7]
等提出以区域生长,来检测图像中的复制粘贴篡改sift特征点的聚类中心为种子点进行.[8]inkae聚类检测图像中多次复制粘贴篡改A部me位ri.ni利用用聚类J方G
法检测图像的复制粘贴篡改g,在确定特征点类别个数时存在用适当的距离阈值进行类别确定或根据散点图直观地确定类别个数.当复制粘贴部分相互重叠时,聚类方法将不能正确
区分复制粘贴部分的特征点.李云[9]等通过降低的对比度阈值,几乎不剔除低对比度的极值点,在平滑区域提
sift关键点
取键点sift关键点.巩家昌[10]通过在图像的对抗空间提取,以及基于颜色不变量空间提取复制粘贴篡改.
sift关键点,来检测图像sift关
本文对图像中检出的sift关键点进行匹配,
形成匹配点对集,设定图像中复制粘贴部分的匹配点对阈值,利用ANSAC算法从匹配点对集中随机选取3对匹配点对生成仿射变换模型进行分类,用每一类的仿射变换模型对篡改图像进行仿射变换以及逆仿射变换,再求得篡改图像与仿射变换图像以及逆仿射变换图像之间的相关图,用篡改图像中复制部分与粘贴部分的匹配sift关键点生成两个二值图像,并用结构元素对二值图像进行膨胀,膨胀部分对应相关图的值大于设定阈值的保留,小于阈值的舍弃,迭代膨胀到二值图像不再膨胀为止,获取篡改图像的复制粘贴区域,并在篡改图像中定位.本文第3节具体说明算法的实现过程;第4节介绍
度的物体都能正确识别,这就是尺度旋转不变性.对图像进行各种高斯模糊可以模拟实现这种尺度不变性,所以首先构造图像的尺度空间.为了得到同一图像在各分辨率下的不变特征点,需要对图像进行降采样处理,得到一系列像素缩小的图像,即图像金字塔.每一层图像由上一层分辨率长宽的一半即同的高斯方差参数做高斯模糊1/4的像素组成.然后对图像金字塔中的每层图像用不,使得每层金字塔有多张高斯
模糊图,形成图像的多尺度空间表示.金字塔每层的多张图像合成为一组,每组有多张图像.对图像金字塔每组的多张高斯图像的相邻层进行差分,得到高斯差分图像.其次,在尺度空间中检测极值点.在寻找高斯差分图像的极值点时,每一个像素都需要和与它在同一尺度以及相邻尺度的所有相邻点进行比较,当其为极大值或极小值时即为关键点.由于这些关键点是在离散空间得到的,而离散空间是对连续空间进行采样的结果,因此在离散空间得到的关键点不一定是真正意义上的关键点.通过泰勒展开式多次迭代求得关键点的精确位置,进而求得关键点的对比度值,通过设置对比度阈值,删除低对比度关键点.通过一定阈值的边缘点删除,得到优化后的关键点Hessian矩阵将主曲率比值大于.接着,要使关键点的特征向量具有旋转不变性,就必须确定关键点的方向.关键点的方向是利用其邻域像素的梯度分布特性来确定,再对图像的梯度直方图进行插值拟合处理,以求得关键点局部结构的稳定方向.在构造关键点特征向量时,将坐标轴旋转为关键点的方向,从而实现特征向量的旋转不变性.最后,生成关键点的描述向量.将图像的坐标轴旋转为关键点的方向,在以关键点为中心的幅值与梯度方向,每个种61个6×种16的像素区域内以子点,每一个像4素×4像素为一个种子点,共形成1求得的梯度子点的梯度区域由为0度到方向的梯度强度信息8个方向区间,每个区间360度划分为.每个关键45度,即每个种子点有点产生,形成128维的sift特征向量.关键点4的×4特×征88个向=1量28个数据用于关键点的匹配.
3.2 关键点的特征向量匹配
关键点的匹配就是通过比较关键点特征向量之间的欧氏距离来实现,用最近邻距离与次近邻距离的比值小于确定的阈值来确定关键点的相互匹配.在Matlab中,为了提高计算效率,利用关键点特征向量的点乘来代替特征向量之间的距离计算.在特征向量夹角比较小时,特征向量夹角之间的比值近似于特征向量距离之间的比值.通过设置特征向量夹角比值的阈值来确定最近邻向量的匹配.设α征向量,θ是两个关键点,β是经过归一化处理的关键点的特特征向量之间的夹角,则:
tLR382
αosθβ=c
(θ=arccosαβ)
计算机科学
2019年
进行仿射变换以及逆仿射变换,得到仿射变换图像以及逆仿射变换图像.篡改图像中的粘贴部分与仿射变换图像的对应区域将有比较高的相关性,篡改图像的复制区域将与逆仿射变换图像的对应区域有比较高的相关性.将篡改图像、仿射变换图像、逆仿射变换图像转换为灰度图像,求得篡改图像与仿射变换图像的局部相关图,再求得篡改图像与逆仿射变换图像的局部相关图.图像局部的相关性由下面的相关性公式给出.
(∑m∑n(Amn-A)Bmn-B)→→
→
在同一幅图像的复制粘贴检测中,假设检测到n个关键
点,从n个关键点中取出一个关键点,将它与n个关键点的特征向量进行点乘,通过反余弦变换求得它们之间的夹角,然后,进行降序排列,形成dddd1,2,3,n.排在第一个位置的夹角为0,因为是关键点的检测向量与自己的夹角;排在第二位的是候选匹配向量夹角.在s候选向量的夹ift特征比对中,角与比对向量夹角的比值小于一定阈值时才能确定候选向量为相似向量,这两个向量表示的关键点才是匹配关键点.sift关键点匹配算法中设置的匹配向量夹角与比对向量夹角的比/值小于0.即d才能确定其关键点相互匹配.6,d.6,23<0γ=
其中,γ表示m×n图像块A与m×n图像块B的相关性,A22
()()∑m∑n(Amn-A)∑m∑n(Bmn-B)→→
为了检测篡改图像中的多次复制粘贴篡改部分,需将d1,d2,
3,,dn序列中的所有匹配向量检测出来,用di表示2,,ddn中的任意一项,in-1.从d1取值为2到2开始,所,有满足di/di+1<0.6的生成di的两个关键点为匹配关键点.然后将剩余关键点进行同样的运算,得到匹配点对集..3 匹配点对的RANSAC算法分类
在同一幅复制粘贴篡改的图像中,除了复制粘贴区域有相互匹配的匹配关键点外,还会有部分非复制粘贴区域的具有相互匹配的关键点.复制粘贴区域的匹配关键点之间存在仿射变换关系,而非复制粘贴之间的匹配关键点将不存在仿射变换关系,用对存在仿射变换关系的匹配关键点进行分类RANSAC(RANdomSAmpleC,o可以检测出图nsensus)算法像中的多次复制粘贴区域,并滤除非复制粘贴区域的匹配关键点.
一组包含异常数据的样本数据集进行随机采样计算出数据的RANSAC
[11]
,即随机采样一致性统计算法.它是通过对
数学模型,再通过计算符合数据模型的数据,得到有效样本数据的算法.
由于匹配关键点之间是相互匹配关系,设a互匹配的关键点,a与b匹配,同理b也与a匹配,b是两个相,a匹配点.在所有的关键点都完成匹配后,会形成a,b是一对与b匹配以及b与a匹配的两个匹配点对,按照匹配点的坐标将匹配点对调整成从左到右、从上到下的顺序,删除匹配对中重复匹配的匹配点对.仿射变换的数据模型需要3个匹配点对来确定.用的两个匹配点分别取自篡改图像中的复制部分与粘贴部分RANSAC算法随机采取3个匹配点对,因为匹配点对,
如果篡改图像中复制部分的3个点与粘贴部分一条直线上,则复制部分的3个点不在同成三角形,则根据这变换模型.对所有的匹配点对从左面或上面的关键点进行仿3个匹配点对求出一个符合仿射变换3个点与粘贴部分3个点各自构的射变换,得到其仿射变换后点的位置,再与其匹配的关键点的位置进行比较.通过设定的误差阈值判定符合仿射变换的匹配点对,当符合该仿射变换模型的匹配点对数超过设定的阈值时,将所有符合该仿射变换模型的匹配点对从匹配点对集中提取出来作为一类;然后对剩余的匹配点对再用同样的算法提出符合另一个仿射变换的所有匹配点对,并作为第二类,直到剩余的匹配点对少于设定的阈值,或随机采样次数达到设定的值,退出.4 篡改图像中复制粘贴区域的定位
RANSAC算法对匹配点对的分类.
篡改图像中复制粘贴区域之间存在仿射变换关系以及逆仿射变换关系,根据3.3节求得的仿射变换关系对篡改图像表示图像块A的像素均值,B→
表示图像块B的均值.
按照相关性公式将篡改图像分别与仿射变换图像以及逆仿射变换图像以3×3的图像块求得相关图.将每一类匹配点对按照仿射变换关系分成对应的两个关键点组,并对每一个组关键点的坐标进行取整,生成关键点二值图像.对关键点二值图像用3×3的结构元素进行膨胀,将二值图像膨胀位置在相关图中的相关值大于阈值的膨胀区域保留,小于阈值的膨胀区域舍去(本文设置阈值为复进行上述过程,直到二值图像不再0.膨7)胀,然为后止对.二然值后图获像取重二值图像的边界,在原图像中标出复制粘贴篡改区域.
实验结果与分析
.1 Matlab编程检测
的,求得sift特征点的检测是用siftDemoV4[12
]
Matlab程序进行
向量进行归一化sift特征点的位置以及特征点的向量表示,并对特征.对于每一个特征向量,求其与其他特征向量的余弦夹角,并进行升序排序,从最小夹角开始,将其与紧挨着的夹角进行比较,并将比值小于一定阈值的两个向量设定为匹配向量.舍弃匹配向量距离小于匹配完成后,形成匹配点对矩阵.因为被10个像素的匹配点.匹配的sift特征点与其匹配的特征点会再次形成匹配点对,所以将匹配点对调整成从左到右的匹配点对形式,删除重复的匹配点对.再将匹配点对的位置进行标准化处理,便于用.
RANSAC算法对匹配点对进行分类匹配点对数量比较集中的区域就是图像复制粘贴区域的ift匹配关键点,这些点对之间存在仿射变换关系.用随机采样一致性算法在匹配的点对中随机选取得仿射变换关系,对匹配点对中左面的关键点进行仿射变换3个匹配点对,求,
求其仿射变换点的位置,并与其对应的匹配关键点的位置进行比较.在设定的误差范围内(因为对匹配点的位置进行了归一化,本文将其设置为对达到设定阈值的匹配点0数.05时),(符合仿射变换关系由于图23中的匹配的点匹对配少点,所以对图0
),认定这种仿射变23检测时设置为换关系5成,对其他图像进行检测时立,并将这些匹配点对设划置归为类单独存储.在匹配点对中删除符合这种仿射变换关系的匹一配点对,并对剩余的匹配点对再次进行随机采样,寻找仿射变换关系式,直到剩余的匹配点对小于设定的阈值(本文设置阈值为结束对3)匹或随机采样次数达到设定的值配点对寻找仿射变换的关(系本文设置为.图3是1算00法0的)时流,程图.
dd3344s1第6A期
邢文博,等:数字图像复制粘贴篡改取证
383
图3 复制粘贴检测算法流程图
下面以网络上流行的小布什竞选时的复制粘贴篡改照片
(图图像大小为4是siftDe3[13]来为例说明该算法的检测过m7o0×2V4算法检测到的78)
程.sift关键点.图图6是RANSAC算法检测到的5是一类sif仿t关键点的匹配结果.射变换匹配点.图7是RANSAC算法检测到的另一类仿射变换匹配点.图8是RANSAC算法检测到的两处粘贴部分的匹配关键点.图图10是篡改图像的9是剩余的不符合仿射变换关系的匹配关键点.一类仿射变换图像与逆仿射变换图像.图11是篡改图像的灰度图像分别与一类仿射变换与逆仿射变换灰度图像的相关图.图键点1.2是篡改图像中的一类复制区域和粘贴区域的匹配关图13是篡改图像中的一类复制区域和粘贴区域.图14是篡改图像中另一类仿射变换与逆仿射变换图像.图15是篡改图像分别与另一类仿射变换与逆仿射变换图像的相关图.图关键点1.6是篡改图像中另一类复制区域和粘贴区域的匹配图17是篡改图像中的另一类复制区域和粘贴区域.图18是篡改图中粘贴部分仿射变换与逆仿射变换图像.图分仿射变换与逆仿射变换图像的1相9是篡改图分别与粘贴部关图.图中两个粘贴区域的关键点.图21是篡改图像中的粘贴区域20是篡改图像.
图22是篡改图像中的复制区域及粘贴区域.图.
23是复制粘贴篡改图像的检测结果图4 被篡改图中检测到的
图sift特征点
5 相互匹配的sift特征点
图6 RANSAC算法检测到的
图一类仿射变换匹配点
7 RANSAC算法检测到的另一类仿射变换匹配点
图8 RANSAC算法检测到的粘贴
图部分的仿射变换匹配点
9 剩余的不符合仿射
变换的匹配点
(a)仿射变换图像(b
)逆仿射变换图像图10 篡改图像的一类仿射变换图像与逆仿射变换图像
(相关图
a)篡改图像与仿射变换图像(像相关图
b)篡改图像与逆仿射变换图图11 篡改图像分别与一类仿射变换与逆仿射变换图像相关图
(a
)篡改图像中的粘贴区域关键点(b
)篡改图中的复制区域关键点图12 篡改图像中一类复制区域和粘贴区域的匹配关键点
(a
)篡改图像中的粘贴区域(b
)篡改图中的复制区域图13 篡改图像中的一类复制区域和粘贴区域
(a)仿射变换图像(b
)逆仿射变换图像图14 篡改图像中另一类仿射变换与逆仿射变换图像
(a)篡改图像与仿射变换图像相关图(b
)篡改图像与逆仿射变换图像相关图图15 篡改图像分别与另一类仿射变换与逆仿射变换图像相关图
384
计算机科学
2019年
(a)篡改图像中的粘贴区域关键点(b
)篡改图像中的复制区域关键点图16 篡改图像中另一类复制区域和粘贴区域的匹配关键点
(a)篡改图像中的粘贴区域(b
)篡改图中的复制区域图17 篡改图像中的另一类复制区域和粘贴区域
(a
)仿射变换图像(b
)逆仿射变换图像图18 篡改图像中粘贴部分的仿射变换与逆仿射变换图像
(a)篡改图像与仿射变换图像相关图(b
)篡改图像与逆仿射变换图像相关图图19 篡改图像分别与粘贴部分的仿射变换与逆仿射变换图像相关图
(a)粘贴部分1的匹配关键点(b
)粘贴部分2的匹配关键点图20 篡改图像中两个粘贴区域的关键点
(a)篡改图像中的粘贴区域1(b
)篡改图像中的粘贴区域2图21 篡改图像中的粘贴区域
图22 篡改图像中的复制粘贴
图区域
23 复制粘贴篡改图像
的检测结果
图24是本文算法对网上流行的广场鸽复制粘贴篡改图
像(图像大小为500×349
)[14]
的检测结果.图24 广场鸽图像的检测结果
图25是对CoMoFoD图像库[15]
中第检测结果.
140幅篡改图像的
(a
)原图(b
)篡改图像(c
)篡改模板(d)png存储
(e)jpg(100)存储(f)jpg
(60)存储(g)jpg
(20)存储(h)加方差0.009噪声
(i)7×7均值滤波
图25 CoMoFoD图像库中第140幅篡改图像的检测
结束语像中相互匹配的 本文算法是通过随机采样一致性算法对篡改图
sift关键点对进行分类,每一类是一次复制粘贴操作.由于复制粘贴区域之间存在着仿射变换关系,对篡改图像进行仿射变换以及逆仿射变换,通过求篡改图像与仿射变换图像以及逆仿射变换图像的灰度相关图,准确定位图像的粘贴、复制区域.对篡改图像中没有检测到足够的ift匹配关键点的复制粘贴篡改图像,本文算法将不能进行有效的检测.导致图像中像像素成倍缩小,或者图像中复制粘贴区域模糊或过度平滑sift匹配关键点减少的原因,
是图.在对匹配关键点用随机采样一致性算法进行分类的过程中,图像的有损压缩或者图像的过度缩放,致使部分匹配点的位置出现偏移,这些点之间的仿射变换关系不符合图像中复制粘贴部分之间的仿射变换关系,有效剔除图像中的这些匹配点,提高复制粘贴篡改部分的定位精度,是我们下一步的工作方向.
参考文献
[1]vWAeRBnHKEeAoD,DHARASKARRV,THAKAREVM.ASurG
[2]nLiqyOWueosypE[JD].Pys[G.rpociJDent.IidsintaCBastienrcntoeaivmdtieIp
uCtoonamepryGlaJg
SpoeciaesurFntenaeclaeFtou,2ofCre0rsf1g6eromr,y7DetectionTechGp
o8um:6terVS1Gc6ail7seiG.oInnva2r0i0a4nt6K0e(2)oi:9nt1G110].
,,[3]BRAobYustHF,eTatUuYreTsE[JLA.CAoRmSpuTte,rVGOisOiLon&ILV.mSagUeURFn:dSepresetdaenddinUg
p
2006,110(3):404G4]17.
,(下转第396页)
s396
强的优点.
计算机科学
2019年
宏平均值基本达到了9体现了其分类精度高、泛化能力0%,4.3 先进性实验
、选择几种常用的分类器:逻辑回归、神经网络、决策adaboost树,在默认参数的条件下与GBDT进行比较.将预测后的结果与原始结果进行比对,并以智能电表的故障原因大类的命中率即作为该类的准确率.同样进行故障小类预测模型和寿命预测模型的比较,结果如表8所列.
从实验结果可以看出,只有决策树以及GBDT的表现较为了验证G本方案首先BDT在该学习任务上的先进性,
以达到9对现场运维工作具有极大的价值.同时,由2.2%,于本方案只利用了电表的故障数据,对于电表的运行数据还没有充分的利用,若能考虑到电表当前的运行状态,最终的故障预测结果将会更加准确.
参考文献
[]L1IUJS.AnalzinlectricitonsumtionviaDateMininygEyCpg[]N2IKOVSKIDN,WANGZ,ESENTHERA,etal.Smartmeter
andDataMinininPatternReconition.SrinerBerlinHeidelGggpg[]S,3AHOOSNIKOVSKID,MUSOT,etal.ElectricitheftdeGyt
GridTechnoloiesConference.2015:1G5.g,ber2013.g
dataanalsisforpowertheftdetection[M]∥MachineLearninyg[],():J.JournalofWuhanUniversit2015,12107G8.y
优.于BDT的思想是将多个决策树组合在一起不断逼近真实值,在调参后模型精确度仍有上升空间,由此可见本方案选择的GBDT作为故障原因大类的预测分类器具有更好的表现性能.
表8 故障小类预测模型的比较结果
模型名称逻辑回归BP神经网络Adaboost决策树
预测准确度/%
44.3239.5153.8474.1474.20
生命周期
(/天均方根误差)
141.5988.4051.7848.3866.72
tectionusinmartmeterdata[C]∥IEEEInnovativeSmartgs
[]D,4EPURUSetal.SuortVectorMachineBasedDataClassifiGpp
cationforDetectionofElectricitheft[J].PowerSstemsyTy,Conference&Exosition2011:1G8.p
[]Z5AKARIAZ,LOKL.TwoGstaefuzzlusterinroachforgycgapp
[loadprofilinC]∥2009Proceedinsofthe44thInternationalgg2009.
UniversitiesPowerEnineerinonference(UPEC).IEEE,ggC
梯度提升决策树
差别,故障小类预测是分类任务,因此比较模型都以分类器评价指标为准确度,而寿命预测是回归任务,比较模型使用的是在进行多源融合DT在本学习任务上具有优异的表现性能,后,组合模型的性能也会更加优异.
回归器,评价指标为均方根误差.如表8中的数据所示,GBG
表8中,故障小类预测和寿命预测采用的对比模型存在
[]周开乐,]沈超,丁帅.基于遗传算法得微电网负荷优化分配[6J.[]刘永光,孙超亮,牛贞贞,等.改进型模糊C均值聚类算法的电7
[]董瑞,黄民翔.基于减法聚类的F8CM算法在电力负荷分类中的[]B,9IDOKISMAHMOUDIGKOHANN,GERAMIS.Comarisonp
]():应用[华东电力,J.2014,425917G921.
]():力负荷特性分类技术研究[电测与仪表,J.2014,51185G9.():中国管理科学,2014,22368G73.
回归器的故障风险预测.该方法首先预测计量设备在发生故种可能后,分别以其作为条件预测设备的预期寿命,其中寿命的误差服从正态分布,因此可以得到设备故障日期的累计分布曲线,并以此提出在故障发生概率超过40%后报警的预警手段.研究提出的基于G可以发掘出BDT多模型融合方法,故障电表中的隐含关系,对设备故障及寿命的预测准确度可(上接第384页)
结束语 本文主要设计了基于GBDT分类器和GBDT
classification[C]∥IEEEElectricalPowerDistributionNetG[]MON,10EDEROIetal.DetectionofFraudsandOtherNonGtechG
nicalLossesinAPowerUtilitsinearsonNetworksandyUgP],DecisionTrees[J.InternationalJournal&EnerstemsgySyworks.2011:1G7.
ofseveralclusterinethodsinthecaseofelectricalloadcurvesgm
障的前提下具体的故障原因大类和故障原因小类,在得到4
[]王立平,邓芳明.基于小波包和G11BDT的瓦斯传感器故障诊断
[]():测控技术,J.2016,351230G33.
():2012,34190G98.
[]A4LCANTARILLAPF,BARTOLIA,DAVISONAJ.KAZE
:,linSriner2012:214G227.pg
[FeaturesM]∥EuroeanConferenceonComuterVision.BerGpp
[]李云,陈帆,和红杰.9SIFT复制粘贴图像取证算法的安全性分析[]巩家昌.基于局部颜色不变性特征的图像复制粘贴篡改取证研10
究[天津:天津大学,D].2015.
():2013,286659G669.
及改进[C]∥全国信息隐藏暨多媒体信息安全学术大会.2015.
[]HUAN5GH,GUOW,ZHANGY.DetectionofCoGMoveForGpy
erinDiitalImaesUsinIFTAlorithm[C]∥PacificGAsiagygggSgWorkshonComutationalIntellienceandIndustrialAlicaGpopgpp
[:11]FISCHLERMA,BOLLESRC.Randomsamleconsensusap
[]A6RDIZZONEE,BRUNOA,MAZZOLAG.Detectinultilegmp
[coiesintameredimaesC]∥IEEEInternationalConferenceppgonImaeProcessin.IEEE,2010:2117G2120.gg
,()tion2008PACIIA’08.IEEE,2009:272G276.
]andautomatedcartorahJ.Comm.oftheACM,1981,24:gpy[[]h:///~//.12ttwww.cs.ubc.calowekeointspyp
381G395.
aradimformodelfittinithalicationstoimaeanalsispggwppgy
[]池静,张婷,杨振宇.基于S7IFT和区域生长的图像复制粘贴盲[]AME,8RINIIBALLANL,CALDELLIR,etal.CoGmoveforGpy
eretectionandlocalizationbeansofrobustclusteringydymg],withJGLinkae[J.SinalProcessinmaeCommunicationgggIg]():检测算法[科学技术与工程,J.2013,134917G920.
[]h:////_413ttblo.sina.com.cnsblo9cd44fb010005b.html.pggq
[]h:////_a14ttimae.fenniao.com3603600114ll.html#3601563pgg
[]T,15RALICD,ZUPANCICIGRGICS.CoMoFoD—NewdataG
SmosiumELMARG2013.IEEE,2013:49G54.yp
th
baseforcoGmoveforeretection[C]∥55Internationalpygyd
因篇幅问题不能全部显示,请点此查看更多更全内容