投稿指南
来稿应自觉遵守国家有关著作权法律法规,不得侵犯他人版权或其他权利,如果出现问题作者文责自负,而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件,作者必须保证本刊的独立发表权。 一、投稿方式: 1、 请从 我刊官网 直接投稿 。 2、 请 从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。 二、稿件著作权: 1、 投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我刊所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我刊所投之作品不得同时向第三方投送,即不允许一稿多投。 5、 投稿人授予我刊享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 第5条所述之网络是指通过我刊官网。 7、 投稿人委托我刊声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

基于改进Yolo v3算法的遥感建筑物检测研究

来源:遥感学报 【在线投稿】 栏目:期刊导读 时间:2021-02-15
作者:网站采编
关键词:
摘要:1 引言 随着遥感技术的发展,遥感图像幅员更加辽阔,包含的信息更加复杂,因此其已被广泛应用于图像识别、语义识别、视频分析、文本分析和大数据分析等领域[1]。遥感图像中对固

1 引言

随着遥感技术的发展,遥感图像幅员更加辽阔,包含的信息更加复杂,因此其已被广泛应用于图像识别、语义识别、视频分析、文本分析和大数据分析等领域[1]。遥感图像中对固定地物与移动地物的检测一直是研究热点,其中固定地表建筑物是人类主要活动场所,因此对该类目标实现检测显得尤为重要。考虑到实际工程应用中实时性是一个极为重要的问题,且检测目标(建筑物)小,对建筑物检测也造成了极大的困难。故而,如何实现对遥感图像中该类建筑物的检测是目标检测领域的一个研究难点[2]。

相比传统的根据建筑物颜色、形状、纹理等提取简单特征的目标检测算法,基于深度学习的目标检测利用深度神经网络强大的特征学习能力来解决复杂的遥感图像检测问题,更能满足今天遥感图像中目标检测的要求[3]。本文的研究重点为固定地表中的建筑物检测,以基于深度学习的目标检测算法Yolo v3为研究基础,并以修改特征图分辨率、调整先验框维度为改进方向,加强对小型建筑物的检测,生成更适合遥感建筑物检测的网络模型。

2 相关工作

从遥感图像中检测建筑物有传统算法和基于深度学习的算法两大类。传统目标检测算法是一种基于人工设计特征的分类方法,利用了建筑物某一方面的特征,如颜色、形状等,虽然具有一定的检测效果,但是在检测精度和检测速度上具有较大的局限性。如文献[4]提出一种阴影验证的建筑物检测方法,该方法通过建筑物的阴影、形状以及颜色特征结合起来检测建筑物,对特征简单的建筑物检测效果良好,但对于复杂特征的建筑物检测,该方法无法满足工程应用中对检测精度及实时性的要求。与之相比,基于深度学习的检测算法以其适应能力强、检测效率高而得到了广泛应用,该类检测算法以卷积神经网络为基础,具有强大的特征表示能力,在背景模糊、地理环境复杂的情况下,仍然能够学习到有用的特征,大幅提高了物体检测精度,适用于当今遥感图像复杂多变的场景,具有非常好的泛化能力和鲁棒性[5]。如文献[6]提出一种端到端的密集反卷积神经网络,将图像中的抽象特征与细节特征结合,能够捕捉到目标建筑物的细微复杂特征;文献[7]中使用金字塔技术构建多级训练的样本,提出候选建筑区域检测建筑物,在检测精度及实时性方面有显著提升。

目前基于深度学习的检测算法可以分为两类:基于区域的目标检测算法和基于端到端的目标检测算法。前者先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类,这类算法在检测精度和定位精度上占优,代表算法有:Faster RCNN[8-9]和Fast RCNN等;后者不生成候选框,直接将目标边框定位的问题转化为回归问题,这类算法在检测速度上占优,代表算法有:Yolo[10-11]系列和 SSD[12]等。

考虑到目前遥感技术的发展,需要对上千平方公里图像进行处理,而且目标小、背景复杂度高,因此检测速度及泛用性是首先考虑的问题,所以本文将基于深度学习的Yolo v3检测算法应用于建筑物的检测,并在检测小型建筑物方面提出改进。

3 改进Yolo v3算法

3.1 Yolo v3原理

Yolo v3 是基于端到端的检测算法,网络结构分为骨干网络(Darknet-53)和检测网络。Darknet-53由52个卷积层和1个全连接层组成,构成了一个53层的卷积神经网络(CNN),并输出13×13、26×26和52×52三种尺度的特征,送入检测网络。检测网络对三种尺度的特征回归,预测出多个预测框,并使用非极大抑制(NMS)算法删除置信得分较低的预测框,保留置信得分较高的预测框为目标检测框,从而得到目标的类别和位置,检测流程如图1。

图1 Yolo v3检测流程

(1)边界框预测:检测网络对13×13、26×26和52×52三种尺度的特征回归,预测出多个预测框,在检测的过程中,每个网格会产生多个边界框,每个边界框都要预测边界框位置信息(x,y,w,h)和置信度(confidence)。置信度是边界框所含目标的可能性Pr(object)与边界框准确度IOU的乘积,计算公式如式(1)所示:

若网格中包含某个目标则Pr(object)=1 ,否则表示真实标注框与预测框的交并比,用来衡量预测边界框的准确性,当IOU=1 时,说明真实标注框与预测框重合。

(2)分类:对包含目标的网格预测多个类别概率,用Pr(classi|object)表示。为了得到每个边界框的分类信息,将边界框所属网格的类别概率与边界框的置信度相乘得到置信度评分,如公式(2)所示,其代表了边界框中目标属于某个类的概率。

文章来源:《遥感学报》 网址: http://www.ygxbzz.cn/qikandaodu/2021/0215/504.html



上一篇:恒温双色光源夜间能见度观测方法研究
下一篇:无人机多光谱遥感反演不同深度土壤盐分

遥感学报投稿 | 遥感学报编辑部| 遥感学报版面费 | 遥感学报论文发表 | 遥感学报最新目录
Copyright © 2018 《遥感学报》杂志社 版权所有
投稿电话: 投稿邮箱: