基于改进IDE网络的行人重识别
发布时间:2020-06-19 12:14
【摘要】:为了及时有效的解决社会安全问题,在一些大型的公共场所均已经配套完善的视频监控系统,记录密集人群的行为信息或者运动轨迹,对维护社会秩序和社会公共安全具有重要作用。行人重识别问题就是要对不同摄像头的图像数据或者视频数据检测出的行人进行判断是否是同一个行人号码标识(Identity Document,ID)。行人重识别技术不但已经成为执法部门管理公共安全和犯罪侦破的重要手段,而且也可以计算公共场所的人流数据,以此改进交通系统设计或者优化商场商品布局。身份嵌入(Identification Embedding,IDE)网络作为行人重识别非常重要的基准之一,它通过特征描述的方法,把每个行人当做分类问题的一个类别,但是在实际应用中,IDE网络存在提取特征无法适应复杂环境变化和全局特征泛化能力弱的问题,因此针对IDE网络存在的不足从三个方面进行改进。在主干网络方面,分别使用DenseNet和PCB网络代替ResNet对输入图片提取特征;在数据增强方面,为了使模型适应复杂环境的变化,采用色彩抖动和随机擦除对数据集进行扩充;在网络结构方面,分别引入空间注意力和通道注意力两种不同的注意力机制将其和IDE网络进行融合。经过实验分析,得出以下结论:(1)改进主干网络的DenseNet在提取特征方面优于原始主干网络ResNet,且可以防止模型过拟合;改进主干网络的PCB网络对特征图进行水平分割,可以使模型学习到每个行人不同区域的局部特征。DenseNet改进的IDE网络和PCB网络改进的IDE网络的首位命中率分别比原始IDE网络高1.66%和3.18%;(2)色彩抖动可以让模型适应不同光照条件的复杂背景,随机擦除则可以克服行人的部分遮挡问题,增强模型的泛化能力。融入色彩抖动的改进IDE网络和融入随机擦除的改进IDE网络的首位命中率分别比原始IDE网络高1.57%和2.40%;(3)空间注意力机制和通道注意力机制通过对特征进行空间转换和重标定的策略,可以得到更加鲁棒的特征。融合空间注意力的改进IDE网络和融合通道注意力的改进IDE网络的首位命中率分别比原始IDE网络高2.20%和1.10%。
【学位授予单位】:长安大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183;D631;TP391.41
【图文】:
图 2.1 完整的卷积神经网络示意图由图 2.1 可知,典型的卷积神经网络分类器一般包含输入层、卷积层、激励层[65]、池化层和全连接层(Fully Connected Layer,FC)、批归一化层[66](Batch Normalization,BN)。其中,输入层用于数据的输入,比如:原始图片数据的全部像素;卷积层是每个神经元和上一层的若干小区域连接,计算卷积核权重和小区域像素的内积,使用卷积核进行特征提取和特征映射;神经激励层是将特征层的数据分布映射到另一个非线性的特征空间;池化层的核心内容是对特征图进行稀疏处理,减少数据运算量;全连接层一般用于最后计算类别得分,其所有神经元和上一层的所有神经元一一连接,它可以作为一个中间的通道,将原始的图像数据转换为最后不同类别的得分。图像输入网络后经卷积层提取特征,每层的感受野会逐渐变大,浅层的网络层提取图片的浅层特征,而越深的卷积层可以提取更多的语义信息和细微特征,各层的详细说明如下。2.2.1 卷积层卷积层主要用来对输入的图像或者特征图提取更深层次的特征,是卷积神经网络的
图 2.2 卷积操作过程, ,1 1m ni j i ji joutput I K b 为卷积核, m, n分别为卷积核的宽和高, i, j数为尺寸补全,这个参数是用来对特征图的外,就是将特征图的外围的一圈进行补零操作。入特征图的尺寸和输出特征图的尺寸保持一致次所造成的边缘信息参考度下降。卷积层的输长以及尺寸补全同时决定,输出图像的尺寸如21inoutsize ksize paddingsizestride
本文编号:2720774
【学位授予单位】:长安大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183;D631;TP391.41
【图文】:
图 2.1 完整的卷积神经网络示意图由图 2.1 可知,典型的卷积神经网络分类器一般包含输入层、卷积层、激励层[65]、池化层和全连接层(Fully Connected Layer,FC)、批归一化层[66](Batch Normalization,BN)。其中,输入层用于数据的输入,比如:原始图片数据的全部像素;卷积层是每个神经元和上一层的若干小区域连接,计算卷积核权重和小区域像素的内积,使用卷积核进行特征提取和特征映射;神经激励层是将特征层的数据分布映射到另一个非线性的特征空间;池化层的核心内容是对特征图进行稀疏处理,减少数据运算量;全连接层一般用于最后计算类别得分,其所有神经元和上一层的所有神经元一一连接,它可以作为一个中间的通道,将原始的图像数据转换为最后不同类别的得分。图像输入网络后经卷积层提取特征,每层的感受野会逐渐变大,浅层的网络层提取图片的浅层特征,而越深的卷积层可以提取更多的语义信息和细微特征,各层的详细说明如下。2.2.1 卷积层卷积层主要用来对输入的图像或者特征图提取更深层次的特征,是卷积神经网络的
图 2.2 卷积操作过程, ,1 1m ni j i ji joutput I K b 为卷积核, m, n分别为卷积核的宽和高, i, j数为尺寸补全,这个参数是用来对特征图的外,就是将特征图的外围的一圈进行补零操作。入特征图的尺寸和输出特征图的尺寸保持一致次所造成的边缘信息参考度下降。卷积层的输长以及尺寸补全同时决定,输出图像的尺寸如21inoutsize ksize paddingsizestride
【参考文献】
相关期刊论文 前1条
1 钱坤;王天真;马斌;汤天浩;CLARAMUNT Christophe;;一种新型的局部连接BP网络模型及应用[J];系统科学与数学;2014年07期
相关硕士学位论文 前3条
1 刘楷怡;行人重识别中的特征表达和度量学习的研究[D];华南理工大学;2018年
2 邱隆庆;基于特征学习的行人重识别研究[D];华南理工大学;2017年
3 刘娜;基于卷积神经网络的行人重识别算法[D];华东师范大学;2017年
本文编号:2720774
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/2720774.html