卷积神经网络的改进及其在图像分类中应用研究
发布时间:2020-06-03 23:41
【摘要】:图像分类是指挖掘和获取图像信息中所呈现的不同特征,将不同类别的图像数据区分的图像处理技术。图像分类的核心内容在于图像特征的提取,提取到高级语义特征可正确理解图像的内容或本质,从而提升图像分类精度。随着大数据时代的到来和互联网技术的飞速发展,深度学习方法已成为图像分类任务中的研究热点。卷积神经网络作为深度学习技术中应用最为广泛的方法之一,具有强大的特征提取能力和非线性拟合数据能力,是现今图像分类任务中最为有效的算法之一。许多研究人员对卷积神经网络和图像分类技术开展了大量的研究并取得了优良的进展,但卷积神经网络方法仍存在着网络模型复杂、训练时间过长、过多占用计算资源、收敛速度慢、网络过拟合以及分类精度有待提高等不足。因此,对卷积神经网络相关技术进行改进,设计性能更优的卷积神经网络方法用于图像分类已成为重要的研究方向之一。(1)针对深层模型结构复杂、参数庞大、训练时间过长、网络易过拟合、泛化能力较弱以及识别精度有待提升等问题,提出了深层网络迁移的花卉图像分类方法。深层网络采用经典的网络结构:VGG16、VGG19、InceptionV3和ResNet50。首先在ImageNet数据集上进行预训练,使深层网络参数具备自然场景下图像的特征提取性能以及获得网络的优化参数等;再将预训练模型输入到目标数据集中进行迁移训练,进一步进行网络训练和参数优化,获得花卉数据的丰富的高级语义信息,并与随机初始化网络进行比较。实验结果表明,ResNet50迁移方法的识别性能最佳,在Oxford-102数据集的分类准确度达到了96.57%,并在Oxford-17数据集上的分类精度也达到95.29%,且在广西花卉数据集中表现优良,该模型均具有良好的识别精度和鲁棒性。(2)为进一步提升Oxford标准花卉数据集的识别精度,减少网络训练时间,有效提升模型鲁棒性和泛化能力,在迁移方法的基础上提出深层网络二次迁移技术。通过ImageNet数据集训练后得到的预训练模型,迁移到广西花卉数据集中进一步训练网络和优化参数,得到的花卉迁移训练模型再次迁移到Oxford标准花卉数据集中。实验结果表明,二次迁移方法相比于迁移学习方法,在模型的识别精度和泛化能力上均有显著提升,ResNet50二次迁移方法在Oxford-102数据集的分类准确度达到97%。(3)针对卷积神经网络中参数量过多导致网络陷入过拟合以及层数过多、参数过大引起精度下降等网络退化问题,提出了一种改进的浅层的稠密卷积神经网络方法(DenseNet-S)。在原始的稠密网络中,引入改进的SqueezeNet中的fire模块,并针对压缩参数带来的模型特征提取能力下降问题,提出二维卷积核分离技术来获取目标多样性的多尺度特征,从而提升模型的特征提取能力。本文将提出的模型与原始稠密网络进行对比,并与经典的深度学习进行对比,以及在提出模型中进行模型简化实验对比,多角度论证本文方法的有效性。
【图文】:
ConovultinoConovultinoPooilgnConovultinoPooilgnPooilgnLinaer“horse”PredictionDense Block 1 Dense Block 2 Dense Block 3图 2-3.包含三个稠密连接模块的稠密网络在稠密连接模块中,第 l 层的特征图xl是采用前面 l-1 个层数的特征图x0, x1,…, xl 1计算得到:xl= Hl([x0, x1, … , xl 1]) (2-1)其中,[x0, x1, … , xl 1]是将第 0 层到第 l-1 层的特征图进行张量拼接,而Hl是由三种操作组成的复合函数:批归一化(Batch Normalization, BN),修正线性单元(RectifieLinear Unit,ReLU)以及二维卷积 3*3。为了避免出现特征的拼接问题,需要在模块中插入过渡层(transition layer)来改变特征图的大小以完成张量的顺利拼接,过渡层一般是由一个 1*1 卷积运算和一个 2*2 平均池化操作组成。稠密连接模块如图 2-4 所示。
图 3-1.Oxford Flowers 数据集部分示例据集是在南宁金花茶公园中拍摄的广西花卉图像数据集,有441 张图像,每个类别的图片有 300 张到 700 张不等的图片,网络训练之前本文对图像进行预处理操作,,并对其做了翻转、数据集中有 6181 张图片作为训练集,1130 张图片作为验证。图 3-2 给出了广西花卉数据集中类别及示例图。凹叶红合欢 白嫦娥彩 赤丹 春节 大红金心大花蕙兰 扶绥中东金花茶 含笑 鹤顶兰 红嫦娥彩
【学位授予单位】:南宁师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
本文编号:2695577
【图文】:
ConovultinoConovultinoPooilgnConovultinoPooilgnPooilgnLinaer“horse”PredictionDense Block 1 Dense Block 2 Dense Block 3图 2-3.包含三个稠密连接模块的稠密网络在稠密连接模块中,第 l 层的特征图xl是采用前面 l-1 个层数的特征图x0, x1,…, xl 1计算得到:xl= Hl([x0, x1, … , xl 1]) (2-1)其中,[x0, x1, … , xl 1]是将第 0 层到第 l-1 层的特征图进行张量拼接,而Hl是由三种操作组成的复合函数:批归一化(Batch Normalization, BN),修正线性单元(RectifieLinear Unit,ReLU)以及二维卷积 3*3。为了避免出现特征的拼接问题,需要在模块中插入过渡层(transition layer)来改变特征图的大小以完成张量的顺利拼接,过渡层一般是由一个 1*1 卷积运算和一个 2*2 平均池化操作组成。稠密连接模块如图 2-4 所示。
图 3-1.Oxford Flowers 数据集部分示例据集是在南宁金花茶公园中拍摄的广西花卉图像数据集,有441 张图像,每个类别的图片有 300 张到 700 张不等的图片,网络训练之前本文对图像进行预处理操作,,并对其做了翻转、数据集中有 6181 张图片作为训练集,1130 张图片作为验证。图 3-2 给出了广西花卉数据集中类别及示例图。凹叶红合欢 白嫦娥彩 赤丹 春节 大红金心大花蕙兰 扶绥中东金花茶 含笑 鹤顶兰 红嫦娥彩
【学位授予单位】:南宁师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【参考文献】
相关期刊论文 前4条
1 曹莹;苗启广;刘家辰;高琳;;AdaBoost算法研究进展与展望[J];自动化学报;2013年06期
2 邢杰;萧德云;;基于PCA的概率神经网络结构优化[J];清华大学学报(自然科学版);2008年01期
3 刘斐;卢惠民;郑志强;;基于线性分类器的混合空间查找表颜色分类方法[J];中国图象图形学报;2008年01期
4 栾丽华,吉根林;决策树分类技术研究[J];计算机工程;2004年09期
本文编号:2695577
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2695577.html