灰度图像中目标距离恢复

发布时间:2024-05-09 05:32
  在计算机视觉领域中,深度估计与三维重建是重要的研究方向,其关键是从图像中恢复出目标到摄像机的距离。本文主要研究灰度图像中目标距离的恢复问题,并从可见光灰度图像与红外灰度图像两个方面展开研究。首先,对于可见光图像,利用有监督学习的方法进行单目图像深度估计。引入一种新颖的上采样层,实现了该上采样层的插入操作细节。本文采取全卷积神经网络的架构构造模型,其包含编码器网络与解码器网络两部分:使用残差神经网络作为编码器网络提取图像的特征,再使用上采样层构造解码器网络逐步将该特征的尺寸增大,从而输出预测的深度图。在此基础上,本文提出U型全卷积残差网络和全卷积扩张残差网络两种模型,并将模型用于在灰度单通道图像上恢复目标的距离信息。本文的U型全卷积残差网络使用跳跃连接将模型中靠近输入端的特征与靠近输出端的特征进行级联,这种跳跃式的连接既能融合上下文特征、保留更多的边缘信息,又加强了信息的传递、加快网络收敛;而全卷积扩张残差网络则引入扩张残差网络作为编码器网络来提取图像特征,在不增加权重参数个数而且不损失特征尺寸的情况下,依然保持后续网络层中神经元的感受野大小,从而提取包含更多空间信息的特征传递给后续的上...

【文章页数】:91 页

【学位级别】:硕士

【部分图文】:

图2.1输入通道数为1的卷积操作图

图2.1输入通道数为1的卷积操作图

积核个数为1、步幅为1的卷积过程,高亮部分表示计算第一个输出所使用的输入与卷积核对应的部分。图2.1输入通道数为1的卷积操作图对于多通道的输入,假设卷积核高为kh、宽为kw。当输入通道数大于1时,将会为每个输入通道分配一个单独的kh×kw卷积核。然后在每个通....


图2.2输入通道数为2的卷积操作图

图2.2输入通道数为2的卷积操作图

卷积核做卷积,然后按通道维度逐元素相加得到最终结果。图2.2展示了输入通道数是2,卷积核尺寸为2×2、卷积核个数为1、步幅为1的一个例子。图2.2输入通道数为2的卷积操作图输出张量各个维度的大小由如下公式计算:1inupdownhoutHppfHs....


图2.3最大化池化层和平均池化层示意图

图2.3最大化池化层和平均池化层示意图

10了核尺寸为2×2、步幅为2的池化层:图2.3最大化池化层和平均池化层示意图输出张量各个维度的大小由如下公式计算:1inoutHfHs=+(2-7)1inoutWfWs=+(2-8)其中,f为池化层的大小,s为步幅(一....


图2.4Sigmoid函数曲线图

图2.4Sigmoid函数曲线图

图2.4Sigmoid函数曲线图于输入x的导数为:1f()1xxe=+22df()1111()(1)(1)1(1xxxxxxeedxeee+===++++11(1)()....



本文编号:3968387

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3968387.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户5621d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]