基于注意力机制的视频显著性检测算法研究
发布时间:2021-08-02 04:22
显著性目标检测旨在识别出最重要和最让人眼感兴趣的区域,作为计算机视觉领域的一个热门方向,目前主要应用于目标分割、动作识别、目标跟踪等任务中。人类视觉的注意力机制是指人能够在复杂的场景中分配更多的注意力给显著性区域,这对显著性目标检测提供了一种可行方案。模仿人类视觉的注意力机制,本文针对目前视频显著性检测方法在处理特征时的无差异对待问题,采用基于空间域的注意力机制来提高对显著性目标的注意程度,并完成了基于空间域注意力机制的视频显著性检测算法设计。同时针对在视频特征提取中存在的时间、空间信息不一致性的问题,本文设计了嵌入注意力机制的conv LSTM结构,使网络能够提取时空一致性信息的同时极大限度的保持特征的空间结构信息,并最终完成了基于注意力机制的视频显著性目标检测模型设计。针对视频显著性检测存在的问题,本文主要的研究内容如下:(1)针对特征之间的差异性和对显著性目标预测的贡献不同,引入了视觉注意力机制对特征区分看待,并设计了一种基于空间域注意力机制的视频显著性检测算法。该算法核心是将基于通道、空间注意的注意力机制应用到视频显著性检测中,让网络更加关注显著性区域部分。该算法考虑到网络不同...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
视觉通路
哈尔滨工业大学工学硕士学位论文50(e)UVSD(f)ViSal图4-36个数据集上PR曲线、MaxF曲线、MAE/MeanF曲线4.4.2实时性结果分析在表4-5和表4-6分别记录了本文所提出的算法和其他17个视频显著性模型的运行速度结果,其中表4-5是基于传统方法的模型测试实时性结果,共包含11个模型。表4-6是基于深度学习方法的模型测试实时性结果,共包含7个模型,其中OURS代表本文所设计的模型。其中,速度单位fps(framespersecond)代表每秒处理的视频帧个数。其中处理的图片大小,本文统一为353*353像素值。所有的测试均是在相同的平台进行:IntelXeonE5-2630v4@2.2GHz和TITANRTXGPU。本文所提出的模型不需要任何的预处理和后处理手段,譬如以光流信息作为额外的输入,因此达到了一个很高的处理速度20fps。
【参考文献】:
硕士论文
[1]基于注意力机制的图像显著区域提取算法分析与比较[D]. 李敏学.北京交通大学 2011
本文编号:3316883
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
视觉通路
哈尔滨工业大学工学硕士学位论文50(e)UVSD(f)ViSal图4-36个数据集上PR曲线、MaxF曲线、MAE/MeanF曲线4.4.2实时性结果分析在表4-5和表4-6分别记录了本文所提出的算法和其他17个视频显著性模型的运行速度结果,其中表4-5是基于传统方法的模型测试实时性结果,共包含11个模型。表4-6是基于深度学习方法的模型测试实时性结果,共包含7个模型,其中OURS代表本文所设计的模型。其中,速度单位fps(framespersecond)代表每秒处理的视频帧个数。其中处理的图片大小,本文统一为353*353像素值。所有的测试均是在相同的平台进行:IntelXeonE5-2630v4@2.2GHz和TITANRTXGPU。本文所提出的模型不需要任何的预处理和后处理手段,譬如以光流信息作为额外的输入,因此达到了一个很高的处理速度20fps。
【参考文献】:
硕士论文
[1]基于注意力机制的图像显著区域提取算法分析与比较[D]. 李敏学.北京交通大学 2011
本文编号:3316883
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3316883.html