基于深度学习的视频多目标跟踪算法研究
发布时间:2025-05-07 00:39
对视频中的多个被关注对象进行维持固定身份标识的追踪,也就是多目标跟踪(Multi-Object Tracking,MOT),一直是众多研究者们所感兴趣的问题。其在应用于安防、工业、交通和军事领域等众多更复杂的计算机视觉系统中都能发挥独特的效果。离线跟踪能够利用整段的视频提供完整的时空信息来支撑跟踪,而在线跟踪仅能利用当前帧和历史帧等已知信息来构建目标轨迹。基于在线跟踪的特性,其能够满足诸如视频监控、自动驾驶等场景中所需要的实时性要求。因此,能够进行实时跟踪的在线跟踪算法以及其实现过程中碰到的相关问题是本文的首要关注点。传统的多目标跟踪算法,采用人工手段来设定被跟踪对象。而基于检测的跟踪范式则是从给定的视频每一帧的检测结果中获取当前场景中所有物体的位置和类别,再决定算法所关注的对象并加以跟踪。随着深度学习技术被应用到目标检测领域并带来巨大的性能提升,研究者们都将注意力集中到了基于检测的跟踪范式上,并设计出了一系列具有优异跟踪性能的视频多目标跟踪器。然而,当前的检测算法无法在一些目标遮挡严重以及目标数量较多的视频场景中完全准确地识别和定位感兴趣的目标,得到的检测结果中存在着大量的漏检和误检。...
【文章页数】:128 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外发展现状
1.3 多目标跟踪的关键技术难题
1.4 主要研究内容简介
1.5 论文结构安排
第二章 相关基础知识
2.1 网络模型基础知识
2.1.1 残差神经网络Resnet
2.1.2 特征金字塔FPN
2.1.3 faster-RCNN
2.2 运动模型基础知识
2.2.1 匀速运动模型
2.2.2 卡尔曼滤波器
2.2.3 增强相关系数算法
2.3 数据集以及评估指标
2.3.1 常用数据集
2.3.2 评估指标
第三章 基于预测细化和遮挡分类的多目标跟踪算法
3.1 引言
3.2 相关工作
3.2.1 遮挡处理
3.2.2 目标检测
3.3 多目标跟踪框架
3.3.1 跟踪初始化
3.3.2 运动预测
3.3.3 预测细化
3.3.4 遮挡分类
3.3.5 数据关联
3.3.6 行人重识别
3.3.7 跟踪管理
3.4 网络结构与目标函数
3.4.1 网络结构
3.4.2 训练损失
3.5 实验
3.5.1 数据集
3.5.2 评估指标
3.5.3 实现细节
3.5.4 消融实验
3.5.5 遮挡分类分析
3.5.6 运动模型分析
3.5.7 基准数据集评估
3.6 讨论
3.7 本章小结
第四章 基于跟踪模拟训练和多功能聚合的多目标跟踪算法
4.1 引言
4.2 相关工作
4.2.1 外观模型
4.2.2 端对端的训练
4.2.3 车辆跟踪
4.3 运动模型与网络模型
4.3.1 运动预测
4.3.2 网络结构
4.3.3 训练过程
4.3.4 行人重识别模块
4.3.5 跟踪管理
4.4 实验
4.4.1 数据集
4.4.2 评估指标
4.4.3 实验细节
4.4.4 基准数据集评估
4.4.5 消融研究
4.4.6 兼容性研究
4.4.7 训练损失分析
4.4.8 视觉化结果
4.5 讨论
4.6 本章小结
第五章 基于二源运动预测的多目标跟踪算法
5.1 引言
5.2 相关工作
5.2.1 轨迹预测算法
5.2.2 Transformer
5.3 运动预测模型
5.3.1 运动预测过程
5.3.2 网络结构
5.3.3 跟踪流程
5.4 实验
5.4.1 数据集
5.4.2 评估指标
5.4.3 实验设置
5.4.4 基准数据集评估
5.4.5 运动模型对比
5.4.6 网络结构对比
5.4.7 相机运动信息分析
5.4.8 跟踪框架对比
5.5 讨论
5.6 本章小结
第六章 总结和展望
6.1 总结
6.2 展望
参考文献
致谢
附录:攻读博士期间发表的论文
本文编号:4043336
【文章页数】:128 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外发展现状
1.3 多目标跟踪的关键技术难题
1.4 主要研究内容简介
1.5 论文结构安排
第二章 相关基础知识
2.1 网络模型基础知识
2.1.1 残差神经网络Resnet
2.1.2 特征金字塔FPN
2.1.3 faster-RCNN
2.2 运动模型基础知识
2.2.1 匀速运动模型
2.2.2 卡尔曼滤波器
2.2.3 增强相关系数算法
2.3 数据集以及评估指标
2.3.1 常用数据集
2.3.2 评估指标
第三章 基于预测细化和遮挡分类的多目标跟踪算法
3.1 引言
3.2 相关工作
3.2.1 遮挡处理
3.2.2 目标检测
3.3 多目标跟踪框架
3.3.1 跟踪初始化
3.3.2 运动预测
3.3.3 预测细化
3.3.4 遮挡分类
3.3.5 数据关联
3.3.6 行人重识别
3.3.7 跟踪管理
3.4 网络结构与目标函数
3.4.1 网络结构
3.4.2 训练损失
3.5 实验
3.5.1 数据集
3.5.2 评估指标
3.5.3 实现细节
3.5.4 消融实验
3.5.5 遮挡分类分析
3.5.6 运动模型分析
3.5.7 基准数据集评估
3.6 讨论
3.7 本章小结
第四章 基于跟踪模拟训练和多功能聚合的多目标跟踪算法
4.1 引言
4.2 相关工作
4.2.1 外观模型
4.2.2 端对端的训练
4.2.3 车辆跟踪
4.3 运动模型与网络模型
4.3.1 运动预测
4.3.2 网络结构
4.3.3 训练过程
4.3.4 行人重识别模块
4.3.5 跟踪管理
4.4 实验
4.4.1 数据集
4.4.2 评估指标
4.4.3 实验细节
4.4.4 基准数据集评估
4.4.5 消融研究
4.4.6 兼容性研究
4.4.7 训练损失分析
4.4.8 视觉化结果
4.5 讨论
4.6 本章小结
第五章 基于二源运动预测的多目标跟踪算法
5.1 引言
5.2 相关工作
5.2.1 轨迹预测算法
5.2.2 Transformer
5.3 运动预测模型
5.3.1 运动预测过程
5.3.2 网络结构
5.3.3 跟踪流程
5.4 实验
5.4.1 数据集
5.4.2 评估指标
5.4.3 实验设置
5.4.4 基准数据集评估
5.4.5 运动模型对比
5.4.6 网络结构对比
5.4.7 相机运动信息分析
5.4.8 跟踪框架对比
5.5 讨论
5.6 本章小结
第六章 总结和展望
6.1 总结
6.2 展望
参考文献
致谢
附录:攻读博士期间发表的论文
本文编号:4043336
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4043336.html
最近更新
教材专著