基于注意力机制的视频哈希检索方法研究

发布时间:2025-06-21 04:37
  近年来随着互联网及移动通讯技术的迅猛发展,各种类型的多媒体数据呈爆炸性增长,特别是视频数据,因其形象、生动的特性逐渐成为互联网用户获取信息的重要数据形式,各种电视剧、电影等丰富视频资源在视频网站和平台的广泛传播更是加速了这一趋势。同时,短视频平台的兴起,为互联网用户快速上传和下载视频内容也提供了便利。大量视频数据源源不断地产生,在丰富互联网用户文化娱乐生活的同时,也为互联网视频的搜索和推荐带来了一系列挑战。如何将用户想要的结果从海量视频数据中检索出来已成为当下一个研究热点。基于内容的视频哈希检索方法正是解决这一问题的一个可行方案。基于内容的视频哈希检索方法通过将视频内容信息映射成离散的二值码,即映射成哈希码,来实现大规模视频数据的准确和快速检索。由于映射成的哈希码是离散的,可以通过快速的异或操作来计算不同视频之间的海明距离,大大降低了计算复杂度和存储空间。现有的视频哈希检索方法大多将视频中每一帧的重要性同等看待。然而,在实际应用中,视频帧与帧之间的重要性是不同的。因此,应该考虑视频不同帧的重要性的差别来设计视频哈希算法。基于这一动机,本论文提出了一种基于注意力机制的视频哈希检索方法。该方...

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

图2-1哈希学习思想示例W??哈希学习可以将文本、图像、视频等类型的数据映射成一段较短的哈希码,??

图2-1哈希学习思想示例W??哈希学习可以将文本、图像、视频等类型的数据映射成一段较短的哈希码,??

?山东大学硕士学位论文???第2章相关技术介绍??在本章中,首先对哈希学习进行简单的介绍。然后详细介绍本文方法中所使??用的各种相关技术,包括卷积神经网络,长短期记忆神经网络和注意力机制。??2.1哈希学习??随着互联网技术的发展,海量的数据被互联网用户上传到互联网上,其中尤??....


图2-2VGG-16?(?

图2-2VGG-16?(?

?山东大学硕士学位论文???在本方法中,我们使用VGG网络来提取视频中每一帧的特征。VGG网络结??构相对比较简单,通过卷积层的叠加来学习图像的高级特征,VGG-16和VGG-??19的网络结构图如图2-2?(a)和图2-2?(b)所示。??(?(?"1??224*224?图像?....


图2-3长短期记忆神经网络结构图??长短期记忆神经网络包括一个输入门,一个输出门,一个遗忘门和两个状态??

图2-3长短期记忆神经网络结构图??长短期记忆神经网络包括一个输入门,一个输出门,一个遗忘门和两个状态??

列中的长期依赖信息。梯度消失问题与梯度爆炸问题是??由于权重矩阵循环相乘导致的。解决梯度爆炸问题可以采用截断的方式。通过设??置一个临界值,将大于临界值的梯度的值截断为该临界值。然而,该方法会在一??定程度上改变梯度的方向。梯度消失问题无法使用截断的方式来进行处理。如果??采用截....


图2*4图像中的注意力机制[541??2.4.2自然语言处理中的注意力机制??

图2*4图像中的注意力机制[541??2.4.2自然语言处理中的注意力机制??

?山东大学硕士学位论文???的位置。如图2-4所示,图像中红色的区域表示注意力集中地地方,而蓝色的区??域代表人类的注意力不在这个位置。当人类看到图2-4左上角图像时,会自动将??注意力集中在图像中的狗身上,因此红色区域主要集中在狗身上;同样地,当人??类看到图2*4右上角的图像....



本文编号:4051924

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/4051924.html

上一篇:基于评论文本的评分预测推荐算法研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户966f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com