面向精确定位的列车车号文本定位与识别
发布时间:2021-10-12 19:43
针对现有文本定位方法应用于列车车号易出现定位边界不紧凑、面积占比小的车号漏检率高的问题,提出一种面向小尺度目标精确定位的列车车号定位与识别方法.其基于CTPN改进,在文本定位阶段,首先采用VGG16网络提取特征并融合多尺度的特征图,以利于定位小车号区域;其次采用区域建议网络生成候选区域,对其进行分类回归,分类过程设计了困难样本挖掘策略,即保留只包含半个数字的正样本,回归过程设计了边界敏感的细粒度文本框回归策略,以确保水平边界紧凑;最后连接候选区域,输出定位结果.文本识别阶段采用基于注意机制的文本识别方法.通过在Caffe环境验证车号检测数据集,结果表明,车号定位方法相对经典的文本定位方法提高0.11,车号整体识别F1分数为0.81.
【文章来源】:计算机辅助设计与图形学学报. 2020,32(11)北大核心EICSCD
【文章页数】:8 页
【部分图文】:
本文方法框架
针对上述问题,本文提出要在fc4和fc5卷积层之后增加水平方向回归层,用于估计每一个固定宽度的区域建议框的水平坐标.水平回归层结构如图1中红色虚线矩形框所示.水平方向平移因子的计算公式为其中,D是x方向预测平移因子;D*是由GroundTruth和anchor坐标计算得到的x方向平移因子;cx是预测的区域建议框的x方向中心点;是Ground Truth的x方向中心点坐标;a是anchor的x方向中心点坐标;wa是anchor的宽度,本文为固定值16像素.
改进前,水平回归过程中Ground Truth定义规则为:将手工标记的车号文本行Ground Truth分割成宽度为16像素小文本框Ground Truth时,若最后一部分不足16像素宽,则同向延伸至16像素宽,如图3a中矩形框所示.此时,如果将某个anchor与左右边界处延伸的红色矩形框回归,则会导致预测的边界不理想.改进后,若左右边界文本框不足16像素宽,则以整个文本行Ground Truth的边界为起点,反向延伸16像素宽生成小Ground Truth,如图3b黄色矩形框所示,以约束预测边界的水平定位,避免其出现冗余.
【参考文献】:
期刊论文
[1]基于深度学习的车牌定位和识别方法[J]. 李祥鹏,闵卫东,韩清,刘瑞康. 计算机辅助设计与图形学学报. 2019(06)
[2]基于深度神经网络的烟码智能识别方法[J]. 谢志峰,吴佳萍,章曙涵,汤臻,范杰,马利庄. 计算机辅助设计与图形学学报. 2019(01)
本文编号:3433187
【文章来源】:计算机辅助设计与图形学学报. 2020,32(11)北大核心EICSCD
【文章页数】:8 页
【部分图文】:
本文方法框架
针对上述问题,本文提出要在fc4和fc5卷积层之后增加水平方向回归层,用于估计每一个固定宽度的区域建议框的水平坐标.水平回归层结构如图1中红色虚线矩形框所示.水平方向平移因子的计算公式为其中,D是x方向预测平移因子;D*是由GroundTruth和anchor坐标计算得到的x方向平移因子;cx是预测的区域建议框的x方向中心点;是Ground Truth的x方向中心点坐标;a是anchor的x方向中心点坐标;wa是anchor的宽度,本文为固定值16像素.
改进前,水平回归过程中Ground Truth定义规则为:将手工标记的车号文本行Ground Truth分割成宽度为16像素小文本框Ground Truth时,若最后一部分不足16像素宽,则同向延伸至16像素宽,如图3a中矩形框所示.此时,如果将某个anchor与左右边界处延伸的红色矩形框回归,则会导致预测的边界不理想.改进后,若左右边界文本框不足16像素宽,则以整个文本行Ground Truth的边界为起点,反向延伸16像素宽生成小Ground Truth,如图3b黄色矩形框所示,以约束预测边界的水平定位,避免其出现冗余.
【参考文献】:
期刊论文
[1]基于深度学习的车牌定位和识别方法[J]. 李祥鹏,闵卫东,韩清,刘瑞康. 计算机辅助设计与图形学学报. 2019(06)
[2]基于深度神经网络的烟码智能识别方法[J]. 谢志峰,吴佳萍,章曙涵,汤臻,范杰,马利庄. 计算机辅助设计与图形学学报. 2019(01)
本文编号:3433187
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/3433187.html