当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的发票识别系统的研究与实现

发布时间:2024-05-18 21:19
  随着经济和信息技术的高速发展,企业之间的贸易增多,企业关于财务方面的高效管理越来越重要,尤其是发票信息识别和存储管理的问题。随着发票数量增多,传统OCR识别方法出现识别效率低、易于出错的问题,本文设计和开发一个基于深度学习的发票识别系统,该系统以发票文字检测和文字识别为核心,并结合现有的图像预处理技术,提高发票的识别效率。本文的主要工作内容如下:(1)针对噪声和因光照不佳导致图像的对比度较低、图像缺少、倾斜问题,本文通过图像灰度化、图像二值化和图像倾斜矫正的图像预处理的方法来解决以上问题。(2)提出了基于YOLOv3+CRNN模型下的目标检测与发票识别方法。通过标注发票数据集,分别对YOLOv3检测模型和CRNN识别模型进行训练。然后将两个训练好的模型进行结合,得到一个端到端的发票识别模型,对该模型进行实验验证,发票识别率达98%以上。(3)采用端到端的发票识别模型,开发了基于深度学习的发票检测和识别系统。先对该系统进行需求分析和设计,系统由图像采集模块、图像预处理模块、发票字符检测模块、发票字符识别模块和数据整理模块组成,在发票字符检测和识别两个模块使用函数调用训练好的YOLOv3和...

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

图2.2二值化的数字数据

图2.2二值化的数字数据

第2章发票识别系统相关技术简述10上式(2-6)中取本地邻域窗口的宽b值为15,偏差常数值为0.2。综合式(2-7)的全局前景阈值上限的到了本文改进Niblack法的新自适应二值化阈值如下式(2-8):"max(,)min((,),)2-8NiblackNiblackadaptt....


图2.4CNN网络结构图

图2.4CNN网络结构图

第2章发票识别系统相关技术简述11小范围内对倾斜文本行的定位效果进行更高精度的矫正。倾斜文本定位处理流程如图2.3所示。图2.3倾斜文本定位处理流程2.2深度学习技术2.2.1卷积神经网络技术卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种深度学....


图2.5传统OCMSER、SWT合分影分析

图2.5传统OCMSER、SWT合分影分析

第2章发票识别系统相关技术简述14图像文本图2.5传统OCR处理流程图经典的光学字符识别系统的流程和技术要点如图2.5所示,从图像的输入到得到最后的文本,需要经过连通域分析、二值化、行列分割及分析、文字分割和识别、HMM模型处理等流程。在传统的OCR技术的任务中,识别过程分为单字....


图2.5传统OCR处理流程图

图2.5传统OCR处理流程图

第2章发票识别系统相关技术简述14图像文本图2.5传统OCR处理流程图经典的光学字符识别系统的流程和技术要点如图2.5所示,从图像的输入到得到最后的文本,需要经过连通域分析、二值化、行列分割及分析、文字分割和识别、HMM模型处理等流程。在传统的OCR技术的任务中,识别过程分为单字....



本文编号:3977360

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3977360.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户2aa4a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]