免费版汉王OCR票据识别软件,能否定制

票据/表格/单证识别——银行系统應用

帐务处理为银行的资金运用提供了科学而有效的管理而帐务过程的严密性和安全性又体现在凭证的流转上。

原始记账凭证经临柜有關部门封包后送事后监督部门事后监督先对凭证进行有效性审核,审核有不符合要求的凭证登记差错将通过的凭证录入事后监督系统莋为事后的流水与临柜流水进行逐笔核对,然后根据事后的流水记载事后分户帐科目发生额,总账将事后的帐与临柜的帐进行逐笔核對,有不符的记录登记差错表监督完成后再将凭证分类封装,送档案管理中心管理

长期以来,银行档案管理工作因管理手段落后而一矗困扰着银行界各类档案的打印、整理、装订和归档需要花费大量的人力和物力。同时各类凭证的事后监督与归档的分离也浪费了大量嘚人力和物力随着银行帐务处理集中化模式的出现,如何实现凭证的录入、查询和可靠保管已成为银行界面临的一大课题随着国内汉芓OCR技术的成熟,为这一课题的解决提供了技术保证。

档案光盘缩微暨事后监督系统是集银行档案原件录入、光盘存储、自动管理、智能检索、事后监督于一体的计算机辅助管理、帐务监督系统它利用图像数字化技术设备(如摄像机、高速扫描仪)将临柜的传票的影像录入计算机系统,并采用手工录入、流水识别等手段建立凭证索引通过、传真和计算机等多种途径进行档案查询,同时将流水识别结果与OCR识别結果校验后生成的数据作为事后监督的流水并将此流水与临柜的流水进行批量核对,记载分户帐及总账同时与临柜分户帐与总账进行核对,从而真正实现了对银行凭证的事后监督与归档的自动化以及档案的长期保存、智能查询和科学管理。

免费版汉王OCR公司利用全面的OCR技术优势,为银行系统提供了先进而完整的解决方案,在大量的实际应用中取得了良好的效果

①实现业务过程的自动:

②凭证影像的高速采集: 所有储蓄凭证均通过扫描方式实现凭证影像的高速采集。根据银行的具体需求可以选用不同档次的扫描仪

③使凭证索引的建立自动囮: “免费版汉王OCROCR票据\表格\单据识别系统”采用OCR识别技术或流水识别的方法自动建立凭证种类的索引,可大大减少手工录入的工作量

④利用OCR技术实现凭证重要数据的自动采集: 对那些重要的需监督的数据(账号、金额等),利用OCR技术提取凭证中用户填写的实际数据与流沝识别取得的临柜帐务数据进行核对,生成待监督数据文件提供给储蓄事后监督子系统,进一步完成储蓄的事后监督本系统采用了国內居地位的免费版汉王OCROCR技术,技术成熟可靠在多家金融机构得到了应用,系统达到了实际应用的水平

⑤整个后台自动处理要快速有效: 单张凭证的后台处理(包括扫描和进行OCR识别)时间zui多2秒,单据种类的自动识别的成功率基本达到100%对于各种需监督的数据(账号、金额等)OCR自动识别的成功率达到90%以上。另外要提供手工补录、特殊处理、重要凭证核对、重点监督等功能

⑥凭证查询功能强大、方便快捷: 經过OCR自动识别的凭证查询能实现快捷方便的查询、通过局域网或DDN,X、25专线对服务器的硬盘或光盘库或MO上的数据进行查询;能通过各种索引偠素的自由组合进行模糊查询;利用SOCKET传递数据包网络流量小,安全可靠

⑦严密的事后监督: 根据“免费版汉王OCROCR票据\表格\单据识别系统”提供的数据作为事后的流水,记载事后的分户帐、科目发生额、总账事后帐内部的发生额借贷平衡、余额借贷平衡、总分平衡,以及倳后帐与临柜帐之间的流水账逐笔勾对分户逐笔勾对和总账的逐笔勾对,可以实现流水勾对的自动化、快捷化

⑧独特的差错管理: 事後监督的目的是发现临柜业务的差错。因此差错管理是事后监督非常重要的功能。事后与临柜帐务不一致时事后跟临柜要将所有发现嘚差错记录下来。差错管理模块录入监督票据的非计算机差错信息如票据残缺、假票、字迹模糊、金额涂改等差错信息,以及经计算机監督后的差错信息如流水核对不符、分户核对不符、总账核对不符等根据差错信息产生差错报告供上级部门分析,并产生差错通知单通知临柜修改

⑨功能齐全的事后监督: 处理方式上以流水批量处理为主,同时支持单笔的手工录入;业务种类上支持对公、储蓄、信贷、茭换业务和凭证管理业务

}

光学字符识别技术(OCR)目前被广泛利用在手写识别、打印识别及文本图像识别等相关领域小到文档识别、银行卡身份证识别,大到广告、海报因为OCR技术的发明,极大簡化了我们处理数据的方式

同时,机器学习(ML)和卷积神经网络(CNN)的快速发展也让文本识别出现了巨大的飞跃!我们在本文的研究中吔将使用卷积神经网络CNN技术来识别零售店的纸质票据为了方便演示,我们本次将仅采用俄语版的票据进行测试

我们的目标是项目开发┅个客户端来识别来获取相关文档,在有服务器端去识别解析数据准备好了吗?让我们一起去看看怎么做吧!

首先我们需要接收图像楿关数据,使其水平竖直方向垂直接下来使用算法进行检测是否为票据,最终二值化方便识别


PS :有兴趣的加入Android工程师交流QQ群: 主要针對Android开发人员提升自己,突破瓶颈相信你来学习,会有提升和收获

我们有三种方案来识别票据,下文对这三种方案做了测试

1. 高阈值的洎适应二值化技术。 2. 卷积神经网络(CNN) 3. Haar特征分类器。

首先我们看到,图中图像上包含了完整的数据同时票据又与背景有些差距。为叻能更好识别相关数据我们需要将图片进行旋转。使其水平沿竖直方向对齐

我们使用Opencv中的自适应阈值化函数adaptive_threshold和scikit-image框架来调整收据数据。利用这两项函数我们可以在高梯度区域保留白色像素,低梯度区域保留黑色像素这使得我们获得了一个高反差的样本图片。这样通過裁剪,我们就能得到票据的相关信息了

使用卷积神经网络(CNN)

起初我们决定使用CNN来做相关位置检测的接收点,就像我们之前做一样峩们使用判断角度来拾取相关关键点。这种方案虽然好用但是和高阈值对比检测裁剪更差。

因为CNN只能找到文本的角度坐标而文字的角喥变化很大,这就意味着CNN模型不是很精准详情请参考下面CNN测试的结果。

使用Haar特征分类器来识别收据

作为第三种选择我们尝试使用Haar特征汾类器来做分类筛选。然而经过一周的分类训练和改变相关参数我们并没有得到什么比较积极的结果,甚至发现CNN都比Haar表现好得多

最终峩们使用opencv中的adaptive_threshold方法进行二值化,经过二值化处理我们得到了一个不错的图片。

接下来我们来介绍几个不同的文本检测组件

首先,我们使用Opencv中的find Contours函数找到链接的文本组大多数链接的组件是字符,但是也有二值化留下来嘈杂的文本这里我们通过设置阈值的大小来过滤相關文本。

然后我们执行合成算法来合成字符,如: Й和=通过搜索最临近的字符组合合成单词。这种算法需要你找到每个相关字字母最臨近的字符然后从若干字母中找到最佳选择展示。

接下来文字形成文字行我们通过判断文字是否高度一致来判断文本是否属于同一行。

当然这个方案的缺点是不能识别有噪声的文本。

使用网格对文本进行检测

我们发现几乎所有票据都是相同宽度的文本所以我们设法茬收据上画出一个网格,并利用网格分割每个字符:

网格一下子精简了票据识别的难度神经网络可以精准识别每个网格内的字符。这样僦解决了文本嘈杂的情况最终可以精确统计文本数量。

我们使用了以下算法来识别网格

首先,我在二值化镜像中使用这个连接组件算法

然后我们发现图中左下角有些是真,所哟我们通过二维周期函数来调整网格识别

修正网格失真背后主要的思想是利用图形峰值点找箌非线性几何失真,换句话说我们必须找到这个函数的最大值的和。另外我们还需要一个最佳失真值才行。

我们使用Python模块中的RectBivariateSpline函数来參数化几何失真并用Scipy函数进行优化。得到如下结果:

总而言之这个方法缓慢且不稳定,所以坚决不打算使用这个方案

我们通过组连接识别发现文本,并识别完整的单词

识别通过连接组发现的文本

对于文本识别,我们使用卷积神经网络(CNN)接收相关字体进行培训输絀部分,我们通过对比来提升概率我们那个几个最初的几个选项多对比,发现有99%的准确识别率后又通过对比字典来提高准确度,并消除相关类似的字符如"З" 和 "Э"造成的错误。

然而当涉及嘈杂的文本时,该方法性能却十分低下

当文本太嘈杂的时候,需要找到完整的單词才能进行单个字母的识别我们使用下面两个方法来解决这个问题:

您可以阅读这些文章,以更加深入了解 或 为此,我们使用了库來进行识别

我们使用了等宽的字体来作为人工识别样本进行训练。

训练结束后我们由利用其他数据来测试我们的神经网络,当然测試结果非常积极。这是我们得到的数据:

训练好的神经网络在简单的例子上表现十分优秀同样,我们也识别到了网格不适合的复杂情况

我们抽取的相关的训练样本,并让他通过神经网络进行训练

为了避免神经网络过度拟合,我们多次停止并修正训练结果并不断加入噺数据作为训练样本。最后我们得到以下结果:

新的网络擅长识别复杂的词汇但是简单的文字识别却并不好。

我们觉得这个卷积神经网絡可以细化识别单个字符来使文本识别更加优秀

因为收据字体是等宽的字体,所以我们决定按照字符分割字体首先,我们需要知道每個字母的宽度因此,字符的宽度尤为重要我们需要估计每个字母的长度,利用函数我们得到下图。选择多种模式来选取特定的字母寬度

我们得到一个单词的近似宽度,通过除以字符中的字母数给出一个近似分类:

这种分割方案的准确度是非常高的:

当然,也有识別不太好的情况:

分割后我们在使用CNN做识别处理

我们使用正则表达式来查找收据中购买情况。所有收据都有一个共通点:购买价格以XX.XX格式来撰写因此,可以通过提取购买的行来提取相关信息个人纳税号码是十位数,也可以通过正则表达式轻松获取同样,也可以通过囸则表达式找到NAME / SURNAME等信息

  1. 不论你选择什么方法,LSTM或者其他更加复杂的方案都没有错误,有些方法很难用但是有些方法却很简单,因识別样本而异
  2. 我们将继续优化这个项目。目前来看在没有噪声的情况下,系统性能更加优秀


著作权归作者所有。商业转载请联系作者獲得授权非商业转载请注明出处。

}

原标题:OCR票据识别:实现票据表格的自动扫描录入和电子存储

由于传统票据管理存在各类缺陷目前OCR票据识别系统的应用在我国已经相当广泛。OCR票据识别系统是指利用OCR光學字符识别技术专门针对票据特点定制的一种票据格式的表格自动录入系统,能够实现票据表格的自动扫描、录入和电子存储可以帮助相关行业领域加快无纸化、电子化办公进程,从根本上提高工作效率

作为国内OCR技术的领航者厦门云脉,针对如今市场上对于海量票据信息的录入需求以及对市场的深入调研和对金融票据处理的深刻理解,如今全面推出自主研发的云脉票据识别SDK并在云脉OCR SDK开发者平台开放票据识别API接口,目前已经成功与上百家企事业单位展开技术合作

云脉OCR SDK开发者平台通过以SaaS模式来提供票据识别技术,它打破传统的模式从线下嵌入SDK模式获得票据识别功能到直接接入API,从线下识别到云识别将票据识别变得更简单。开发者或者系统集成运营商只要登录注冊后就能自助的接入票据识别API接口。

云脉票据识别SDK特色介绍:

云脉票据识别SDK可扫描识别各类纸质票据、表格、单证可与政府、企事业單位、工商、汽车、4S店等多个行业的业务流程系统无缝结合,辅助企业人员进行票据扫描识别等单据的信息录入

云脉票据识别SDK采用成熟嘚云脉OCR技术,通过创建票据的模板将票据图片分解成多个不同类型的元素,逐个对元素进行识别分别将数据提取出来。只要将云脉票據识别SDK嵌入到软件中就可以轻松实现纸质票据的智能录入,可以帮企业处理大量纸质票据、单证和各类表格的快速录入从而大大提高叻数据录入的效率并节约了大量人工成本。

1、云脉票据识别可快速精准识别各类票据自动查找模板将图片分类,比如银行汇票、国地税發票、证件等;

2、云脉票据识别服务支持jpg、jpeg、bmp(24位位图)格式图片识别最大可上传5M;

3、云脉票据识别SDK支持IOS、安卓、WINDOWS及服务端平台等多类岼台;

5、识别速度快,单张平均识别时间小于2秒;识别率高字符识别率>96%,栏目识别率>97%

}

我要回帖

更多关于 免费版汉王OCR 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信