什么是 OCR ?
OCR 能够做什么应用?

OCR (Optical Character Recognition) 中文为「光学字符识别」,是指用电子装置对图片、纸本或影像中的文字进行辨识处理,取得容易存放且管理的数字文本文件的过程。
OCR 技术对于企业的数字转型有相当大的功劳,现今社会提倡无纸化概念,且用纸本保存贵重数据的旧有形式,已经无法再适用现今瞬息万变的信息化脚步,OCR 在无纸化转型之中就扮演了相当重要的角色,除此之外,OCR 结合 AI 还可用于瑕疵检测、车牌辨识、字迹辨识、自动识检验别等。
一般人最常见的 OCR 应用就是一张图片上面有文字,但我们只想撷取图片中的文字该怎么获得呢,此时利用 OCR 技术就能轻松获得文档。另外像是 Google 翻译也是 OCR 的应用,透过行动装置镜头对物体上的文字进行扫描,并立即翻译成所需的语言。
OCR 的重点
现今许多工作流程都需使用到大量的文字文件,例如业务的名片、报账的发票、客户合约等,都涉及纸本文书工作,这在存放上及管理上都有许多限制,您可能想说我可以扫描就好了,但扫描仅是保存「图像文件」,最终我们要建立数据汇入数据库,还是要使用机器能识别的「文本文件」,此时就能使用到 OCR 的技术。
举一个实际的例子,小明的团队在一次展览上收到了上千张业务的名片,在展后业务主管要求小明将所有名片都保存下来,并在建立 Excel 窗体后上传云端数据库,小明这下开始烦恼了,这么多张名片我用人工打字,要加班几天才打得完阿?这时小华建议他用 OCR 技术将名片中的客户数据撷取下来后,大大节省作业时间,也让数据有更完善的方式保存。
此外 OCR 也被大量应用在各式各样的制造业的生产流程之中,在产品线中我们可以利用机器视觉来对产品包装上的文字打印进行辨识及瑕疵检测。
OCR 在各行业的应用

制造业
在工业4.0的进程中,许多工厂都在朝向智能制造迈进,而数据电子化工作流程可视为智能制造中最重要且不可或缺的一环,透过数据电子化能够打造完整的生产履历,一步步都完善保存在中央数据库之中,可供实时追踪及累积数据,在数据为王的时代这些都将成为企业宝贵的资产,能够更加容易优化生产线并检查其中漏洞问题。

食品业
各国政府对于对于食品包装上信息的要求趋于严格,包装上的打印文字或生产、有效日期若有误,很可能面临巨额罚款,透过机器视觉搭配进行检测能够使制造商追踪从原料到产品包装的整个过程,并减少错误提高效率,产生所谓的「产品履历」。

医疗业
医疗业往往分秒必争,每天需要面对成千上万的病人,然而处理病患或家属手写的医疗病历或初诊资料,可能会使前线人员手忙脚乱,运用 OCR 技术能够快速将纸本上的数据转换为数字文文件,汇入医院或诊所的运端系统,且像是药罐、药包上细小的打印字同时也可以透过 OCR 检测辨识汇入数据库,立即匹配病患,为医疗机构建立完善档案。

金融业
传统的金融业都是以纸张为主,像是所有的传支票、月结单、发票、财务报表等,透过 OCR 技术只要扫描支票和签名即可轻易核对字迹及签名,更能将所有繁重的纸本作业快速的数字化,实时建立强大数据库。

物流业
在物流业中也常常被用来追踪包裹的条形码、地址等文字,人工手动分捡及输入信息容易出错,速度也更慢,此时用 OCR 搭配机械手臂等自动化装置便能大幅提升生产效率。
OCR 过程
透过各种光学电子设备将图像中的文文件转换为机器可识读之文字,故影像输入的分辨率越高、越清晰,
对于 OCR 越有利、正确辨识率越高。
对于 OCR 越有利、正确辨识率越高。
图像分割
将图片进行二值化突显出文字,再进行降噪及倾斜修正处理。
字符分割
将所有文字、字符、标点都切割出来。
字符细线化
将要辨识的字符线条变细,让整个文字只剩清楚的骨架结构,来消除文字边缘可能造成辨识错误的模糊区域
文字辨识
透过特征撷取和模式对比来径行文字的辨别
特征撷取
将文字进行细部分解为细小的特征像是一笔一画的线条及交叉点,靠着这些特征去比对最相近的字符。
模式比对
当文字被系统辨识后会用预先建立的文字数据库去进行比对,进而检视这个处理后的文字与数据库中最接近的为何。
经过计算机识别分析所有字后,便产出这次光学字符辨识 OCR 的档案。
OCR 的不同种类
依据我们的产业需求及应用的不同, OCR 技术也被分为下列几类:
最简易的 OCR 软件
较简易的 OCR 软件便是将各种不同的文字及字型模式来当样本,用模式比对的方法来比对接收到的文字跟数据库中样本是否雷同。
比 OCR 更加强化的 ICR
ICR (Intelligence Character Recognition) 智能字符辨识技术是将 OCR 技术做更强大的延伸,ICR 是一种识别手写文本的技术,但是这种技术也有其局限性,ICR 更擅长识别结构化的手写字迹,像是每个字必须有均匀的间隔,例如在稿纸上书写,或是带有框格的字段。
比 ICR 更加强化的 IWR
IWR (Intelligence Word Recognition) 智能字词辨识又比 ICR 更加延伸,简单来说,ICR 更擅长字符辨识,IWR 则能够对单词、短语甚至句子来做匹配识别,举例像 ICR 能够辨识 ”C”、”A”、”T”,但 IWR 会选择整个单词 “CAT”,它通过比对互联网数据库中的单词自动纠正拼写错误,并根据整个句子的结构给出模糊匹配。