文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人可以理解的格式。OCR技术是实现文字高速录入的一项关键技术。
OCR技术的兴起便是从印刷体识别开始的,印刷体识别的成功为后来手写体的发展奠定了坚实的基础。印刷体识别的主要流程大致分为以下几个部分:图像预处理、版面处理、图像切分、特征提取和模型训练、识别后处理。
图像预处理
输入文本经过扫描仪进入计算机后,由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变,产生断笔、粘连和污点等干扰,所以在进行文字识别之前,要对带有噪声的文字图像进行处理。由于这种处理工作是在文字识别之前,所以被称为预处理。预处理一般包括灰度化、二值化,倾斜检测与校正,行、字切分,平滑,规范化等等。
版面处理
版面处理分为三个主要部分,版面分析、版面理解、版面重构。
版面分析将文本图像分割为不同部分,并标定各部分属性,如:文本、图像、表格。目前在版面分析方面的工作核心思想都是基于连通域分析法,后衍生出的基于神经网络的版面分析法等也都是以连通域为基础进行的。连通域是指将图像经过二值化后转为的二值矩阵中任选一个像素点,若包围其的所有像素点中存在相同像素值的像素点则视为两点连通,以此类推,这样的像素点构成的一个集合在图像中所在的区域即一个连通域。根据连通域大小或像素点分布等特征可以将连通域的属性标记出来,用作进一步处理的依据。
图像切分
图像切分大致可以分为两个主要类别,行(列)切分和字切分。经过切分处理后,才能方便对单个文字进行识别处理。
特征提取与模型训练
特征提取与模型训练在深度学习广泛应用于图像识别领域之前,模板匹配是较为常见的一种识别方式,之后由于神经网络的复苏,基于反馈的神经网络给OCR领域带来了又一春。现在随着计算机硬件计算能力的提升,利用大批数据训练深度神经网络在图像识别方面取得了傲人的成绩。
特征提取是从单个字符图像上提取统计特征或结构特征的过程。特征匹配是从已有的特征库中找到与待识别文字相似度最高的文字的过程。
识别后处理
识别校正是在识别结果基础上根据语种的语言模型进行,当然在单文种识别中相对容易一些,而在多语种则较为复杂。
OCR的应用案例有哪些
印刷体识别应用扩展较多且技术发展较为成熟,无论在识别准确率方面还是在识别效率方面,都达到了较高的标准。
车牌识别
车牌识别系统是OCR工业化应用较早而且成功的典型案例,如今从停车场到小区门禁,车牌识别技术已走进生活的各个角落。
验证码识别
验证码的主要目的是强制人机交互来抵御机器自动化攻击的。验证码作为一种辅助安全手段在Web安全中有着特殊的地位,验证码安全和web应用中的众多漏洞相比似乎微不足道,但是千里之堤毁于蚁穴,有些时候如果能绕过验证码,则可以把手动变为自动,对于Web安全检测有很大的帮助。
关键字:人工智能 OCR 面部识别
引用地址:
人工智能之OCR识别技术简析
推荐阅读最新更新时间:2024-03-16 11:24
人工智能忒火爆 行业大咖泼“冷水”
18.6万平方米的展览面积,500多家国内外知名企业参展,28个国家和地区的百余名外宾与会,501个重大项目签约合计投资约6120亿元,挤满站厅的参观市民。23日,由科技部、工信部、中国科学院、中国工程院、中国科学技术协会和重庆市人民政府共同主办的2018中国国际智能产业博览会在重庆开幕,政府、企业、市民对于人工智能的热情在展会上展露无遗。智能化发展到底如何、未来会如何发展?在智博会大数据智能化高峰会上,来自人工智能领域的专家和企业大咖演讲中给火爆的人工智能泼了一盆“冷水”。 人工智能发展有“虚火” 据统计,中国有近8亿网民,有全世界最大的智能手机、移动支付、网络零售市场,连续六年成为 工业机器人 第一消费大国,人工智能市场规模年
[嵌入式]
人工智能诊断工具帮助医生直观地了解感染COVID后的肺部受损情况
阿卜杜拉国王科技大学(KAUST)科学家开发的一种新的计算机辅助诊断工具可以帮助克服病毒感染后监测肺部健康的一些挑战。与其他呼吸道感染一样,COVID-19也会对肺部造成持久的伤害,但医生一直在努力将这种伤害可视化。传统的胸部扫描不能可靠地检测出肺部瘢痕和其他肺部异常的迹象,因此很难跟踪有持续呼吸问题和其他COVID后并发症的人的健康和恢复情况。 KAUST开发的新方法--被称为“深部肺实质增强”(DLPE)--在标准胸部成像数据的基础上叠加人工智能算法,以揭示原本无法辨别的视觉特征,表明肺部功能障碍。 计算机科学家和计算生物学家高欣说,通过DLPE增强,“放射科医生可以发现和分析新的亚视觉肺部病变”。他补充说,对这些病
[医疗电子]
OPPO陈明永:AI不需要被神化 国际市场要深耕
电子网1月25日报道(记者 张轶群)在今天举行的“高通中国技术与合作峰会”上,OPPO CEO陈明永表示,AI不需要被神化,到头来还是要满足用户的核心需求。国际市场不能蜻蜓点水,要深耕。 谈及国际市场的开拓时,陈明永表示,不存在严格的海外和中国市场之分,好的产品是全球共同的语言。中国市场做得不错了,OPPO就逐步进入东南亚、印度等市场。但是每个市场不能蜻蜓点水,要深耕,做得不错,再下一个,顺理成章去延伸。接下来,OPPO将会进入日本和欧洲市场、为全球更多用户提供极致科技体验。 关于AI技术,陈明永指出,AI不需要被神化,到头来还是要满足用户的核心需求。OPPO在过去、现在、未来都在围绕用户的核心需求进行AI技术的应用,包括
[半导体设计/制造]
高通公司新推带有人工智能的机器人模块
高通公司推出了全新边缘机器人应用模块,提供人工智能加速和5G连接,旨在实现机器学习、异构计算和计算机视觉等功能。 被称为RB5的模块有一个专为机器人应用量身定制的高通QRB5165处理器,其异构计算架构与高通公司的第五代人工智能引擎相配合。 “机器人的关键是感知、思考、行动和交流,该平台把所有的东西都集成在了一起,”领导这个项目的Dev Singh说。 图像信号处理器(ISP)支持多达七个并行摄像头,以便于同时定位和映射(SLAM)、目标检测和分类、自主导航和路径规划。 此外,还有一个专门的视频分析引擎和高通公司专用的Hexagon Tensor加速器,以及对以太网标准的本地支持,这是一个基于以太网的工业协议,具有
[嵌入式]
无芯片不 AI !Synopsys :人工智能时代机遇与挑战并存
2016 年的春天,一场 AlphaGo 和顶级围棋高手李世石的人机世纪对战把全球推上了人工智能(AI)浪潮的新高度;继 2017 年后,今年 3 月初“人工智能”再次被写入《政府工作报告》,总理强调要加强新一代 AI 研发的应用,在医疗、养老、教育、文化和体育等多领域推进 AI 的应用和落地。毋庸置疑,AI 是目前最热门的话题之一。 Synopsys 中国区副总经理沈莉 “这是最好的时代,因为我们都在做 AI,这也是最坏的时代,因为我们都在做 AI,机遇和挑战并存。”Synopsys 中国区副总经理沈莉在“人工智能芯片设计及应用论坛第二期上海站”上致辞表示。 在人工智能芯片设计及应用论坛第一期北京站上,来自高通,百度、地平线
[手机便携]
人工智能和数学变换用于电能质量的研究综述
近年来,由于故障、动态运行和非线性负荷的加入,使动态电能质量问题越来越复杂,因此电能质量的问题重新受到关注。特别是随着小波理论自身的发展和世界范围内小波分析算法研究热潮的兴起,以及各种人工智能技术在电力系统的成功应用,对动态电能质量扰动的起因和来源有了很好的理解,对动态电能质量的识别、检测、分类和统计有了很 好的解决办法。为了在现有研究成果的基础上,进一步对动态电能质量进行研究,明确尚需进行的工作,在大量查阅各种国际会议、学术刊物上发表的电能质量论文后,本文综述了近年来人工智能和傅立叶变换、短窗傅立叶变换和小波变换在电力系统电能质量评估应用中的主要成果与方法,并提出若干需要解决的问题,已资抛砖引玉。 关键词 : 傅立叶变换;小
[电源管理]
智能音箱市场未来将会达到怎样规模?
人工智能最近两年爆发式增长,智能音箱已经成为当下最热门的硬件产品之一。眼看一年一度的双十一年终大促来临,巨头们大战持续升温,频发补贴打出历史最低价,消费者也开始着手查看各种评测。去年的双十一上,仅阿里家的智能音箱就售出了100万台之多,今年的双十一各大巨头又会擦出怎样的火花呢?这场抢人大战又鹿死谁手呢? 谁都想切一刀的蛋糕 早在2014年,亚马逊就推出了一款全新概念的智能音箱Echo,打破传统的壁垒把智能语音交互技术植入到传统的音箱中,从而有了人工智能音箱这个概念产生。仅三年时间,Echo销量就高达两千万台,变成了炙手可热的人工智能产品。 自从亚马逊在美国市场开创出一片AI语音助手的智能音箱热潮后,国内BAT、京东、米家等
[嵌入式]
AI领域刺激,今年全球半导体产值有望再成长一成
集微网消息,据台媒报道,在今天举办的国际超大型集成电路技术、系统暨应用研讨会(VLSI -TSA)及设计、自动化暨测试研讨会(VLSI-DAT)上,存储器厂商钰创董事长卢超群表示,因市场需求强劲,对今(2018)年半导体产业景气的看法乐观,预期今年全球半导体产值可望较去(2017) 年再成长一成水准,将高于原先业界预期的7% 。 对于未来半导体市场的发展,卢超群指出,在AI 领域的刺激下,半导体商机将会遍地开花,不但需要先进制程,连28 nm和 90 nm等特殊制程需求也有机会成长。观察目前包含硅晶圆、存储器和被动元件的缺货情况,均显示出下游市场的需求强劲,他预估今年半导体产值成长可望优于预期,将可达到 10% 水准,这也优于业界
[手机便携]