苹果推高精度手写识别系统,可准确识别3万字符集

发布者:Changfeng520最新更新时间:2017-09-29 来源: 电子产品世界关键字:苹果  手写识别 手机看文章 扫描二维码
随时随地手机看文章

  在手机、平板和可穿戴设备不断普及的今天,手写识别比以往任何时候都重要。但这并非易事,拿汉字来说,让移动设备识别大量手写汉字字符还是个挑战。下面就随网络通信小编一起来了解一下相关内容吧。

  今天,苹果机器学习博客发表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》,介绍了苹果如何在iPhone、iPad和Apple Watch的Scribble模式中解决上述问题。

  这套基于深度学习的识别系统,能准确处理多达3万个字符。为了提高准确性,苹果研究人员还特别注意了数据的收集环境、典型字体和训练方案。他们发现,这套系统还能支持更大的字符库。

  苹果研究人员的实验表明,只要训练数据集的数量够大质量够好,准确率只会随着字符量的增加缓慢下降。量子位将这篇博客中的要点翻译整理,与大家分享——

  

 

  简介

  手写识别能够提高用户在移动设备上的体验,尤其适用于汉字这种相对复杂文字的使用者。由于汉字数量和书写样式多,手写识别确实是个大挑战。

  字母类的语言也就涉及到100多个字母的排列顺序,但在中国国家标准GB 18030-2005《信息技术中文编码字符集》中就收录了27533个字符。

  日常生活中,人们只用得到最具代表性的一小部分。因此,国标GB2312-80《信息交换用字符编码字符集·基本集》中仅包含6763个字符。中科院自动化研究所创建的CASIA数据库中所用字符有6763个,其中一级字符(常用字)3755个,二级字符(非常用字)3008个。

  然而,早期识别算法主要依赖分析笔画的构造。后来,研究人员对研究汉字整体结构的方法产生了兴趣。由于众多汉字具有相似性,汉字识别的难度加大,研究人员通过分类降低错误识别。

  在MNIST数据集的拉丁文任务中,卷积神经网络(CNN)崭露头角。因为训练数据足够大,根据需要补充合成样例,CNN无疑是最好的方法。美中不足的是,这些研究中分的类别很少。

  当我们开始研究汉字的大规模识别时,CNN似乎是个不错的选择。但这种方法需要将CNN扩展至约3万个字符,并且在嵌入设备上实时保持性能。

  

 

  系统结构

  我们采用的是CNN通用架构,类似于之前在MNIST上手写识别实验中的架构。系统结构如图所示:

  

△典型的CNN架构

  出于性能原因,我们将输入设定为一个中等分辨率的图像(48x48像素),这是普通手写汉字的大小。之后我们将它输入至特征提取层,交替进行卷积和子采样。最后一个特征提取层通过全连接层输出。

  从一个卷积层到下一个卷积层,我们选择了kernel的大小和特征映射的数量得出粗粒度特征。通过用2x2 kernel,我们对最大池化层进行了采样,每个输出层都有一个节点。

  下图展示了使用CNN的运行结果,其中“Hz-1”指的是一级字符库(3755个字符),“CR(n)”表示输入法界面排序为n的可能字符的准确度。除了常见的“最可能字”(top-1)和top-10的准确性外,我们也特意提到了top-4的准确性,因为输入法界面一开始会显示4个可能汉字,而top-4的准确性是用户体验提升的重要指标。

  

△在CASIA在线数据库3755个字符上的运行结果

  除此以外,我们对在iOS设备内部收集的额外训练数据感兴趣。此数据涵盖了更多字体样式,并包含每个字符大量的训练实例。在同一个有3775个字符测试集的训练结果如下:

  

 

  这次训练准确度有些许提高,总体来说,在测试集中出现的大多数汉字书写风格已经在CASIA训练集中得到了很好覆盖,也表明折叠训练数据不会使准确性下降,附加样式在对底层模型没有负影响。

  扩展至3万字

  我们想为用户提供从印刷体到草书等各种可能的输入字体。为了尽可能多涵盖不同的汉字书写风格,我们从中国几个地区找到了一些书法家的数据。让我们惊讶的是,大多数用户表示没有见过这些罕见的汉字。

  因此,我们又收集了不同年龄段、性别和不同教育背景的用户数据,发现了各种各样的书写风格。下图显示了样例中“花”字在楷书、草书和“随便画几笔”风格下的样本。

  

 

  事实上,在日常生活中,用户输入经常是“随便画几笔”,出现一种非常不相似的曲线变化。有时也会让系统混淆成其他字符。下图展示了我们在数据中观察到的一些具体例子。需要注意的是,有足够的训练数据能区分像Figure 7这样的草书变化很重要。

  

 

  用这种方法,我们收集了大量汉字,将可识别字符从3755增加到大约3万。

  

△30000个字符在CASIA在线数据库的结果

  为了解系统如何支持30000个手写字符识别,我们还在许多不同测试集上对其进行评估,这些测试集支持所有字体的字符。平均测试结果如下:

  

△不同字体的30000个字符在多个内部测试集的平均结果

  当然,上面两张图的结果不能直接比较,因为它们属于不同的测试集上。但我们能发现,top-1和top-4的准确性相当,top-4达到了95.1%的准确率,结果尚好。

  综上所述,我们在嵌入式设备上构建了覆盖3万个字符的高精度手写识别系统。只要有足够数量和质量的训练数据,识别准确度就不会大幅降低。未来,我们能精确识别的汉字字符还会更多。

    以上是关于网络通信中-苹果推高精度手写识别系统,可准确识别3万字符集的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字:苹果  手写识别 引用地址:苹果推高精度手写识别系统,可准确识别3万字符集

上一篇:国家存储器基地一期提前封顶 年产值可达100亿美元
下一篇:支持多种肿瘤早筛 腾讯觅影已落地七家AI医学影像实验室

推荐阅读最新更新时间:2024-05-07 17:39

苹果M1芯片MacBook Pro跑分解密:单核1714,多核6802
今日,搭载 M1 芯片的苹果新款 MacBook Air、13 英寸 MacBook Pro 和 Mac mini 正式上市,相关跑分有望相继出炉。   目前,一款型号为 MacBook Pro17,1 的 MacBook Pro 现身 Geekbench 跑分网站,应为苹果昨日发布的 13 英寸 MacBook Pro,搭载苹果专为 Mac 设计的首款芯片 M1。   Geekbench 跑分显示,这款 MacBook Pro 配备 16GB 内存,搭载 macOS 11.0 操作系统,单核得分 1714,多核得分 6802,采用 8 核处理器,基本频率为 3.20 GHz。   这与今日早些时候曝光的新款 Mac
[手机便携]
<font color='red'>苹果</font>M1芯片MacBook Pro跑分解密:单核1714,多核6802
第四季度三星扩大与苹果智能手机优势
      市场研究机构Strategy Analytics发布的最新数据显示,2013年第四季度,三星相对于苹果的智能手机优势进一步扩大。数据显示,去年第四季度,三星智能手机销量高达8600万部,创下该公司史上单季销量最高记录。相比较而言,苹果去年第四季度的iPhone销量只有5100万部。 数据显示,2013年第四季度,三星在全球智能手机市场的份额为29.6%,领先于苹果的17.6%,与此同时,中国手机制造商在低端智能手机市场的份额强劲增长,并引发了整个智能手机市场格局的大变化。 2013年第四季度,苹果智能手机销量为5100万部,尽管创下了该公司单季最高销量记录,但其全球市场份额却比前一年的22%有所下滑,从全球市场份额来看,
[手机便携]
消息称苹果新款 13 英寸 MacBook Air 确认搭载 M3 芯片
近段时间以来,我们经常会听到有关新款 MacBook Air 的传言,但它的一些细节仍不清楚。9to5Mac 现在拿到了一些证据,表明苹果确实正在开发两种不同尺寸的新一代 MacBook Air:13 英寸和 15 英寸。 不仅如此,据称该公司还在计划推出更新的 13 英寸 MacBook Pro 机型。那么,这些笔记本电脑有什么共同点呢?最新情报表明它们都将搭载全新的 M3 芯片。 正如下图所示,苹果现款 MacBook Air 可选 M1 芯片或 M2 芯片,分别采用 13.3 英寸和 13.6 英寸屏幕,其中新款 M2 机型采用了“刘海”设计,定价 9499 元起,不排除新机会更贵的可能。 此前,彭博社 M
[家用电子]
消息称<font color='red'>苹果</font>新款 13 英寸 MacBook Air 确认搭载 M3 芯片
菲尔·席勒:苹果不会为了Hey开特例改变App Store规则
6月19日上午消息,苹果公司负责营销的副总裁菲尔·席勒(Phil Schiller)对外媒对TechCrunch表示,苹果公司不会更改App Store规则,以适应“Hey”应用。该应用不愿向苹果支付30%的抽成,从而取消了内购和注册选项。 Hey应用只能登陆   席勒说,Hey应用的开发人员可以做“很多事情”,从而让该应用在现有App Store规则内运作,苹果公司“希望他们这样做”。   Hey是一款电子邮件应用程序,价格为每年99美元。该服务的订阅需要在Hey网站上购买,而不是在手机App中,因为Hey的开发人员不想向苹果公司支付30%的“苹果税”。   目前,该应用不提供应用内购买和注册选项。打开该应用后用户会直接看
[手机便携]
苹果发放最高18万美元股权激励
为了防止员工跳槽到Meta等竞争对手公司,苹果最近罕见地向工程师发放了高额股票奖金。 据彭博社报道,知情人士透露,苹果上周通知了硅设计、硬件、精选软件和运营部门的员工,将向他们发放以限制性股票形式的非周期奖金,持股期限为四年, 从而激励他们留在苹果公司。 据了解,这批奖金不属于既有薪酬方案,金额从5万到18万美元不等,据说不少工程师领到大约8万、10万或12 美元的股票。 知情人士称,苹果有时会向员工发放额外的现金奖金,但最新的股票发放规模是不同寻常的,而且时间安排得出人意料。 苹果正在与硅谷及其他地区的公司展开人才大战,Meta的威胁最大。Meta在过去几个月里从苹果挖走了大约100名工程师,同时苹果也雇佣了Meta的重要员工
[手机便携]
3D Touch变身“杀手级功能”还需再等几年
    据外媒报道,尽管不如摄像头像素与内存容量升级那样直接,但是iPhone 6s/6s Plus上的3D Touch配合iOS 9却带来了不少功能创新点。不过最近iPhone 6s/6s Plus的压力触控模块供应商TPK表示,3D Touch升级为“不可或缺”的杀手级功能估计还要至少三年时间。   TPK CEO Michael Chung称一项有潜力的新技术进入智能手机生态圈往往需要一年时间,随后才是高速增长与普及阶段,也就是说就目前来讲,在未来的一年内支持3D Touch或者类似压力触控技术的设备和应用还不会太多。   值得一提的是,有消息称三星明年上半年旗舰Galaxy S7也将配备压力触控屏,采用Synapt
[手机便携]
苹果合作后 GT公司蓝宝石业务营收将提升20倍
   本周早些时候,苹果宣布将与GT Advanced Technologies公司达成合作协议,提升蓝宝石玻璃的产量。据AllThingsD报道,生产将在苹果位于亚利桑那州的新工厂进行。在本周一的营 收大会上,GT分享了两家公司合作协议的细节。目前GT的蓝宝石业务占有公司年销售额的11%,也就是2890万美元左右。 在预测2014年营收时,公司给出的营收预测为6-8亿美元,其中80%的销售额要归功于蓝宝石业务。这意味着GT的蓝宝石业务将在2014年为公司带来4.8-6.4亿美元的营收,比2013年的营收提升了几乎20倍。这种大批量的需求意味着苹果将会更广泛的使用蓝宝石材料。 目前,苹果只在iPhone 5s的摄像头保护玻璃和
[手机便携]
苹果 Apple Silicon 芯片被曝安全漏洞,能缓解但需牺牲性能
3 月 22 日消息,安全专家近日在苹果 Apple Silicon 芯片上发现安全漏洞,被黑客利用可以窃取用户数据。专家表示该漏洞固然可以被缓解和修复,但会严重影响性能表现。 该漏洞存在于 Data Memory-Dependent Prefetcher(DMP)中,黑客利用该漏洞可以窃取加密密钥,从而访问用户的数据。 DMP 又被称作间接内存 prefetcher,位于内存系统中,可以预测当前运行代码最有可能访问的数据所在内存地址。 而黑客可以利用现有的访问模式,预测下一个要获取的数据位,从而影响正在预取的数据,访问用户的敏感数据,研究人员将这种攻击命名为“GoFetch”。 研究人员确认,黑客可以将数据伪装成一个指针,欺骗
[半导体设计/制造]
<font color='red'>苹果</font> <font color='red'>Apple</font> Silicon 芯片被曝安全漏洞,能缓解但需牺牲性能
小广播
最新网络通信文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved