苹果推高精度手写识别系统，可准确识别3万字符集-电子工程世界

　　在手机、平板和可穿戴设备不断普及的今天，手写识别比以往任何时候都重要。但这并非易事，拿汉字来说，让移动设备识别大量手写汉字字符还是个挑战。下面就随网络通信小编一起来了解一下相关内容吧。

　　今天，苹果机器学习博客发表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》，介绍了苹果如何在iPhone、iPad和Apple Watch的Scribble模式中解决上述问题。

　　这套基于深度学习的识别系统，能准确处理多达3万个字符。为了提高准确性，苹果研究人员还特别注意了数据的收集环境、典型字体和训练方案。他们发现，这套系统还能支持更大的字符库。

　　苹果研究人员的实验表明，只要训练数据集的数量够大质量够好，准确率只会随着字符量的增加缓慢下降。量子位将这篇博客中的要点翻译整理，与大家分享——

　　简介

　　手写识别能够提高用户在移动设备上的体验，尤其适用于汉字这种相对复杂文字的使用者。由于汉字数量和书写样式多，手写识别确实是个大挑战。

　　字母类的语言也就涉及到100多个字母的排列顺序，但在中国国家标准GB 18030-2005《信息技术中文编码字符集》中就收录了27533个字符。

　　日常生活中，人们只用得到最具代表性的一小部分。因此，国标GB2312-80《信息交换用字符编码字符集·基本集》中仅包含6763个字符。中科院自动化研究所创建的CASIA数据库中所用字符有6763个，其中一级字符(常用字)3755个，二级字符(非常用字)3008个。

　　然而，早期识别算法主要依赖分析笔画的构造。后来，研究人员对研究汉字整体结构的方法产生了兴趣。由于众多汉字具有相似性，汉字识别的难度加大，研究人员通过分类降低错误识别。

　　在MNIST数据集的拉丁文任务中，卷积神经网络(CNN)崭露头角。因为训练数据足够大，根据需要补充合成样例，CNN无疑是最好的方法。美中不足的是，这些研究中分的类别很少。

　　当我们开始研究汉字的大规模识别时，CNN似乎是个不错的选择。但这种方法需要将CNN扩展至约3万个字符，并且在嵌入设备上实时保持性能。

　　系统结构

　　我们采用的是CNN通用架构，类似于之前在MNIST上手写识别实验中的架构。系统结构如图所示：

△典型的CNN架构

　　出于性能原因，我们将输入设定为一个中等分辨率的图像(48x48像素)，这是普通手写汉字的大小。之后我们将它输入至特征提取层，交替进行卷积和子采样。最后一个特征提取层通过全连接层输出。

　　从一个卷积层到下一个卷积层，我们选择了kernel的大小和特征映射的数量得出粗粒度特征。通过用2x2 kernel，我们对最大池化层进行了采样，每个输出层都有一个节点。

　　下图展示了使用CNN的运行结果，其中“Hz-1”指的是一级字符库(3755个字符)，“CR(n)”表示输入法界面排序为n的可能字符的准确度。除了常见的“最可能字”(top-1)和top-10的准确性外，我们也特意提到了top-4的准确性，因为输入法界面一开始会显示4个可能汉字，而top-4的准确性是用户体验提升的重要指标。

△在CASIA在线数据库3755个字符上的运行结果

　　除此以外，我们对在iOS设备内部收集的额外训练数据感兴趣。此数据涵盖了更多字体样式，并包含每个字符大量的训练实例。在同一个有3775个字符测试集的训练结果如下：

　　这次训练准确度有些许提高，总体来说，在测试集中出现的大多数汉字书写风格已经在CASIA训练集中得到了很好覆盖，也表明折叠训练数据不会使准确性下降，附加样式在对底层模型没有负影响。

　　扩展至3万字

　　我们想为用户提供从印刷体到草书等各种可能的输入字体。为了尽可能多涵盖不同的汉字书写风格，我们从中国几个地区找到了一些书法家的数据。让我们惊讶的是，大多数用户表示没有见过这些罕见的汉字。

　　因此，我们又收集了不同年龄段、性别和不同教育背景的用户数据，发现了各种各样的书写风格。下图显示了样例中“花”字在楷书、草书和“随便画几笔”风格下的样本。

　　事实上，在日常生活中，用户输入经常是“随便画几笔”，出现一种非常不相似的曲线变化。有时也会让系统混淆成其他字符。下图展示了我们在数据中观察到的一些具体例子。需要注意的是，有足够的训练数据能区分像Figure 7这样的草书变化很重要。

　　用这种方法，我们收集了大量汉字，将可识别字符从3755增加到大约3万。

△30000个字符在CASIA在线数据库的结果

　　为了解系统如何支持30000个手写字符识别，我们还在许多不同测试集上对其进行评估，这些测试集支持所有字体的字符。平均测试结果如下：

△不同字体的30000个字符在多个内部测试集的平均结果

　　当然，上面两张图的结果不能直接比较，因为它们属于不同的测试集上。但我们能发现，top-1和top-4的准确性相当，top-4达到了95.1%的准确率，结果尚好。

　　综上所述，我们在嵌入式设备上构建了覆盖3万个字符的高精度手写识别系统。只要有足够数量和质量的训练数据，识别准确度就不会大幅降低。未来，我们能精确识别的汉字字符还会更多。

以上是关于网络通信中-苹果推高精度手写识别系统，可准确识别3万字符集的相关介绍，如果想要了解更多相关信息，请多多关注eeworld，eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字：苹果手写识别引用地址：苹果推高精度手写识别系统，可准确识别3万字符集

上一篇：国家存储器基地一期提前封顶年产值可达100亿美元
下一篇：支持多种肿瘤早筛腾讯觅影已落地七家AI医学影像实验室

推荐阅读最新更新时间：2024-05-07 17:39

苹果M1芯片MacBook Pro跑分解密：单核1714，多核6802

今日，搭载 M1 芯片的苹果新款 MacBook Air、13 英寸 MacBook Pro 和 Mac mini 正式上市，相关跑分有望相继出炉。　　目前，一款型号为 MacBook Pro17，1 的 MacBook Pro 现身 Geekbench 跑分网站，应为苹果昨日发布的 13 英寸 MacBook Pro，搭载苹果专为 Mac 设计的首款芯片 M1。　　Geekbench 跑分显示，这款 MacBook Pro 配备 16GB 内存，搭载 macOS 11.0 操作系统，单核得分 1714，多核得分 6802，采用 8 核处理器，基本频率为 3.20 GHz。　　这与今日早些时候曝光的新款 Mac

[手机便携]

<font color='red'>苹果</font>M1芯片MacBook Pro跑分解密：单核1714，多核6802

第四季度三星扩大与苹果智能手机优势

市场研究机构Strategy Analytics发布的最新数据显示，2013年第四季度，三星相对于苹果的智能手机优势进一步扩大。数据显示，去年第四季度，三星智能手机销量高达8600万部，创下该公司史上单季销量最高记录。相比较而言，苹果去年第四季度的iPhone销量只有5100万部。数据显示，2013年第四季度，三星在全球智能手机市场的份额为29.6%，领先于苹果的17.6%，与此同时，中国手机制造商在低端智能手机市场的份额强劲增长，并引发了整个智能手机市场格局的大变化。 2013年第四季度，苹果智能手机销量为5100万部，尽管创下了该公司单季最高销量记录，但其全球市场份额却比前一年的22%有所下滑，从全球市场份额来看，

[手机便携]

消息称苹果新款 13 英寸 MacBook Air 确认搭载 M3 芯片

近段时间以来，我们经常会听到有关新款 MacBook Air 的传言，但它的一些细节仍不清楚。9to5Mac 现在拿到了一些证据，表明苹果确实正在开发两种不同尺寸的新一代 MacBook Air：13 英寸和 15 英寸。不仅如此，据称该公司还在计划推出更新的 13 英寸 MacBook Pro 机型。那么，这些笔记本电脑有什么共同点呢？最新情报表明它们都将搭载全新的 M3 芯片。正如下图所示，苹果现款 MacBook Air 可选 M1 芯片或 M2 芯片，分别采用 13.3 英寸和 13.6 英寸屏幕，其中新款 M2 机型采用了“刘海”设计，定价 9499 元起，不排除新机会更贵的可能。此前，彭博社 M

[家用电子]

消息称<font color='red'>苹果</font>新款 13 英寸 MacBook Air 确认搭载 M3 芯片

菲尔·席勒：苹果不会为了Hey开特例改变App Store规则

6月19日上午消息，苹果公司负责营销的副总裁菲尔·席勒（Phil Schiller）对外媒对TechCrunch表示，苹果公司不会更改App Store规则，以适应“Hey”应用。该应用不愿向苹果支付30%的抽成，从而取消了内购和注册选项。 Hey应用只能登陆　　席勒说，Hey应用的开发人员可以做“很多事情”，从而让该应用在现有App Store规则内运作，苹果公司“希望他们这样做”。　　Hey是一款电子邮件应用程序，价格为每年99美元。该服务的订阅需要在Hey网站上购买，而不是在手机App中，因为Hey的开发人员不想向苹果公司支付30%的“苹果税”。　　目前，该应用不提供应用内购买和注册选项。打开该应用后用户会直接看

[手机便携]

苹果发放最高18万美元股权激励

为了防止员工跳槽到Meta等竞争对手公司，苹果最近罕见地向工程师发放了高额股票奖金。据彭博社报道，知情人士透露，苹果上周通知了硅设计、硬件、精选软件和运营部门的员工，将向他们发放以限制性股票形式的非周期奖金，持股期限为四年，从而激励他们留在苹果公司。据了解，这批奖金不属于既有薪酬方案，金额从5万到18万美元不等，据说不少工程师领到大约8万、10万或12 美元的股票。知情人士称，苹果有时会向员工发放额外的现金奖金，但最新的股票发放规模是不同寻常的，而且时间安排得出人意料。苹果正在与硅谷及其他地区的公司展开人才大战，Meta的威胁最大。Meta在过去几个月里从苹果挖走了大约100名工程师，同时苹果也雇佣了Meta的重要员工

[手机便携]

3D Touch变身“杀手级功能”还需再等几年

据外媒报道，尽管不如摄像头像素与内存容量升级那样直接，但是iPhone 6s/6s Plus上的3D Touch配合iOS 9却带来了不少功能创新点。不过最近iPhone 6s/6s Plus的压力触控模块供应商TPK表示，3D Touch升级为“不可或缺”的杀手级功能估计还要至少三年时间。　　TPK CEO Michael Chung称一项有潜力的新技术进入智能手机生态圈往往需要一年时间，随后才是高速增长与普及阶段，也就是说就目前来讲，在未来的一年内支持3D Touch或者类似压力触控技术的设备和应用还不会太多。　　值得一提的是，有消息称三星明年上半年旗舰Galaxy S7也将配备压力触控屏，采用Synapt

[手机便携]

与苹果合作后 GT公司蓝宝石业务营收将提升20倍

本周早些时候，苹果宣布将与GT Advanced Technologies公司达成合作协议，提升蓝宝石玻璃的产量。据AllThingsD报道，生产将在苹果位于亚利桑那州的新工厂进行。在本周一的营收大会上，GT分享了两家公司合作协议的细节。目前GT的蓝宝石业务占有公司年销售额的11%，也就是2890万美元左右。在预测2014年营收时，公司给出的营收预测为6-8亿美元，其中80%的销售额要归功于蓝宝石业务。这意味着GT的蓝宝石业务将在2014年为公司带来4.8-6.4亿美元的营收，比2013年的营收提升了几乎20倍。这种大批量的需求意味着苹果将会更广泛的使用蓝宝石材料。目前，苹果只在iPhone 5s的摄像头保护玻璃和

[手机便携]

苹果 Apple Silicon 芯片被曝安全漏洞，能缓解但需牺牲性能

3 月 22 日消息，安全专家近日在苹果 Apple Silicon 芯片上发现安全漏洞，被黑客利用可以窃取用户数据。专家表示该漏洞固然可以被缓解和修复，但会严重影响性能表现。该漏洞存在于 Data Memory-Dependent Prefetcher（DMP）中，黑客利用该漏洞可以窃取加密密钥，从而访问用户的数据。 DMP 又被称作间接内存 prefetcher，位于内存系统中，可以预测当前运行代码最有可能访问的数据所在内存地址。而黑客可以利用现有的访问模式，预测下一个要获取的数据位，从而影响正在预取的数据，访问用户的敏感数据，研究人员将这种攻击命名为“GoFetch”。研究人员确认，黑客可以将数据伪装成一个指针，欺骗

[半导体设计/制造]

<font color='red'>苹果</font> <font color='red'>Apple</font> Silicon 芯片被曝安全漏洞，能缓解但需牺牲性能

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！