CSEM的研究人员结合微型摄影机与配备蓝牙发射器的微控制器,打造出低功耗的视觉封装系统,并透过其机器学习演算法,可实现即时脸部侦测与识别...
瑞士电子与微技术中心(CESM)的研究人员开发出高效率的机器学习演算法,并用于设计出一款仅有几立方公分的低功率即时脸部侦测与识别摄影机系统。
研究人员将这款经概念验证的系统称为“视觉封装”(Vision-In-Package;VIP)系统,整合了摄影机系统,以及低功耗处理器(ARM Cortex M4/M7与8MB RAM)、高动态范围成像器、光学元件和通讯介面等。该系统仅占用约4立方公分的空间,连电池加起来的重量还不到20克,并配备一套可即时执行的完整脸部分析管线,并完全嵌入于此VIP系统中。
其软体部份十分精简且独立作业,无需外部支援。它是由精简版uKOS作业系统(在μKernel计划开发)以及执行于其上的脸部分析套件共同组成。相较于执行于强大硬体架构的现有系统,VIP系统仅需更低几十倍的CPU时间与记忆体容量,而其分析管线大约以每秒4-5格的速率执行QVGA级的解析度。
首先,该系统侦测到所有的脸部资料输入并撷取讯号格,这通常需要不到100毫秒(ms)的执行时间,而且仅需几百KB的RAM记忆体。接着,诸如眼角与鼻角等脸部特征,就会落在每次侦测到的脸部区域,并经过标准化步骤(水平校准眼睛以及缩放脸部至标准尺寸的概略几何转换步骤,以及光度测量标准化,包括移除由阴影和不均匀照明所导致的非线性强度变化),归纳出“脸部”。
然后进行实际的脸部识别,在一些特点位置撷取描述性特征,以便在脸部注册资料库中识别人物。任何时候,只需点选即可在此资料库中注册新的人脸,而无需再次进行训练。
为了实现这一点,研究人员们使用高效率的机器学习演算法,包括Adaboost、回归树的集合以及LBP演算法,并进行数百万个案例的“训练”。研究人员表示,由此产生的分类器通常仅占几百KB的空间,甚至还可快速执行在低阶行动处理器上。
该视觉封装系统还可应用在穿戴式装置、行销与广告分析(收集收视率与人口统计资料、实现更多人际互动的机器人)、电视制造商(1984年型电视机即将来临)、汽车产业(监测驾驶人是否有睡意、分心驾驶,或用于自动设定调整),以及无处不在的安全相机(日益智能化)。
- 英特尔中国正式发布2023-2024企业社会责任报告
- 贸泽电子与Analog Devices联手推出新电子书
- AMD 推出第二代 Versal Premium 系列:FPGA 行业首发支持 CXL 3.1 和 PCIe Gen 6
- SEMI:2024Q3 全球硅晶圆出货面积同比增长 6.8%、环比增长 5.9%
- 台积电5nm和3nm供应达到"100%利用率" 显示其对市场的主导地位
- LG Display 成功开发出全球首款可扩展 50% 的可拉伸显示屏
- 英飞凌2024财年第四季度营收和利润均有增长; 2025财年市场疲软,预期有所降低
- 光刻胶巨头 JSR 韩国 EUV 用 MOR 光刻胶生产基地开建,预计 2026 年投产
- Imagination DXS GPU 已获得ASIL-B官方认证