想从事深度学习工作的进来看，经典面试问题帮你整理好了-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　更新几个面试被问到或者联想出来的问题，后面有时间回答。下面就随嵌入式小编一起来了解一下相关内容吧。

　　SGD 中 S(stochastic)代表什么

　　个人理解差不多就是Full-Batch和Mini-Batch

　　监督学习/迁移学习/半监督学习/弱监督学习/非监督学习?

　　本笔记主要问题来自以下两个问题，后续会加上我自己面试过程中遇到的问题。

　　深度学习相关的职位面试时一般会问什么?会问一些传统的机器学习算法吗?

　　如果你是面试官，你怎么去判断一个面试者的深度学习水平?

　　以下问题来自@Naiyan Wang

　　CNN最成功的应用是在CV，那为什么NLP和Speech的很多问题也可以用CNN解出来?为什么AlphaGo里也用了CNN?这几个不相关的问题的相似性在哪里?CNN通过什么手段抓住了这个共性?

　　Deep Learning -Yann LeCun, Yoshua Bengio & Geoffrey Hinton

　　Learn TensorFlow and deep learning, without a Ph.D.

　　The Unreasonable Effectiveness of Deep Learning -LeCun 16 NIPS Keynote

　　以上几个不相关问题的相关性在于，都存在局部与整体的关系，由低层次的特征经过组合，组成高层次的特征，并且得到不同特征之间的空间相关性。如下图：低层次的直线/曲线等特征，组合成为不同的形状，最后得到汽车的表示。

　　CNN抓住此共性的手段主要有四个：局部连接/权值共享/池化操作/多层次结构。

　　局部连接使网络可以提取数据的局部特征;权值共享大大降低了网络的训练难度，一个Filter只提取一个特征，在整个图片(或者语音/文本) 中进行卷积;池化操作与多层次结构一起，实现了数据的降维，将低层次的局部特征组合成为较高层次的特征，从而对整个图片进行表示。如下图：

　　上图中，如果每一个点的处理使用相同的Filter，则为全卷积，如果使用不同的Filter，则为Local-Conv。

　　为什么很多做人脸的Paper会最后加入一个Local Connected Conv?

　　DeepFace: Closing the Gap to Human-Level Performance in Face Verification

　　以FaceBook DeepFace 为例：

　　DeepFace 先进行了两次全卷积+一次池化，提取了低层次的边缘/纹理等特征。

　　后接了3个Local-Conv层，这里是用Local-Conv的原因是，人脸在不同的区域存在不同的特征(眼睛/鼻子/嘴的分布位置相对固定)，当不存在全局的局部特征分布时，Local-Conv更适合特征的提取。

　　以下问题来自@抽象猴

　　什麽样的资料集不适合用深度学习?

　　数据集太小，数据样本不足时，深度学习相对其它机器学习算法，没有明显优势。

　　数据集没有局部相关特性，目前深度学习表现比较好的领域主要是图像/语音/自然语言处理等领域，这些领域的一个共性是局部相关性。图像中像素组成物体，语音信号中音位组合成单词，文本数据中单词组合成句子，这些特征元素的组合一旦被打乱，表示的含义同时也被改变。对于没有这样的局部相关性的数据集，不适于使用深度学习算法进行处理。举个例子：预测一个人的健康状况，相关的参数会有年龄、职业、收入、家庭状况等各种元素，将这些元素打乱，并不会影响相关的结果。

　　对所有优化问题来说, 有没有可能找到比現在已知算法更好的算法?

　　机器学习-周志华

　　没有免费的午餐定理：

　　对于训练样本(黑点)，不同的算法A/B在不同的测试样本(白点)中有不同的表现，这表示：对于一个学习算法A，若它在某些问题上比学习算法 B更好，则必然存在一些问题，在那里B比A好。

　　也就是说：对于所有问题，无论学习算法A多聪明，学习算法 B多笨拙，它们的期望性能相同。

　　但是：没有免费午餐定力假设所有问题出现几率相同，实际应用中，不同的场景，会有不同的问题分布，所以，在优化算法时，针对具体问题进行分析，是算法优化的核心所在。

　　用贝叶斯机率说明Dropout的原理

　　Dropout as a Bayesian Approximation: Insights and Applications

　　何为共线性, 跟过拟合有啥关联?

　　Multicollinearity-Wikipedia

　　共线性：多变量线性回归中，变量之间由于存在高度相关关系而使回归估计不准确。

　　共线性会造成冗余，导致过拟合。

　　解决方法：排除变量的相关性/加入权重正则。

　　说明如何用支持向量机实现深度学习(列出相关数学公式)

　　这个不太会，最近问一下老师。

　　广义线性模型是怎被应用在深度学习中?

　　A Statistical View of Deep Learning (I): Recursive GLMs

　　深度学习从统计学角度，可以看做递归的广义线性模型。

　　广义线性模型相对于经典的线性模型(y=wx+b)，核心在于引入了连接函数g(.)，形式变为：y=g−1(wx+b)。

　　深度学习时递归的广义线性模型，神经元的激活函数，即为广义线性模型的链接函数。逻辑回归(广义线性模型的一种)的Logistic函数即为神经元激活函数中的Sigmoid函数，很多类似的方法在统计学和神经网络中的名称不一样，容易引起初学者(这里主要指我)的困惑。下图是一个对照表：

　　什麽造成梯度消失问题? 推导一下

　　Yes you should understand backdrop-Andrej Karpathy

　　How does the ReLu solve the vanishing gradient problem?

　　神经网络的训练中，通过改变神经元的权重，使网络的输出值尽可能逼近标签以降低误差值，训练普遍使用BP算法，核心思想是，计算出输出与标签间的损失函数值，然后计算其相对于每个神经元的梯度，进行权值的迭代。

　　梯度消失会造成权值更新缓慢，模型训练难度增加。造成梯度消失的一个原因是，许多激活函数将输出值挤压在很小的区间内，在激活函数两端较大范围的定义域内梯度为0。造成学习停止　

　　以下问题来自匿名用户

　　Weights Initialization. 不同的方式，造成的后果。为什么会造成这样的结果。

　　几种主要的权值初始化方法： lecun_uniform / glorot_normal / he_normal / batch_normal

　　lecun_uniform:Efficient BackProp

　　glorot_normal:Understanding the difficulty of training deep feedforward neural networks

　　he_normal:Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification

　　batch_normal:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

　　为什么网络够深(Neurons 足够多)的时候，总是可以避开较差Local Optima?

　　The Loss Surfaces of Multilayer Networks

　　Loss. 有哪些定义方式(基于什么?)，有哪些优化方式，怎么优化，各自的好处，以及解释。

　　Cross-Entropy / MSE / K-L散度

　　Dropout。怎么做，有什么用处，解释。

　　How does the dropout method work in deep learning?

　　Improving neural networks by preventing co-adaptation of feature detectors

　　An empirical analysis of dropout in piecewise linear networks

　　Activation Function. 选用什么，有什么好处，为什么会有这样的好处。

　　几种主要的激活函数：Sigmond / ReLU /PReLU

　　Deep Sparse Rectifier Neural Networks

　　Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification

以上是关于嵌入式中-想从事深度学习工作的进来看，经典面试问题帮你整理好了的相关介绍，如果想要了解更多相关信息，请多多关注eeworld，eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字：深度学习 CNN 引用地址：想从事深度学习工作的进来看，经典面试问题帮你整理好了

上一篇：TCL集团董事长李东生：不会因黑莓放弃TCL手机
下一篇：贸泽电子2017智造创新论坛深圳、北京站即将开启

推荐阅读最新更新时间：2024-05-03 01:36

中国将迎人工智能时代，语音产业链革新值得期待

　　近期，法国《世界报》的一篇报道引起了国内媒体的关注，源于报道将人工智能称之为新“硅谷”，并深入分析了中国人工智能大势。的确，人工智能这两年在中国国内的发展速度实在惊人，从无人问津到街知巷闻，再到与国家科技和产业革命息息相关。人工智能不再只是一个单一的新鲜词汇，它渐次成为了一个完整地、新型地产业链的核心要素。下面就随网络通信小编一起来了解一下相关内容吧。　　一举成名的背后　　相信人工智能真正为大多数人所熟知，要归功于阿尔法狗与李世石的人机大战掀起的巨大争议和讨论。但这类充满趣味性和噱头的事件，尽管满足了人们的猎奇心理，但并不能体现出人工智能的全部实力。　　实际上，在人工智能一举成名的背后，是更广泛的应用环

[网络通信]

深度学习过程的四个学习阶段

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。机器学习领域是巨大的，为了学习不迷路，可以从以下列表帮助学习。它概述深度学习的一些学习细节。阶段1：入门级入门级能够掌握以下技能：能够处理小型数据集

[嵌入式]

微软推出面向人工智能的深度学习系统：Project Brainwave

Project Brainwave是微软的一套深度学习加速平台，主要面向实时人工智能应用。其在基于云端的深度学习模型的性能和扩展性上实现了一项重大的飞跃。下面就随手机便携小编一起来了解一下相关内容吧。这并不是我们首次听到它的名字，因为微软去年时就曾多次提及。在Hot Chips 2017大会上，微软披露了Project Brainwave的更多实质性细节。微软解释了近年为Project Brainwave平台推出的FPGA(现场课编程门阵列)基础设施、并结合了神经网络处理单元。如果说过去几十年的主题是开发通用CPU来处理各种各样的计算任务，过去几个月的主题则变成了开发具有卓越表现的专用芯片，很多企业都把目标瞄向了机器学习专用芯片

[手机便携]

微软推出面向人工智能的<font color='red'>深度学习</font>系统：Project Brainwave

人工智能的演进需要高适应性的推理平台（WP023）

人工智能的演进需要高适应性的推理平台（WP023）模型大小不断增长给现有架构带来了挑战深度学习对计算能力的需求正以惊人的速度增长，其近年来的发展速度已从每年翻一番缩短到每三个月翻一番。深度神经网络（DNN）模型容量的不断提升，表明从自然语言处理到图像处理的各个领域都得到了改进——深度神经网络是诸如自动驾驶和机器人等实时应用的关键技术。例如，Facebook的研究表明，准确率与模型大小的比率呈线性增长，通过在更大的数据集进行训练，准确率甚至可以得到进一步提高。目前在许多前沿领域，模型大小的增长速度远快于摩尔定律，用于一些应用的万亿参数模型正在考虑之中。虽然很少有生产系统会达到同样的极端情况，但在这些示例中，参数数量

[工业控制]

自动驾驶汽可通过深入学习提高和发展车辆感知

自动驾驶汽车的梦想正在成为现实。通过在车辆中实现多种先进的驾驶员辅助系统（ADAS），汽车行业对于完全自动驾驶的追求正在稳步推进。如今，几乎所有汽车经销商的新款车都配备了多个摄像头、雷达和超声波传感器，可实现如辅助自动泊车、自动紧急制动、车道辅助行驶、司机疲劳驾驶警报等基于感知的各项功能。摄像头的感应功能在如今的车辆驾驶中发挥着必不可少的作用。感知系统的功能与人体具有很大的相似性。摄像头或图像传感器充当车辆的“眼睛”，数据从图像传感器发送到主处理器即人的“大脑”，然后“大脑”使用各种算法来分析和解读数据。最后，通过发送控制转向、加速器或者制动的命令（类比向手和脚发出的指令）来做出各种行为。在过去十年中，汽车感应已经从基本的后

[嵌入式]

猎豹CEO傅盛：后手机时代，中国AI的机会来了

eeworld网消息：3月25日，我受邀参加2017雪球中概股高峰论坛，跟雪球社区各位支持猎豹的朋友们分享我对深度学习的一些新思考，以下为部分演讲原文，分享给你们：最近，中国最火的两个话题：一个是人工智能，一个就是北京房价。北京房价起起伏伏，牵动了我们的心。回想，我来北京不久，被我的房东赶来赶去，实在没地方住了，咬牙在通州买了房子。我记得，那时房子均价3000多块，当时身上只有几万块。交房时，我坐在一楼小阳台，心想——一个月供三千块，还不起怎么办？后来，横下心，大不了把房子卖了，回老家。一晃几年，通州也不是当年的通州了，房价也涨成这样，四处都是哀嚎一片。那个时候，我作为北漂一族，也是一点点靠自己的努力，奋斗着。从未想到，有

[安防电子]

ZAO开局不利，怎样才能让技术被正确的使用？

刷屏的ZAO，也许就是那只正在振动翅膀的蝴蝶。核心要点 ▪ ZAO应用的技术难度并不大，没有能力进阶的提升。　　 ▪ 合成视频触达了许多人的心理底线：当视频也可以被伪造，还有什么可以甄别真实？　　 ▪ 为了提高人脸识别的安全性，研究者们已经做出了诸多尝试和努力。　　 ▪ 除了人脸识别之外，还有多种生物识别技术可供进行个人身份鉴定。　　经过一个周末的集中爆发，换脸软件ZAO的热度终于有所降温。它应用的技术并不新鲜，却让人脸合成视频第一次离普通用户这么近。　　广被诟病的用户协议、合成视频存在的安全问题使得ZAO深陷舆论漩涡——从爆红到质疑缠身，只用了不到24小时。　　但是，对ZAO的担忧与抵制并不能解决

[嵌入式]

CNN：Facebook需推出应用商店而非手机

导语：美国CNN网站上周发表署名克里斯蒂娜·沃伦(Christina Warren)的文章称，虽然Facebook手机的消息最初传出时很符合当时的市场环境，但随着行业的发展，这一理念现在似乎已经无法发挥当初的预期，也就难以再有作为。反倒是效仿亚马逊的做法，推出自己的Android应用商店，更加符合Facebook的整体定位。以下为文章全文： Facebook将于周四举行与Android有关的新闻发布会，这一消息已经在网上炸开了锅。这是否与传说中的Facebook手机有关？虽然现在还无法确定，但最近18个月来，有关Facebook手机——由HTC生产，搭载Facebook定制版Android系统——的消息早已甚嚣尘上。与此

[手机便携]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

■有奖直播报名:大联大世平集团&恩智浦 | AI 无所不在，单板电脑也可以

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中