为什么AI工程师那么贵?和数学有关

发布者:RadiantBlossom最新更新时间:2018-07-30 来源: eefocus关键字:人工智能  神经网络  机器学习 手机看文章 扫描二维码
随时随地手机看文章

数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上,要了解人工智能,首先要掌握必备的数学基础知识,具体来说包括:

 

线性代数:如何将研究对象形式化?

 

概率论:如何描述统计规律?

 

数理统计:如何以小见大?

 

最优化理论: 如何找到最优解?

 

信息论:如何定量度量不确定性?

 

形式逻辑:如何实现抽象推理?

 

线性代数:如何将研究对象形式化?

事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。而在向量和矩阵背后,线性代数的核心意义在于提供了⼀种看待世界的抽象视角:万事万物都可以被抽象成某些特征的组合,并在由预置规则定义的框架之下以静态和动态的方式加以观察。

 

着重于抽象概念的解释而非具体的数学公式来看,线性代数要点如下:线性代数的本质在于将具体事物抽象为数学对象,并描述其静态和动态的特性;向量的实质是 n 维线性空间中的静止点;线性变换描述了向量或者作为参考系的坐标系的变化,可以用矩阵表示;矩阵的特征值和特征向量描述了变化的速度与方向。

 

总之,线性代数之于人工智能如同加法之于高等数学,是一个基础的工具集。

 

概率论:如何描述统计规律?

除了线性代数之外,概率论也是人工智能研究中必备的数学基础。随着连接主义学派的兴起,概率统计已经取代了数理逻辑,成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天,概率论已经在机器学习中扮演了核心角色。

 

同线性代数一样,概率论也代表了一种看待世界的方式,其关注的焦点是无处不在的可能性。频率学派认为先验分布是固定的,模型参数要靠最大似然估计计算;贝叶斯学派认为先验分布是随机的,模型参数要靠后验概率最大化计算;正态分布是最重要的一种随机变量的分布。

 

数理统计:如何以小见大?

在人工智能的研究中,数理统计同样不可或缺。基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释,只有做出合理的解读,数据的价值才能够体现。数理统计根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。

 

虽然数理统计以概率论为理论基础,但两者之间存在方法上的本质区别。概率论作用的前提是随机变量的分布已知,根据已知的分布来分析随机变量的特征与规律;数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。

 

用一句不严谨但直观的话讲:数理统计可以看成是逆向的概率论。 数理统计的任务是根据可观察的样本反过来推断总体的性质;推断的工具是统计量,统计量是样本的函数,是个随机变量;参数估计通过随机抽取的样本来估计总体分布的未知参数,包括点估计和区间估计;假设检验通过随机抽取的样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率。

 

最优化理论: 如何找到最优解?

本质上讲,人工智能的目标就是最优化:在复杂环境与多体交互中做出最优决策。几乎所有的人工智能问题最后都会归结为一个优化问题的求解,因而最优化理论同样是人工智能必备的基础知识。最优化理论研究的问题是判定给定目标函数的最大值(最小值)是否存在,并找到令目标函数取到最大值 (最小值) 的数值。 如果把给定的目标函数看成一座山脉,最优化的过程就是判断顶峰的位置并找到到达顶峰路径的过程。

 

通常情况下,最优化问题是在无约束情况下求解给定目标函数的最小值;在线性搜索中,确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数;置信域算法的思想是先确定搜索步长,再确定搜索方向;以人工神经网络为代表的启发式算法是另外一类重要的优化方法。

 

信息论:如何定量度量不确定性?

近年来的科学研究不断证实,不确定性就是客观世界的本质属性。换句话说,上帝还真就掷骰子。不确定性的世界只能使用概率模型来描述,这促成了信息论的诞生。

 

信息论使用“信息熵”的概念,对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释,并在世界的不确定性和信息的可测量性之间搭建起一座桥梁。

 

总之,信息论处理的是客观世界中的不确定性;条件熵和信息增益是分类问题中的重要参数;KL 散度用于描述两个不同概率分布之间的差异;最大熵原理是分类问题汇总的常用准则。

 

形式逻辑:如何实现抽象推理?

1956 年召开的达特茅斯会议宣告了人工智能的诞生。在人工智能的襁褓期,各位奠基者们,包括约翰·麦卡锡、赫伯特·西蒙、马文·闵斯基等未来的图灵奖得主,他们的愿景是让“具备抽象思考能力的程序解释合成的物质如何能够拥有人类的心智。”通俗地说,理想的人工智能应该具有抽象意义上的学习、推理与归纳能力,其通用性将远远强于解决国际象棋或是围棋等具体问题的算法。

 

如果将认知过程定义为对符号的逻辑运算,人工智能的基础就是形式逻辑;谓词逻辑是知识表示的主要方法;基于谓词逻辑系统可以实现具有自动推理能力的人工智能;不完备性定理向“认知的本质是计算”这一人工智能的基本理念提出挑战。

 

《人工智能基础课》全年目录

本专栏将围绕机器学习与神经网络等核心概念展开,并结合当下火热的深度学习技术,勾勒出人工智能发展的基本轮廓与主要路径。

 

 

人工智能的核心就是机器学习(Machine Learning),它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。

 

 

机器学习是一个非常广泛和丰富的领域,几乎在每个行业都有应用。因为要学习的东西太多,初学者很容易发慌,而且在面对很多个模型时也很容易迷失,看不到大局。

 

因此,我们把机器学习大概划分为九个部分,我们通过这九个部分内容也就能知道为什么我们需要这样的数学基础。

 

ML整体学习:

基本的机器学习原理,比如方差权衡这些知识。

 

 

优化:

为模型发现最优参数的算法。

 

 

数据预处理:

处理缺失数据、偏态分布、异常值等。

 

 

取样和拆分

怎样拆分数据集来调整参数和避免过度拟合。

 

 

监督式学习

使用分类和回归模型从标记数据中学习。

 

 

 

非监督式学习

使用因素和集群分析模型从非标记数据中学习。

 

 

模型评估

根据不同的性能度量做出决策。

 

 

集成学习

将不同模型相结合,达到更好的性能。

 

 

 

 

商业应用

机器学习如何帮助不同类型的商业业务。

 

 

人工智能领域和其他最新发展的技术一样是一个奠基数理科学上的一门技术。

 

 

除了数学基础,还需要哪些知识呢?

1)所以最基础知识就是数学,也看到有的回答说需要逻辑。这个也是对的,其实严格上来讲逻辑与数学也不分家。多少数学家想把完备的数学大厦建立在逻辑的基础上 ,后来还是失败了(搜索David Hilbert, Bertrand Rusell)。这种失败也是逻辑学家哥德尔(Kurt Godel)用数学的方法来完成的。 离散数学中讲到的很多就是逻辑,也是计算机科学发展的基础。 一句话计算机与数学不分家,人工智能一般还是认为是计算机科学或信息科学的一个分支,所以一样离不开数学。

 

2)作为一个普通的人工智能工程师,不是所有的数学都需要。 主要是高等数学(微积分、优化)、线性代数、概率与统计这三门是非常重要而且必要的数学基础。 很难相信不懂什么是高斯分布可以用贝叶斯方法做推理,不懂线性代数可以理解高维空间流形,不懂微积分可以理解反向传播,和不懂优化能理解SVM. 这些必要的数学基础,也是在教机器学习和数据挖掘中一次次被复习的内容。 甚至很多课程要花大量的时间,确定学生有这样的基础。

 

3)编程是实现人工智能的方法,我们懂了理论,就要实践,代码是我们实现我们算法的唯一路径。如果我们代码能力不好,我们无法正确表述我们的理论模型,无法发现代码中的错误还以为是理论错了。甚至不够熟练,会把一个简单问题,变得很复杂,是算法的计算复杂度超级大,需要很长的时间求解。 我印象中一个特别清晰的例子,一个算法中涉及到的一步是从一个超大的数据库中需要找到3个最大的数,结果一个学生把整个数据库进行排序算法之后取前三个,可想而知。这个算法能快吗?还有跟多的例子是我们设计了一个算法,最后结果出来不是对,我们就研究、讨论、分析和各种办法想理解我们以前的想法哪里错了,结果呢,经常是一个Bug!

 

4) 英文能力,人工智能学科发展快。大部分文献是英文的,代码的解释也是英文的。很多技术博客等等,都是英文中有大量的优秀资源,不是中文中就没有,但是英文好会让你学习的能力事半功倍,可以追到前沿,直接看MIT,Berkeley, Standford, CMU教授的一手课程和笔记。

 


关键字:人工智能  神经网络  机器学习 引用地址:为什么AI工程师那么贵?和数学有关

上一篇:AI和机器人能否统治未来制造业?
下一篇:清华大学发布全面的 NLP 报告

推荐阅读最新更新时间:2024-05-03 03:08

人工智能在医疗保健行业有望达到60亿美元
据一项新的分析报告显示,随着人口健康需求和对于借助机器为患者提供 医疗 服务接受度的越来越大,三年内,人工智能市场产值将达60亿美元。 在HIMSS18年会上,咨询公司埃森哲发布了一份新报告。报告显示,到2021年,医疗保健业的人工智能市场将达到66亿美元,与2014年的6亿美元相比,得到了大幅提升。 埃森哲咨询公司主管健康业务的Kaveh Safavi博士表示:“在医疗保健之外领域的体验推动下,消费者日益要求使用数字技术来控制自己何时、何地、如何接受护理服务。” 据埃森哲对3000多名消费者的调查显示,五分之一的美国消费者已经在使用“基于人工智能”的医疗保健服务,无论它们是机器人、“虚拟临床医生”还是“家庭诊断”。 众多企业和风
[医疗电子]
智能音箱产业的最大瓶颈竟然是AI技术?
对于中国市场上的后来者来说,想要复制 亚马逊 Echo的成功并不容易。   8月中旬,来自市场调查机构Canalys的2018年Q2全球 智能音箱 出货量数据显示,作为昔日“领头羊”的亚马逊Echo(410万台),再次被谷歌(540万台)超越,阿里巴巴(300万台)和小米(200万台)分别位列全球第三、第四。   阿里巴巴达摩院人工智能实验室总经理浅雪     日益增长的出货量凸显巨头高歌猛进的势头。十分亮眼的是,后起的中国市场贡献了近一半的智能音箱出货量。中商产业研究院数据显示,2018年中国智能音箱市场规模将达到3.3亿元。国内外的分析师一致认为,中国的智能音箱市场潜力无限,未来或赶超美国。   智能音箱被称为“智能家
[嵌入式]
英特尔的AI雄心,正在2023 ON技术创新大会上崭露头角
美国加州圣何塞9月19日,2023英特尔ON技术创新大会正式开幕。这是英特尔第三次召开on技术创新大会,这是英特尔第一次全面的展现公司AI能力的技术展示,而为了让演示更丰富,在英特尔CEO Pat Gelsinger的90分钟演讲过程中,有一半时间留给了客户及合作伙伴。 此次Pat穿得定制版T恤,使用Python语言格式显示,并突出了包括开放、选择、信任、AI、客户端、边缘、云七大关键词。 “更充足、更强大、更实惠的处理能力是世界各地经济增长的重要组成部分。”Pat在宣布英特尔发布开发者云时强调。英特尔云允许开发人员在英特尔全系产品上构建和测试应用,其中包括了Gaudi、第四代志强、Max系列CPU和数据中心GPU,此
[半导体设计/制造]
英特尔的<font color='red'>AI</font>雄心,正在2023 ON技术创新大会上崭露头角
Canalys:2027年将有60%的个人电脑兼容AI功能,出货量预计超1.75亿台
根据市场调查机构 Canalys 公布的最新报告,在当前 AI 浪潮中,个人电脑作为企业和消费者现代工作和休闲的核心工具,如今将在软硬件能力层面上面临翻天覆地的转型,从而迎接 AI 大规模普及。 Canalys 认为,“兼容 AI”的个人电脑必须配备可加快 AI 计算的芯片组或模块。在当前市场格局下,主要的实例包括高通的 Hexagon 张量加速器、苹果的神经引擎、英特尔的 Movidius VPU 和 AMD 的 APU。 图源 Canalys 官方公众号 AI 专用芯片组将成为支持 AI 个人电脑的关键 Canalys 表示,随着生成式 AI 的持续普及,企业和消费端正积极融入 AI 的功能特点,以提升工作效率和休闲体验。
[家用电子]
人工智能 VS 芯片工程师
最近,来自清华大学等单位的研究团队发表了使用基于强化学习人工智能做自动化毫米波电路(论文中的例子是滤波器)的设计。根据论文结果,使用人工智能算法实现的滤波器设计能达到和真人工程师相近的指标,而有趣的是人工智能算法得到的滤波器的形状则较为不规则(下图中的a和d是真人工程师的设计,b和e是人工智能算法的设计)。 相关报道得到了电路设计领域的关注,不少朋友对于算法能自动设计出指标和真人设计接近的滤波器表示惊讶,并希望未来能有更多这样基于人工智能的自动化算法来加速电路设计。 在笔者看来,这样的强化学习人工智能算法用于滤波器设计确实是一种学术上的突破,而在未来我们可望看到更多这样的突破。另一方面,事实上人工智能已经在EDA领域
[物联网]
<font color='red'>人工智能</font> VS 芯片工程师
AI聊天机器人可根据对话内容推断用户信息?
在数字时代,我们与AI的交互越来越频繁,从智能家居到手机应用,AI在各个领域都有广泛的应用。其中,聊天 机器人 以其便捷、高效的特点受到了大众的欢迎,成为备受瞩目的热门领域。 无论是OpenAI的ChatGPT,还是Google的Bard,这些聊天机器人都是通过从互联网上获取的大量数据进行训练,并与用户进行交互。 然而,你是否想过,在你与聊天机器人轻松愉快地交流时,它可能正在悄然窥探你的秘密? AI聊天机器人如何推断用户信息? 最近,苏黎世联邦理工学院(ETH Zurich)的计算机科学家们,研究发现A一聊天机器人可能会根据与用户的对话内容,推断出用户例如居住地、种族、性别等个人隐私信息。尽管这一研究尚未经过同行评审,但仍引发
[机器人]
OPPO A5发布:4230mAh大电池+AI双摄
OPPO A5作为一款该性价比产品,该机采用了超视野全面屏、幻镜纹理设计,配备4230mAh超大电池和AI拍照等功能,针对人群为喜欢时尚设计与拍照的年轻用户。据悉OPPO A5 4+64GB版售价1500元,该机将于7月13日正式开售。   外观方面,OPPO A5采用了时下流行的刘海屏,屏幕尺寸为6.2英寸,比例19:9。搭配窄边框设计,屏幕使用率更高,在看视频时更有沉浸感,玩游戏时有更广的视野范围。   同时,OPPO A5拥有独特的幻镜纹理设计,灵感来自万华镜,采用微纳米工艺,光织纹,光线交织形成的纹理,使平面的手机后盖呈现出具有深度的空间感与立体感,灵动又富有变化,诠释出一种不确定性的艺术之美。   拍照方面,OPPO
[手机便携]
Havok AI和Havok Physics助力NCsoft®《激战2》
旧金山--(美国商业资讯)--领先的游戏技术开发商Havok授权将其Havok AI(Havok人工智能引擎)和Havok Physics(Havok物理引擎)软件用于NCsoft®和ArenaNet的网游大作——《激战2》(Guild Wars 2®)。有了这两项技术,一台服务器就可以容纳数以千计的《激战2》玩家。 《激战2》不同于其他大型多人在线网游(MMO),这款游戏在玩法上采用了互动性的设计,让玩家可以通过与游戏的互动来直接改变游戏中世界的形势,为每个玩家带来不同的体验。自推出以来,这款游戏斩获了大量奖项和荣誉,包括被IGN和GameSpot评为“2012年度最受期待游戏”和G4的“2012年度最佳大型多人在线网游”奖项
[半导体设计/制造]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved