揭开统计学性感的面纱

发布者:NanoScribe最新更新时间:2015-11-02 关键字:揭开  统计  统计学  性感 手机看文章 扫描二维码
随时随地手机看文章
 《哈佛商业评论》宣布“数据科学家”是21世纪最性感的职业,所谓性感,既代表着难以名状的诱惑,又说明了大家都不太懂这个职业做的是什么。

看到这个评价,小编就想,这说的不也是统计学么!现在大数据和工业4.0的口号响彻祖国大地,统计学在大学里可谓炙手可热;而一个学期的统计课程上下来,同学们个个都是云中望月,雾里看花;考完试之后更是哀嚎遍野。如何让这“性感”变得美好起来,不再可望而不可及呢?

SAS\R\Python等软件工具都可以帮您将课堂上学到的数据分析方法进行重新演绎和输出,但估计您想到那密密麻麻的code就开始摇头了,“要花大把的时间学代码,还要看晦涩的输出结果,只能让性感变得更加只可远观啊!” 小编在这里要给您强烈推荐SAS旗下的JMP软件,这款软件相当于SAS的窗口化应用,界面超级友好,主打interactive analysis & visualization,也就是说那些晦涩的统计参数以及输出结果都可以动态交互可视化了,真正的做到了SAS的总裁Jim Goodnight先生说的“Give everyone the power to know”。如此一来,揭开统计学“性感”的面纱就指日可待了。下面我们就来看一下JMP的特色之处吧。

动态辅助教学

有不少同学一学期读下来往往连置信区间等基本的统计学概念都不甚清楚,就更别提什么大数据分析必须要具备的统计思维了。其实一旦搞清楚这些基本概念,就相当于一只脚迈进了统计学的大门,后面再接触其他的深层次的数据分析方法自然就会豁然开朗。

下面我们就举一个正态总体均值区间估计的例子。为了了解统计学专业学生毕业后一年内的平均工资水平,我们有代表性的选取了100个该专业的毕业生做了调查,调查结果为年平均工资水平为19.91w,误差是±0.35w,置信度为95%。这里我们该如何解读这些数字呢?

样本均值为19.91w--即为抽取的100个毕业生的年工资水平均值,可以作为对总体统计学专业毕业生工作一年内的年工资水平的估计。

95%的置信水平下,估计的置信区间为19.91w±0.35w(19.56w,20.26w)

如果用类似的方式,抽取N多个类似的样本,每个样本都可以计算构造出一个置信区间,这N多个置信区间中大概会有95%会包含真正的工资水平。

上面给出的是对于置信区间在文字上的解释,借助于JMP,您可以自行进行模拟以了解置信区间的构造和原理。如下图所示,您可以在左侧设定总体的分布,抽取的样本大小,样本的数量以及置信水平;右侧就会相应的给出对总体均值的估计。图中展示的结果来自于均值为20w,标准差为2的总体,在其中抽取大小为100的样本,共抽取10000次,相应的置信水平为95%;我们可以看到

右边最上侧列出的是第10000次抽取的样本数据的直方图;

紧跟在直方图下面的是第10000次抽取的样本数据计算的均值估计和置信区间;

中间部分的图表告诉我们所有10000次抽取的样本构造的置信区间对真实的均值的覆盖情况(真实的均值为20,不是所有的置信区间都覆盖真实值);

置信区间图下面是抽取的1000次样本的样本均值平均以及样本均值的标准差,他衡量的是样本均值与总体均值的接近程度,每次抽取的样本数越多,样本均值与总体均值越接近,该值越小。均值的标准误公式σ/sqrt(n)就是对该值的估计,估计值为2/sqrt(100)=0.2.

最后一部分告诉我们构造的所有的置信区间中覆盖真实的均值水平的比例为95.03%,这95.03%即为置信水平的真正意义所在。

 

 

当然你可以改变样本的大小,抽取次数以及总体分布来观察不同分布不同抽样对均值区间估计的影响。怎么样,看到这里,是不是觉得柳暗花明又一村了。

交互分析

说到交互分析,这可以算作JMP的独门武器了。无论是你刚刚拿到数据要做探索性数据分析,还是建立复杂的统计模型,JMP都可以提供交互分析帮助您更好的解读数据。小编在这里只举一个模型刻画器的例子。模型刻画器通过可视化的方式把构建好的模型(包括各种形式的模型)动态交互的展现出来,相较于枯燥的数字,这种方式更加直接,更容易理解变量之间的关系以及相互作用机制。

 

 

模型刻画器

丰富的统计分析方法

作为SAS家族的系列产品,JMP自然也少不了各种经典的、前沿的统计分析方法,既包括决策树神经网络等数据挖掘算法,又涵盖了Lasso,Elastic Net等处理多重共线性问题的惩罚算法,还有模型比较帮助你进行模型的筛选,都可以通过一键式菜单完成分析,您可以处理多种形式的复杂数据及问题。

灵活定制

对于爱钻研爱创新爱搞怪的好学生们,JMP还提供了灵活的脚本程序,以满足你们的创作需求。看看下面这个歪歪扭扭的时钟是不是可以放在你的桌面上,或者情人节的时候,你也可以为你心仪的女同学制作一颗爱心来给她一个惊喜,只需要尽情地发挥你们的想象力和创造力哦!

 

 

其实,JMP的可视化和交互性探索分析特色就是为了培养你对数据的好奇心,让你在数据中遨游的同时,运用探索性数据分析发现规律,然后通过统计建模进行深入的业务洞察,验证想法并升华得到新的结论。这样的过程又何尝不是一种更让人着迷的“性感”呢!

关键字:揭开  统计  统计学  性感 引用地址:揭开统计学性感的面纱

上一篇:Teradata RainStor®通过归档数据增强分析功能
下一篇:交互式教学与工程统计课程生动融合

推荐阅读最新更新时间:2024-05-03 00:05

企业的人工智能状态:10个统计数据
许多新兴技术都经历了一些了炒作周期,而对于人工智能来说,炒作周期更多更长久,并且反复出现了很长一段时间。 总部位于伦敦的风险投资商MMC Ventures公司在其主题为“人工智能2019:分歧状况”的调查报告中指出,几十年来人们一直在宣传和炒作人工智能,然而这一次,越来越多的证据表明人工智能正在为黄金发展时间做好准备,特别是在商业环境中。 “自从20世纪50年代以来,人工智能发展曲线经历了七次起伏,现在已经日趋成熟。”该报告的作者、MMC Ventures公司研究主管和合作伙伴DavidKelnar表示。 (1)37%的组织已经以某种形式实施了人工智能 根据调研机构Gartner公司的2019年CIO调查显示,人工智能的应用比
[机器人]
华为麒麟980双核NPU谜底揭开:还是来自寒武纪科技
        华为麒麟970通过集成NPU神经网络单元,开启了手机AI时代,不过这个NPU并非华为自研,而是来自AI独角兽寒武纪科技的A1处理器IP。   今年,寒武纪科技发布了最新的AI 1M处理器IP,华为则带来了麒麟980,首次集成双核NPU,而且二者都是7nm制造工艺,让人不由得联想麒麟980依然采纳了寒武纪科技IP,但双方都从未披露相关信息。   10月10日的全联接2018大会上,华为首次公开AI战略,并推出了全栈全场景AI解决方案和算力强大的两款AI芯片昇腾910、昇腾310,前者更是在某些方面超过了Google、NVIDIA。   难道,麒麟980 NPU是华为自研的?   近日,寒武纪科技官
[手机便携]
DSP编程技巧之3:揭开编译器神秘面纱之程序优化
  在二三十年前人们刚开始使用 C语言 代替汇编进行开发的时候,因为当初的处理器/控制器性能很弱,而 编译器 的能力也有限,所以形成了一些 C语言 编程效率不高的印象。但是今天的硬件性能已经非常强大,而 编译器 的能力也是日新月异,如果我们不熟练掌握汇编编程中的一些关键技术,编写的汇编代码的效率已经很难超过 编译器 从 C语言 转换出来的汇编代码了。 如果我们使用C语言进行编程的话,编译器除了可以把我们的加减乘除这样的操作转换为ADD、MPY以及相关的寻址、寄存器操作外,还可以在编译产生汇编代码的过程中进行不同程度的优化。优化的过程要根据器件的特点与指令集等进行有针对性的配置,所以在不同的器件上同一段C代
[嵌入式]
DSP编程技巧之3:<font color='red'>揭开</font>编译器神秘面纱之程序优化
乍眼看上去很像腕表的性感概念手机
    如果说你的 手机 不够 时尚 ,不够拉风,那么由 设计 师Alexey Chugunnikov设计的这款 概念 手机绝对会满足你,这款名为Rollerphone的概念手机乍眼看上去如同一款时尚 腕表 ,通体的金属材质,以镭射的的形式来显示 时间 ,但不要被它的外表所迷惑,当你转到背面它内藏了一个可以伸缩的透明手机屏幕,Rollerphone内置的媒体中心,可以提供 视频 观看,在线聊天,玩 游戏 ,看书和听 音乐 。符合 人体 工程学的设计更加与人体贴合,与其他的手机相比,什么都是浮云!
[手机便携]
揭开台积电和三星iPhone 6S耗电差异之谜
    这阵子如果你买了iPhone 6S,你应该十分紧张电话里头的CPU是那个工厂生产,到底是TSMC(台积电)版,还是三星版呢?早几天开始,网上不继流出两厂A9的跑分,TSMC的A9比三星省电20%。苹果急忙出来否认三星是次货,强调正常使用只差2-3%,更把检查CPU型号的App下架,让一般用家无从得知手上CPU的型号。到底真相如何?让我这个半导体业界的行内人为大家解开谜团吧。 说在前头,苹果的官方公布没有骗大家,跑分不是正常使用。CPU只是电话中众多元件之一,还有更加耗电的LCD萤幕和无线通讯。在正常使用下,CPU根本没有多少时间在全力跑,所以就算CPU多耗电20%,平均计对续航力只有2-3%的影响,的确分别不大,大家实在
[手机便携]
中国工业机器人相关的专利申请量统计分析
中国对于工业机器人巨大的需求量让众多国外知名的机器人品牌赚的“盆满钵满”。到目前为止,“四大家族”在国内依旧占据了超过50%的市场份额。近年来国产机器人虽然在不断追赶,但是技术上的差距不是一朝一夕就能赶上的,想要实现“弯道超车”仍然需要技术的沉淀。今天我们就国产工业机器人相关专利分析进行探讨,以此为鉴,既能看到目前我国在机器人领域仍然面临的问题,也能看到我国机器人领域整体进步与迅速提升的创新势头。 中国工业机器人专利现状分析 对工业机器人技术的中国专利数据进行检索和统计分析,截止到2019年1月1日,共检索到工业机器人技术的专利申请量为7023件,其中有效专利3563件,过期专利936件,审查中专利2041件,未授权
[机器人]
以色列时报:让医疗技术也性感的10大趋势
      人如果身体健康,就会很性感。身体健康的人回头率就会高。     近期的消费类电子产品展览会(CES)就展示了技术是如何影响我们生活的方方面面的——健康也算其中之一。消费类电子产品展览会不仅是一场关于电子产品、电视和电器的展览,同时也是一场健康展。     尽管全球领先品牌如英特尔、高通、三星、松下等在移动健康、可穿戴技术等领域都已经展示出很多新技术。但在展览中,也不乏上百家初创企业通过创新和技术担起责任,引领健康潮流。     我们在以色列同样追求最新技术,密切关注这个创业国度的动态。去年以色列的技术投资再创新高。我们接下来介绍的十大趋势将会在2015年对我们的身体健康带来翻天覆地的影响。让我们来看看它
[医疗电子]
揭开人工智能的面纱
是德科技全球企业和产品营销副总裁 Jeff Harris 在我们周围每一个领域,无论产品是先进还是普通,似乎都能看到人工智能(AI)的影子。利用人工智能来为产品赋能,光是想想就已经让人心驰神往,因此您自然会相信这样的主张。然而,大部分的主张并没有说明人工智能的作用,也没有说明制造商凭什么可以信心十足地做出这样的主张。我内心属于工程师的那一面总是对物品的构建方法充满好奇。之所以如此,是因为我对“黑匣子”这个理念不感冒——这个理念认为我们不需要了解计算如何进行编程。 那么,就让我们一起来打开这个盒子,揭开人工智能的面纱看一看。 要想实现人工智能,您首先要满足两个要素: (1)能够测量某些参数并且了解测量结果的含义;(2)学习
[测试测量]
<font color='red'>揭开</font>人工智能的面纱
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved