什么是p值?为何专家为它争论不休

发布者:532829319hmk最新更新时间:2018-03-07 来源: eefocus关键字:论文  谷歌  文档 手机看文章 扫描二维码
随时随地手机看文章

72位学术大牛一起发了篇论文,引来87位作者署名的反驳论文。对于统计学上牵动人心的P值要多小才能算结果显著,科学家们开始了一场大规模论战,甚至用上了谷歌共享文档

 

荷兰埃因霍温理工大学的心理学家丹尼尔·莱肯斯(Danil Lakens)以心直口快闻名。2017年7月22日,他在读完一篇标题为《重新定义统计显著性》的预印本论文后,毫不留情地在推特上开喷:“一群聪明人给出这么恐怖的糟糕建议,我对此非常失望。”这篇被喷的论文由70位著名的科学家共同完成,两个月后发表在了知名期刊《自然-人类行为》上。

 

发起反驳论文的作者丹尼尔·莱肯斯

 

而让莱肯斯抓狂的原因是:这篇论文建议降低在众多实验中使用的显著性阈值,让p值低于0.005而非现在使用的0.05时才能算作结果显著。科学家们希望用这种方式降低假阳性率,提高科学实验的重现率。

 

但是37岁的莱肯斯认为这是一个灾难性的想法。在一个更低的显著性阈值要求下,需要更大的样本量才能让统计结果显著,会让许多实验无法操作。再者,他说,“当科学如此多样化的时候,为什么要限制一个单一的p值标准?”

 

他和他的同事们在今年年初也投递了一篇针锋相对的论文,被《自然-人类行为》接受。与众不同的是,这篇文章是全世界上百位科学家在谷歌文档里共同写出来的。

 

什么是p值?

P值是一个非常难掌握的概念。现在,让我们先通过简单粗暴的方式理解区分关于p值的各种概念:

 

零假设:默认立场,或这说两个统计现象A和B没有联系。

 

假设:科学家提出并要去证明的观点,与零假设矛盾。如:假设A和B有联系。证明以归谬法的逻辑,若零假设是错的,那么与零假设相反的结论可能有效。

 

P值:简单来说,P值越小,零假设有问题的可能性越大,你的假设就越可能成立。若P=0.05,则这时拒绝零假设,有5%的可能性你“冤枉了”正确的零假设;若P=0.01,那么拒绝零假设你只有1%的可能是错的。

 

显著性阈值(α):P值小到什么时候才能拒绝零假设又被学界认可?这个一刀切的门槛就是显著性阈值,完全人为设定。目前这个学界认可的门槛高度是0.05,即当p值小于0.05时可以说实验结果统计学上显著。

 

P值方法是广泛使用的统计手段,但因其自身的缺陷饱受争议。学界对于p值的讨论一直很热烈,有一批科学家就认为,由p值小于0.05推出的结论并不如人们想象中的那么靠谱,需要降低实验中使用的显著性阈值。

 

谷歌文档里的激烈讨论

想要反驳修订阈值的论文,光用推特可不行。

 

毕竟经过一次扩容后的推特,最多也才能发280个字。为了能深入讨论P值修订的问题,莱肯斯干脆在谷歌上创建了一个共享文档,标题是“为你的α值正名:对‘重新定义统计显著性’的回应”。莱肯斯在文档中列出了12个讨论点,包括“我们应该对这个建议做出评价还是无视它”以及“这样重新定义统计显著性存在的潜在负面影响是什么”。

 

莱肯斯说他想要这次的方案尽可能考虑每个人的想法,使想加入的人都等加入进来,并且没有主动找任何有名的科学家。在这种情况下,有接近150位科学家加入了讨论,文档激增到了100页。

 

讨论的参与者十分多样,有很多来自不那么有名的学校,很多人分享了他们的私人经验。因为p值和样本量有关,所以想要得到小于0.005的p值,可能需要更多的样本。有些参与者表示他们难以负担这样的大型实验,或者是没有办法招募到足够的被试。有些人则指出这个更低的阈值会使研究者转而寻求“方便的样本”,比如找本科学生或者采用网络研究。批评者还指出满足要求的大型实验更加难以复制,违背了提出新标准的初衷。同时,一个更严格的显著性阈值可能会让研究人员规避风险、更少地去研究困难课题。

 

除开修改阈值对科研造成的负面影响,参与者们对论文最大的质疑还是在于:0.005其实和0.05一样随意,真正的阈值实际上取决于我们对一个主题的了解程度和在这个主题上得到错误答案的风险。比如,初步实验对出现假阳性结果的风险接受度应该更高,药物实验则可能需要一个更低的p值。

 

莱肯斯希望能将谷歌文档中的讨论变成论文发表,不过这一次事情没有那么顺利。

 

人多也有人多的麻烦

丹尼尔·布拉福德(Daniel Bradford)是威斯康星大学麦迪逊分校的临床心理学博士生。布拉福德十分高兴能为论文出一份力,“我做了很久的统计学学生,也参过大量改良心理学实验方法的讨论。”不过他刚开始的时候怀疑这种共同写作的方法行不通,“在我和仅仅五位作者共同完成论文的时候,都时常想如果人更少的话效率会更高。”

 

为了顺利成文,莱肯斯从讨论中提取了要点放在一个新的谷歌文档里作为论文的基础。

 

“这份文档的演变过程让人难以置信,人们添加、删除再添加,旁观者又提出新的看法。这种模式奏效了。人们愿意承担特定工作,比如修改参考文献、检查段落和标点的问题。当我们不得不压缩文章的时候,一些作者化身食人鱼消灭掉了一切不必要的内容。”莱肯斯说。

 

虽然作者们精诚合作,但留给莱肯斯的任务还是很多——尤其是在莱肯斯需要完成常规工作的情况下。他只能利用空闲时间来完成任务,比如早上或者夜间。

 

“有那么一瞬间我觉得我要疯了。”莱肯斯说。

 

在论文完稿的过程中,有几个参与者选择了退出,部分原因是他们不同意论文中的部分内容。最终87个人同意成为论文的共同作者。

 

修订阈值派的回应

莱肯斯等人的论文建议完全丢弃“统计显著性”的标签。作为替代,研究者应该描述并解释它们的实验设计和数据处理方式,包括所选取的统计阈值。“有时候显著性水平可以是0.05,有时候是0.005,或者是0.10。”莱肯斯说。

 

对于莱肯斯的观点,主张修订显著性阈值的科学家们也有所回应。

 

原论文《重新定义统计显著性》的第一作者是德克萨斯农工大学的瓦伦·约翰逊(Valen Johnson),他认为莱肯斯的方法行不通。“让每篇论文的作者决定他们自己的显著性水平是不可行的,”他在写给《科学》的邮件中写道,“理由很简单,没有足够的资源对每个被提出的显著性阈值进行详细、公证的审查。”同时也不清楚“证明α的合理性”在实际中如何操作,论文的共同作者、阿姆斯特丹大学的埃里克-简·瓦根马克斯(Eric-Jan Wagenmakers)补充道。

 

另一位重要的共同作者态度更为温和。在弗吉尼亚大学的心理学家布莱恩·诺塞克(Brian Nosek)看来,“莱肯斯那篇论文中传达出的信息非常好,实际上不是对我们的论文的批判。” 诺塞克说《重新定义统计显著性》这篇论文传达的关键信息非常有限:目前0.05的显著性阈值让人们高估了证据的可信度,如果要降低这一阈值,0.005是一个合理的替代值。

 

“其他对显著性问题的建议,比如抛弃所有的显著性检验、对所选取的α做出解释、结合贝叶斯推论、更多的重复实验等等,也都是非常不错的改进。”诺塞克说。

 

这一场辩论还会继续,不过地点可能不会是谷歌文档了。谷歌文档中发生的故事“令人惊叹”但效率并不是很高,莱肯斯说,“当你的时间有限时,你不应该这么做。”

 

“讨论很激烈。我们确实因为无法取得统一的意见,放弃掉了一些论点。如果只有我一个作者,我会把那些加进去的。”莱肯斯补充说道。

 

看来关于统计显著性,能讨论的还有很多。而每一次讨论,都可能是完善科学方法的星星之火。


关键字:论文  谷歌  文档 引用地址:什么是p值?为何专家为它争论不休

上一篇:ICO投票者坐等“韭菜”接盘,找下线花样百出
下一篇:发表研究频出错,原因终于找到了

推荐阅读最新更新时间:2024-05-03 02:33

全球VLSI会议中国仅三篇论文入选
集微网消息,为期五天的“2018全球超大规模集成电路技术及电路国际会议”,今年在夏威夷举行。 超大规模集成电路技术国际会议缘起于1980年,由美国国际电机电子工程师学会电子元件学会及日本最大的应用物理学会联合发起,偶数年于美国夏威夷举行,奇数年于日本举行。该会议被视为VLSI领域的旗舰会议。长期以来,响誉国际,且扮演半导体VLSI高科技电子、IC相关产业火车头的角色,因此每年都吸引世界各大半导体厂的菁英前来参与盛会。 今年有逾8百位来自全球精英前往参加。中国虽仅有清华大学2篇、浙江大学一篇共3篇入选,但参与会议人数达三十多位,显示大陆对半导体的重视。
[手机便携]
谷歌DeepMind开发人工智能可有效检测眼疾
谷歌旗下DeepMind开发了一种人工智能,通过分析医学图像来诊断疾病,这可能是人工智能在医疗领域的第一个重要应用。 总部位于伦敦的DeepMind公司已经对数以千计的视网膜扫描数据进行分析,以培训一种人工智能算法,比人类专家更迅速有效地检测出眼疾的症状。 在与英国国家卫生服务机构和伦敦的摩尔菲尔兹眼科医院合作了两年,展现出“有希望的迹象”之后,将研究成果发表在一家医学杂志。摩尔菲尔兹是世界上最著名的眼科医院之一。如果结果通过同行评审的话,这项技术可以在几年内进入临床试验阶段。 DeepMind Health的临床主管Dominic King告诉英国《金融时报》:“在像医学影像这样的特定领域,你可以看到我们将在未来几年内用人工智
[机器人]
谷歌相机7.4版:Pixel将支持4K 60帧视频拍摄
据外媒XDA报道,继此前对谷歌相机Google Camera 7.3的初步逆向编译分析发现谷歌正准备添加对24fps视频录制的支持之后,XDA再次找到证据,表明谷歌正计划支持60fps的4K视频拍摄。   XDA高级会员cstark27(知名GCam修改专家)对尚未发布的谷歌相机Google Camera 7.4进行了逆向编译,该APK是从Pixel 4a设备中提取出来的。在关于视频录制的类中,cstark27发现了全新的“camcorder.4K60fps”模式。不过目前还没有其他证据提供佐证,因此尚不清楚适用于哪款Pixel设备。 此前Pixel相机产品经理Isaac Reynolds表示:   目前没有足够的内
[手机便携]
<font color='red'>谷歌</font>相机7.4版:Pixel将支持4K 60帧视频拍摄
Amazon Alexa受热捧 谷歌及苹果互联汽车平台将受车企冷遇
据外媒报道,谷歌与苹果耗费四年多时间,用于其互联汽车平台的研发。然而,众多车企都不太愿意采用上述两家公司的平台。随着Amazon Alexa的横空出世及5G网络的蓄势待发,这一情况就越发明显了。 据业内人士透露,这是由于智能手机平台公司与车企间的拉锯战依然在继续,何况5G网络时代已近在眼前,各车企不愿意再徒费钱财。 互联汽车平台于2005年9月开放,苹果将旗下的iPod整合到车载立体声系统中。尽管当时有15家车企表示对该项目感兴趣,但直到2014年苹果发布Carplay后,该项目仍未取得多大的进展。 谷歌于2014年发布Android Auto,安卓手机实现车载娱乐系统的相关控制功能。目前,众多车企都在采用苹果及谷歌的互联汽车平
[汽车电子]
中美贸易战开启新战场 瞄准中国云计算命门
报道称,美国正在评估如何就北京限制美国云计算及其他高科技服务供给商展开报复,记者,这将开启其对华贸易战的“一片新战场”。 援引接近美国官方智库人士的说法称,美国贸易代表办公室正在考虑是否就北京方面不公平地限制美国在高科技服务领域的贸易行为发起新的贸易申诉,且很可能在美国1974年贸易法第301条款的框架下进行。该人士同时称,美国贸易代表目前尚未就是否推进此项申诉作出最终决定,如果采取行动,这将会是对美国近期对华施压措施的又一补充。 文中说,北京方面要求美国的云计算公司,诸如亚马逊、微软与中国的公司成立合资公司,并将其技术授权给它们的中国伙伴,而美国贸易代表办公室在一份关于中国贸易行为的报告中称,北京不给在中国独立经营的美国
[网络通信]
中美自动驾驶发展,百度谷歌谁才是一哥?
自动驾驶哪家强? 这个问题显然是没有最直观的答案,因为到现在为止还没有哪一家企业大规模推出高级别自动驾驶量产车。但是,如果从影响力来看,百度和谷歌绝对算是自动驾驶圈内名声响当当的明星企业。 百度和谷歌旗下的Waymo能做到全球真正有能力做自动驾驶平台的巨头,有两个极其重要的原因。 其一,它们有最核心的AI技术,给无人车提供大脑,用于环境感知、路径规划、行为决策等等。事实上,能否真正让机器取代人成为司机,最关键的就是AI技术的成熟度; 其二,百度和谷歌是国际顶级互联网公司,本身就是在做平台,相比传统企业更愿意接受平台模式,而传统企业更愿意将技术卖钱,这是不同思维,也是不同基因。 两个自动驾驶行业
[汽车电子]
中美自动驾驶发展,百度<font color='red'>谷歌</font>谁才是一哥?
为何谷歌眼镜能讨得医生青睐?
    谷歌于2012年4月发布了谷歌眼镜(Google Glass),这款“增强现实”眼镜具有和智能手机一样的功能,可以通过声音控制拍照,视频通话和辨明方向以及上网冲浪、处理文字信息和电子邮件等。尽管谷歌眼镜的功能非常强大,但是由于可能会侵犯到他人的隐私信息,所以对这款设备的批评之声不绝于耳,有些酒吧、餐厅或公司甚至明令禁止佩戴谷歌眼镜。但不管主流社会是否会接受谷歌眼镜,它已经开始在部分行业中扮演重要角色,比如在医疗行业。     《麻省理工学院科技评论》的生物医学编辑苏珊·杨·罗雅恩(Susan Young Rojahn)日前撰文称一些急救医生在谷歌眼镜等可穿戴设备的帮助下,能够提升诊疗效率,顺利突破常规急救方法的限制,有望给整
[医疗电子]
谷歌摩托明年将推“X”高端智能机对抗苹果
12月22日消息,据国外媒体报道,有消息人士称,摩托罗拉移动的工程师正在打造一款精致的设备,内部称之为“X手机”(X Phone)。但这个被期望能通苹果竞争的项目目前存在一些阻力。 消息人士称,摩托罗拉移动正在设计一款带有尖端功能的大尺寸设备,希望其能从市面现有的手机产品中脱颖而出。传言称这款设备将于明年发布。谷歌在7个月前收购了摩托罗拉移动。 消息人士还透露,尽管谷歌向来以网络业务上快速的执行力闻名,但其新收购的硬件业务在制造和供应链管理上存在一些麻烦。这可能导致公司重新考虑“X手机”最初的一些设计方案,如可弯曲的屏幕等。 谷歌此举是其提升市场地位战略的一个关键部分。公司希望减少摩托罗拉产品的数量,转而进一步提升产品
[工业控制]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved