注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

何新网易博客

全国政协委员何新授权的博客

 
 
 

日志

 
 

相关性 ≠ 因果性   

2015-06-06 07:34:48|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

相关性 ≠ 因果性

作者:physixfan 
转帖:呼呼
/gkimage/ez/en/ar/ezenar.png



专家说,常食海参使人变得更聪明!专家又说,科学研究表明,20~50岁男人射精越频繁,以后患前列腺癌风险就越低!诸如此类,我们在电视中、在媒体和网络上,每天可以看到类似的说教,什么什么会导致什么什么,也就是说到处可以见到各种各样的因果关系模型。

你会深信诸如此类的以上这种说法吗?例如,是不是为了变聪明我们人人就要天天吃海参?是不是为了降低患前列腺癌的风险男人就要天天打飞机?

相信死理性派的读者,不会轻易就相信上述的因果性结论。但轻易下因果结论则是很多人经常犯的毛病,为了分析类似这种结论的可信程度,我们先来看看这种结论都是如何得出的。

为了研究海参和聪明之间的关系,研究人员通常是这样做的:

首先在一定的人群中统计一下他们是否平时常吃海参,挑选出常吃海参的一组和不常吃海参的一组。然后进行智商测试,对总体结果进行统计,看看哪一组智商平均值更高,或者直接统计吃海参频率和智商之间的相关系数。如果常吃海参的一组平均智商得分更高,那么研究人员就会得出结论:常吃海参和智商高之间是呈正相关的关系的。

但根据这个研究,有的所谓“专家”则声称:海参吃得越多智商就越高哦!为了提高智商赶紧吃海参吧!然而——

              相关性 ≠ 因果性!

即便是假设常吃海参的组平均智商真的更高,并且调查对象人数真的多到了具有统计意义,“专家”的声明仍然有一个致命的逻辑缺陷:相关性并不代表因果性!这是一个经常被人混淆,也经常被一些团体故意混淆已达到他们自己的目的的伪说辞、伪逻辑关系。

两个变量A和B,可能具有相关性,其原因是有很多种的,并非只有A→B或者B→A这样的因果关系。一个很常见的导致相关性的可能性是A和B都是同样的原因造成的:C→A并且C→B,那么A和B也会表现出明显的相关性,但并不能说A→B或者B→A。

比如有统计表明,游泳死亡人数越高,冰糕卖得越多,也就是游泳死亡人数和冰糕售出量之间呈正相关性,我们可以由此得出结论说吃冰糕就会增加游泳死亡风险吗?显然不可以!这两个事件显然都仅仅是夏天到了气温升高了所导致的,吃不吃冰糕跟游泳死亡风险根本没有任何因果关系。

从这个例子可以明显看出,只依据统计数据是不足以得出因果性的,想要得出因果性,必须从理论上证明两个变量之间确实有因果性,并且要排除掉第三个隐含变量同时导致这两个变量的可能性。

回到海参的例子上来。海参和聪明之间的正相关性,有可能是因为经常吃到海参的家庭一般比较富裕,而富裕的家庭通常可以给孩子提供更好的教育资源,以使得孩子更聪明;也可能是有一个或者多个基因,同时起到了使人喜欢吃海参和提升智商两种作用。如果不排除这些其他可能性,说吃海参可以导致更聪明的说法就是不可信的,我就绝不会为了提升智商去吃海参。

那么是否射精越频繁,患前列腺癌的风险越低?

对于什么是可靠的理论分析,我个人一直持有“无引用不相信”的原则,我们读到的科普文或者科技新闻,总是经过一次或者几次转述,很可能因为需要把某些说法夸张了。所以为了辨别这些说法的真伪,一定要根据文章的引用找到发表在学术期刊上的原文去读,看看原文的结论是什么,得出这个结论是用到了什么方法。而如果没有引用的话,就应该保留态度,此处存疑,不可尽信。

最后再来说说关于射精频率和前列腺癌患病率的负相关关系。“20~50岁男人射精越频繁,以后患前列腺癌风险就越低”,这个问题最近引起了不小的争论。依旧用“无引用不相信”的原则,我们搜索到一篇 文献 ,这篇论文依据的正是统计调查,因此其研究结果只得出了相关性的结论,并没有给出因果关系。原文的最后结论说的很明确也很谨慎:“Our results suggest that ejaculation frequency is not related to increased risk of prostate cancer.”翻译过来是:“我们的结果表明,射精频率与前列腺癌发病率的升高并没有相关关系。”所以不能因此就下这样的结论:射精越频繁导致前列腺癌风险越低。至于为了降低患前列腺癌的风险天天打飞机,更不可取。最后还有一点需要说明,相关不等于因果,不代表相关就不可能是因果关系,只不过为了论证因果关系,需要更加严密的实证来说明。

【何新读后评论】
现代科学所谓的因果关系,是统计学意义的因果关系。
由于因果关系这个概念存在哲学上面临的定义困难,因此现代科学不再讨论伽利略或休谟、康德等在哲学意义上所说的因果关系,只从统计学意义上进行定义。在实际应用中通常采用格兰杰(Granger)因果理论作为因果性检证(Granger causality test)。
简单言之:即从数理统计的角度观察因果关系,这种关系是通过概率或者分布函数的角度体现出来的:在宇宙中所有其它事件的发生情况固定不变的条件下,如果一个事件A的发生与不发生对于另一个事件B的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又先后顺序(A前B后),那么我们便可以说A是B的原因。
现代科学所谓的因果关系,不是形而上的因果关系,而是基于数理统计学的经验因果关系,实际是一种虚拟的因果关系,不是实体性的因果关系,因此是非充分必要条件下的因果关系,缺乏充足理由律的论证,常常是不可信的。

【附录】格兰杰(Granger)因果检证:
考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Yt (在统计的意义下),已经综合考虑Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause),如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X的滞后对X自身的影响)。检验由Y关于自己的滞后值和X滞后值的回归构成;如果X的滞后值影响不显著,那么X不是Y的Granger原因;同样,当检验Y是X的原因时,可以将X关于自己的滞后值和Y的滞后值回归,用F-检验法莱检验Y滞后值的影响。需要进行两个回归:

在第一个方程中检验假设H0X :βj=0,对所有j;在第二个方程中检验假设H0Y:αj=0,对所有j。如果前者没有被拒绝,那么X不是Y的Granger原因;如果后者没有被拒绝,那么Y不是X的Granger原因。这里没有一个明显的方法来确定滞后长度k。显然,存在四种可能的结果:X和Y都不是对方的Granger原因(H0X和H0Y都不被拒绝);X和Y是对方的Granger原因(H0X和H0Y都被拒绝);X是Y的Granger原因但Y不是X的Granger原因(H0X被拒绝但H0Y不被拒绝);Y是X的Granger原因但X不是Y的Granger原因(H0X不被拒绝但H0Y被拒绝)。注意到,第一个回归中没有出现X的现值,在第二个回归中没有出现Y的现值。

 早期因果性是简单通过概率来定义的,即如果P(B|A)P(B)那么A就是B的原因(Suppes,1970);然而这种定义有两大缺陷:一、没有考虑时间先后顺序;二、从P(B|A)P(B)由条件概率公式马上可以推出P(A|B)P(A),显然上面的定义就自相矛盾了(并且定义中的“”毫无道理,换成“”照样讲得通,后来通过改进,把定义中的“”改为了不等号“≠”,其实按照同样的推理,这样定义一样站不住脚)。
   

事实上,以上定义还有更大的缺陷,就是信息集的问题。严格讲来,要真正确定因果关系,必须考虑到完整的信息集,也就是说,要得出“A是B的原因”这样的结论,必须全面考虑宇宙中所有的事件,否则往往就会发生误解。最明显的例子就是若另有一个事件C,它是A和B的共同原因,考虑一个极端情况:若P(A|C)=1,P(B|C)=1,那么显然有P(B|AC)=P(B|C),此时可以看出A事件是否发生与B事件已经没有关系了。

  因此,Granger(1980)提出了因果关系的定义,他的定义是建立在完整信息集以及发生时间先后顺序基础上的。至于判断准则,也在逐步发展变化:

  最初是根据分布函数(条件分布)判断,注意Ωn是到n期为止宇宙中的所有信息,Yn为到n期为止所有的Yt (t=1…n),Xn+1为第n+1期X的取值,Ωn-Yn为除Y之外的所有信息。

F(Xn+1 | Ωn) ≠ F(Xn+1 | (Ωn ? Yn)) - - - - - - - (1)

  后来认为宇宙信息集是不可能找到的,于是退而求其次,找一个可获取的信息集J来替代Ω:

F(Xn+1 | Jn) ≠ F(Xn+1 | (Jn ? Yn)) - - - - - - - (2)

  再后来,大家又认为验证分布函数是否相等实在是太复杂,于是再次退而求其次,只是验证期望是否相等(这种叫做均值因果性,上面用分布函数验证的因果关系叫全面因果性):

E(Xn+1 | Jn) ≠ E(Xn+1 | (Jn ? Yn)) - - - - - - - (3)

  也有一种方法是验证Y的出现是否能减小对Xn+1的预测误差,即:

σ2(Xn+1 | Jn)  σ2(Xn+1 | (Jn ? Yn)) - - - - - - - (4)

  最后一种方法已经接近我们最常用的格兰杰因果检验方法,统计上通常用残差平方和来表示预测误差,于是常常用X和Y建立回归方程,通过假设检验的方法(F检验)检验Y的系数是否为零。

  可以看出,我们所使用的Granger因果检验与其最初的定义已经偏离甚远,削减了很多条件(并且由回归分析方法和F检验的使用我们可以知道还增强了若干条件),这很可能会导致虚假的因果关系。因此,在使用这种方法时,务必检查前提条件,使其尽量能够满足。此外,统计方法并非万能的,评判一个对象,往往需要多种角度的观察。正所谓“兼听则明,偏听则暗”。诚然真相永远只有一个,但是也要靠科学的探索方法。
  评论这张
 
阅读(10265)| 评论(2)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016