精致研学

您的位置 首页 未分类

由大数据引起的对因果与相关的讨论(二)

作者:齐磊磊  华南理工大学 科学技术哲学研究中心

如果它们之间不存在本质的联系,它们也不能成为规律。不过,在规律中,有一些是决定性的,有一些是统计性的。统计性规律虽然不确定,但它仍按某种规律在一定的范围内变化。变量问的这种相互关系和函数关系,称为具有不确定性的相关关系,即我们通常所说的“统计相关关系”。如目前我国在“全面放开二孩”后的生育率与人均 GDP 的关系就是典型的统计相关:人均 GDP 高的地区,生育率往往较低,但二者没有惟一确定的关系,这是因为除了经济因素外,生育率还受教育费用、父母的时间精力、婚嫁成本以及风俗文化和其他随机因素的共同影响,随着这些因素的变化,生育率虽然不完全确定,但却有一定的规律可循。

这样就可以将相互关系划分为三种形态:决定论自然规律(白色区域)、统计性规律(黑色区域)和偶然性关系(灰色区域)。

对相互关系和规律性进行了分析,是否就说明通过规律性完全可以解释这些现象,发现事物间的因果关系?不一定!因为数学上的函数与规律并不意味着变量之间就一定存在任何“因果”关系,虽然在普通的语言中“函数”这个术语往往带有因果的含义。例如:“对在常温下一个封闭容器内的气体,波义耳定律叙述为压强p和体积v的乘积是一个常数c(这个值和温度有关):pv=c.用这个关系可以把p或v解出来,使p和v中的任何一个可看作是另一个变量的函数。这里并不含有含有体积的变化是压强变化的’原因’的意思,正如不含有压强变化是体积变化的’原因”的意思一样。函数只是数学家所关心的两个变量间联系的方式。”

 三、因果与相关

“事出有因”似乎是人们与生俱来的对外界事物探索的一种本性,万事万物都要追问“为什么”。为什么会有四季的轮回?为什么木头可以燃烧?为什么时间一去不复返?……对“为什么”的探求过程几乎伴随着人类的整个历程。遗憾的是,自从亚里士多德提出四因论以来,历经两千多年的努力,科学家在解释自然现象产生的原因,哲学家也把它上升为“因果”并作为一个基本的概念进行讨论,但却都没有对因果性或因果关系给出一个统一的描述。当代哲学的因果理论门类众多,张华夏教授在新著《科学的结构》中将概念分析与经验分析这两条因果理论研究进路整合起来,同样,本文讨论因果既不单指“休谟-马奇学派的条件因,也不仅仅是指洛克-马顿-邦格的作用动力因”,而且还包括概率因果等等诸如此类由于研究的学派不同而提出的不同的因果理论。也就是说这里的“因果”实际上是一个概述性的词语,包含了科学与哲学上所讨论的任何一种对因果关系的表述,可以笼统地表示为:因果关系指的是事件之间的一个序列,如果事件A引起事件B,则事件A是原因,而事件B是结果。这里“引起”一词可以依不同学派作不同的解释,可以解释为A是B的充分/必要条件;也可以解释为有一种因果力(能量或其他守恒量)从A传递到B的实体使B出现;也可以理解为A以一定的概率导致B出现。这第三种“引起”,被称为“概率因”。在此我们要补充一个统计概率因:A是B的概率因。可定义为:A=pro(B)。其中 pro 为概率因的记号,p为概率的符号,概率的取值范围在0至1的区间里。这个式子表示A对B的概率相关性:A可能是B的原因,因为它提高了B的概率。这个概率因与大数据分析中的统计相关有密切的联系,下文会重点讨论。

按照这样的表示,相关关系也可以进一步具体化。A和B相关,指的是事件A和事件B至少存在下列6种情况:(1)事件A直接引起事件 B;(2)事件B直接引起事件 A;(3)事件A引起事件B随后事件B引起事件 A;(4)事件A引起事件C,而C又引起了事件 B;(5)事件A以一定概率引起事件B和事件 C;(6)非因果相关,例如数据收集。

显然,情况(1)-(4)所描述的A和B之间的相关实际上是决定论的因果关系的各种表现,它们依次是:直接因果、反向因果、循环因果(或因果反馈)、间接因果(或因果可传递性)。通常所说的因果性,指的是上述四种情况。(5)所描述的因果关系是统计概率性的。这种情况涉及到的正是萨尔蒙提到的概率因。一个原因引出两个结果,原因与结果之间存在概率因果关系,但两个结果之间没有因果关系。这里的概率指的就是前提条件,有这个条件就有这个概率,如果有这个条件的概率比没有这个条件的概率大,那么这个条件就是它的概率原因。例如,某段时间,冰激凌的销量(C)和中暑人数或个人中暑的可能性都会增加(B),两者之间表现出相关关系,如果我们依靠冰激凌销量升高的信息进行中暑预防,有时是有效的,有时会有很大的误差,因为二者之间并不是因果关系,正确的途径是找到它们共同的原因:天气炎热(A)。然而,天气炎热与个人中暑之间的因果关系是率性的,A与B之间以及A与C之间的关系是统计因果相关。而B与C之间的关系则完全是非因果关系,尽管它们之间有共同增长的关系。这样我们可以推出一个结论:相关关系包含了确定性的因果关系,确定性的因果关系必定是相关关系,如情况(I)-(4);相关关系不一定是确定性的因果关系,如情况(5)、(6):相关关系可以提供可能性,通过概率统计因果相关用于推测集体的和个体的因果关系,但不能给出明确的证明依据。例如张三是否中暑,还要有医学证据。

分析了因果与相关之间的关系之后,接下来讨论大数据时代对因果和相关的各种说法和看法就会更清晰。

声明:该文观点仅代表作者本人,国学百科网系信息发布平台,仅提供信息存储空间服务。

为您推荐

发表留言

发表评论

邮箱地址不会被公开。

联系我们

联系我们

157-0115-5530

在线咨询: QQ交谈

邮箱: wdgxbk@163.com

工作时间:周一至周五,9:00-17:30,节假日休
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
大数据库
返回顶部