作者:齐磊磊 华南理工大学 科学技术哲学研究中心
摘要:大数据带来了因果与相关的显明观点,共鸣者众,争鸣者也不乏其数。因果与相关本来就是哲学上的老问题,老问题新讨论,大数据视域下重新审视两者的关系是对哲学或者大数据哲学的有益补充。相关关系可以细分为(决定论)因果、统计因果与非因果关系。相关关系包含了决定论的因果关系,决定论的因果关系必定是相关关系;统计因果找到了协调传统科学哲学的方法论与大数据方法论的中间桥梁,是大数据研究的一个中间驿站;大数据视域下通过统计因果相关可以推测集体的和个体的因果关系,但不能给出明确的证明依据;可以借助统计因果相关对因果与相关进行区别并联系起来。
关键词:因果;相关;函数;规律;大数据
一、引言
笔者于 2015 年写过一篇论文“大数据经验主义”,提出了大数据经验主义的概念、概括并批判了他们的基本观点。论文发表以后,国内多位学者与我交流,其中最有启发性的建议是:对因果与相关的讨论再细致些,要抓住这个问题深入说清楚。为了更好地说明因果与相关的关系,本文将相关进一步细分为:决定论因果、统计(概率)因果和非因果相关三个部分进行讨论,尤其是引入统计因果相关这个较少有人提及的概念,它既可以清楚地表达因果与相关的区别,又是两者之间联系的纽带,这样的论证进路具有一定的新颖性。为此,首先沿着从“函数”到“相关”’再到“规律”最后到“因果”这样一个自然过渡的发展路线开始。
二、函数、相关、规律与因果
在现实世界中,任何事物都不是孤立存在的,而是与其他事物具有千丝万缕的联系。对于这种相互关系的研究,有一个从朴素的直觉表达到精确的数学描述的过程。最先给出统一描述的来自数学上的“函数”概念,这是17世纪数学从对运动的研究中引出的一个基本概念。伽利略在近代力学的开山之作《两门新科学》中用文字和比例的语言表达函数关系,全书中比比皆是,“只差把文字叙述表为符号形式这短短的一步了。”随后,苏格兰数学家詹姆士·格雷戈里(James Gregory)在他的论文“论圆和双曲线的求积”中给出了相对比较明显的定义,但范围太窄。牛顿在他的微积分研究中用“流量”(fluent)来表示变量间(包括无穷小量间)的关系。1673 年,莱布尼兹在一篇手稿中使用“函数”表示任何一个随着曲线上的点的变动而变动的量。1714 年,在莱布尼兹的著作《历史》中,用“函数”一词来表示依赖于一个变量的量。伟大的数学家欧拉1734 年引进了函数的数学记号y=f(x),这临门一脚踢开一般数学函数定义的大门大概花了 100 年。
在莱布尼兹以及其后的数学家看来,只要事物之间在物理上存在着严格的确定的关系就可以用函数关系表示。随着离散数学和集合论的创建,函数的概念变得更加广泛。因为,集合论为刻画事物之间形形色色的联系提供了一种数学模型–关系,它仍然是一个集合,以具有那种联系的对象组合为其成员。比如人与人之间有父女关系、师生关系等;计算机程序问有调用关系、状态转换关系等。“集合论中关系不是通过描述关系的内涵来刻画这种联系,而是通过列举其外延(具有那种联系的欢对象组合的全体)来刻画这种联系。”所以,集合论中通常使用具有相互联系的对象的有序对的集合来表示关系。这样,一个数学集合,只要有个映射,即一个有序对,映射过来就是个关系。塔尔基从数理逻辑上对关系的表述也很广泛。他的定义是:“事物x与事物y有R关系,简写 xRy”。其中R指的就是相关关系,它说明相关是指只要两个变量有关系,不管它稳定不稳定,明确不明确都是指具有这个关系,这与莱布尼兹等人对函数最初的定义不同。函数的定义演变为:只要有两个变量之间发生联系,它就是一个函数,自己也可以是自己的函数。比如 A=A 是个相关,具有可自反的关系; A=B 也是个相关,具有相等但不是因果的关系;兄弟也是个关系,这个关系就是R,R也称之为函教。所以说,相关关系可以表示为一个数学函数,函数就是一个映射,变量之间存在一个映射,无论是人为的、天然的或者数学上把它们连接在一起就变成一个有序对,有序对就是一个关系。于是非教学的关系也纳入到相互关系的研究之中。
数理逻辑展示了许许多多的关系形式,关系或函数在逻辑上实际是一个概念,在离散数学或集合论中也是一个概念。但是,在集合论中和数学中,函数或关系不一定是规律。因为函数是指对于两个变量之问的关系,而规律或者定律一定要限制在一个物理系统或物理实体之间,只有具有这样关系的事物才属于一定的自然类,这种意义上来讨论关系它就属于一个自然律。那么现在的问题是:相互关系在什么条件下会成为自然规律呢?也就是说,要谈论相关关系,这里还需要说明一个自然律和自然类的问题:在事物或现象之间的关系中,有一些是必然的有一些是偶然的,有一些是属于一定自然类的本质关系的,有一些是非本质的,有一些是比较普遍的、重复出现的,有一些是个别的、即逝的。我们只把那些本质的、必然的、反复出现的相互关系叫做规律性和自然规律。因此,关系要成为自然规律,前提条件就是这种关系必须属于一个自然类,并成为这个自然类中的一个本质的联系。
声明:该文观点仅代表作者本人,国学百科网系信息发布平台,仅提供信息存储空间服务。