本帖最后由 余晓辉 于 2014-2-13 13:41 编辑
摘自第一章 因果分析法
对于复杂事件的因果关系判断是很重要的,这将有助于我们对许多未知事件发展规律准确预知和控制,在生命科学、医学科学等领域的应用尤为重要。譬如某地区有2000名学生接种疫苗,其中有300名学生出现局部不舒适反应,于是我们想知道接种疫苗与这些不舒适反应之间存在多大的因果关系,这样的因果关系又表明了什么?再如,某血液疾病使用骨髓移植方法治疗,大量的临床有效率已经知道,那么从临床有效率中我们是否能判断这种治疗方法的意义和不足之处?以便我们更科学地寻找正确的治疗方法。在其他复杂事件领域,因果分析法也是极其重要的,可以说是我们认知事物发展规律的基本方法,是经验到理论升华的基本方法。
1.简单因果关系
设事件A1是事件a的唯一原因事件,事件a是事件A1的结果事件,则有以下结论必然成立, 1) 当事件A1发生时,事件a必然发生,用条件概率的形式可以记为 P(a∣A1)=1 2) 当事件A1不发生时,事件a必然不发生,用条件概率的形式可以记为 P(a∣Ā1)=0
这两个关系非常有用,是判断简单因果关系的重要依据。
譬如,设某疾病为事件a,我们认识的该疾病的病因为事件A1,则要证明我们对该疾病病因认识完全正确,必须同时满足 P(a∣A1)=1 P(a∣Ā1)=0
即,在病因A1状态下,疾病a必然发生,而不满足该病因状态时,该疾病必然不发生。在许多研究中,往往只注重在已有病因状态下对疾病的研究,而忽略了不在该病因状态下,疾病是否依然发生的研究,从而得出错误结论。即使 P(a∣A1)=1 而P(a∣Ā1)>0
那么也不能证明事件A1是事件a的唯一原因事件,即我们所得出的病因是不完善的。例如,有的人认为内毒素是人体发热的致病因子,虽然在存在内毒素的条件下可以诱发实验个体发热,但是在更广泛的自然领域,无内毒素情况下,依然存在很多发热病例,这表明我们不能就此简单认定发热病理。只有当我们选定的强迫控制条件接近自然条件时,研究的结论才相对可靠。
而每次对疾病的治疗就是验证病因和疾病之间的因果关系,只有满足完全的因果关系,才能真正治愈疾病。只要以有效率这样的形式表达疗效,就表明治疗和疾病之间不满足完全的因果关系,对病因和药理的认识也是不完善的。
现代医学的很多理论似乎很完善,但在治疗疾病时始终难以获取满意疗效,而中医干预却能有出乎意料的效果。这事实上反应了现代医学对疾病病理认识存在严重缺陷,而我们可以从中医的药理医理反推疾病发生的病理,从而正确认识疾病。例如,现代医学认为甲亢是甲状腺病变所致,但是中医以益气安神养阴的方法治疗却有很好的疗效,这足以让我们更深入思考该病发生的真实病理,从益气安神养阴的药理推演甲亢的真实病理。又如,中医常常以解表发汗的方法治疗外感发热,疗效极好,我们可以从发汗对人体的影响反推外感发热的病理。这样的推理必定是很有意义的,抑制疾病的医理分析要比单纯的触发疾病的医理分析方法更可靠,因为实践是检验真理的唯一标准,其中也体现了因果关系的判断原则。中国有句俗语,失败是成功之母,其实是说从事件的对立面探索而获得的物理经验规律更可靠,这是因果关系最通俗的应用。
2.复杂因果关系
但是一般情况下,事件之间的因果关系很复杂,往往不是单一事件之间的因果关系,譬如,我们可能观察到实际的条件概率P(a∣A1)<1,或者P(a∣Ā1)>0,这又反应了什么问题呢?
某一事件的发生往往存在多个独立子原因事件,只有这些子原因事件同时发生时才能触发特定结果事件。譬如我们要品尝到一道美味的菜肴,除了各种原料佐料,还要有好厨师,甚至好的炉灶、好的厨具也不能缺。又如,某种治疗方法可能对甲病人完全有效,而对乙病人部分有效,对丙病人甚至无效,这其实是表明这三个病人之间的身体条件存在差异,虽然我们看到的疾病表象可能是差不多的。我们不能只满足于疗效统计,更应该积极探索隐藏在疗效差异背后的病人身体条件差异,只有对这些隐条件深入掌握和了解,才能更有针对性地调整下一次的治疗方法,从而提高疗效。
一般地,可能存在多个独立子原因事件(设为A1,A2,…,An),只有这些独立子原因事件同时发生,结果事件a才能发生,即 P(a∣A1∩A2∩…∩An)=1
但是,我们往往不能控制这些独立子原因事件同时发生,而只能控制其中部分独立子原因事件发生(如,A1,A2,…,Ai,其中i<n),此时必然满足 P(a∣A1∩A2∩…∩A i)<1
因为只有当剩余的Ai+1,…,An个事件也同时发生时,结果事件才能发生,所以 P(a∣A1∩A2∩…∩A i)必然等于P(Ai+1∩…∩An),即 P(a∣A1∩A2∩…∩A i)= P(Ai+1∩…∩An) (1−1)
定义,在所有子原因事件中,如果P(Ai)比较大,则该子原因事件Ai为次要原因事件;如果P(Ai)比较小,则该子原因事件Ai为主要原因事件。显然,之所以这样定义,是因为只要主要原因事件发生,则结果事件的发生概率也比较大;反之,只有次要原因事件发生,则结果事件发生的概率比较小。
定义,若满足P(a∣A1∩A2∩…∩An)=1,如果缺省其中任一子原因事件时,必有 P(a∣A1∩A2∩…∩A i)<1 其中i<n,则集合A={A1,A2,…,An},为结果事件a的一个原因集。
显然,如果集合A={A1,A2,…,An}是结果事件a的唯一原因集,则当其中任一子原因事件不发生时,结果事件a也必不发生,即 P(a∣Ā1)=0
但是有时我们还观测到另外一种情况,即 P(a∣Ā1)>0
这表明还存在结果事件a的其他原因集。一般地,可能存在多个原因集,这些原因集都可以独立地触发同一个结果事件。设结果事件a除了原因集A以外,还存在另外一个原因集E,则 P(a∣Ā1)=P(E) (1−2)
同理,并由关系(1−1)可得 P(a∣A1)= P(A2∩…∩An∪E) = P(A2∩…∩An)+P(E)− P(A2∩…∩An∩E) (1−3)
从系统角度看,事件的发生由系统状态决定,不同的系统条件可以触发相同事件发生,这是同一事件存在多个原因集的本质。
需要注意的是,即使P(E)=0,并不是说绝对不存在其他原因集,而是在现有条件下,其他原因集发生的概率为零。人类可以通过控制其他原因集中小概率(甚至是自然界零概率)的主要原因事件而触发同一结果事件。因此即使在自然统计条件下未发现其他原因集,也不能阻碍我们寻找可能存在的其他原因集,这在有的领域是需要的。
如果两个不同的原因集A和E中有两个不同的独立子原因事件A1和E1同时发生,对结果事件a的影响又是怎样的?根据条件概率的计算方法,有以下分析。 |