病因必须与疾病有联系(association)或称相关。二者存在密切的数量关系时为有联系,可用统计学方法加以表明。
(一)统计学联系
当病因(F)在人群中变动后某疾病(D)的频率或强度也变动,则为二者有联系。F有可能(也有不可能)为D的病因。当F变动后,D并不变动,则为二者无联系,F很可能不是D的病因。当某疾病(D)有F的比例,显着高于非该疾病中有F的比例,并达到统计学显着水平时,也叫有联系。如表7-1。
表7-1 疾病(D)与可疑病因(F)的关系
疾病(D) | 可疑病因(F) | 合计 | |
有 | 无 | ||
是 不是 |
α c |
b d |
α+b c+d |
合计 | α+c | b +d | N |
α/(α+b)>c/(c+d)p<0.05
c/(α+c)>b/(b +d) p<0.05
OR(或RR)>1,其95%CI不包括1,P<0.05
符合上述条件时,则为F与D有统计学联系。有统计学联系时有三种可能,即:虚假的联系、间接的联系及因果联系。在判断是否因果联系前必须排除虚假的联系及间接的联系的可能,然后进行病因推导(causal inference)。 ]
(二)虚假的联系
虚假的联系是由研究过程中的各种偏倚(bias)所引起,或应用了错误的方法、错误的判断而形成。
如某药商宣传其药可以促进儿童的发育,其药的服法为为溶在一杯牛奶中服用。用他的方法观察会得到服其药促进发育的结果,但这种结果不一定是其药的作用,而为每天加服若干次牛奶的作用。古书中说“蛙鸣而燕至”,二者本无联系,只是季节到了,二者都出现。应用某种药治疗慢性支气管炎,从春天开始治疗到夏天,因为该病到夏天缓解,于是显出该药长期服用有疗效。研究某中药治疗白喉,将多数重病人放到用抗毒素治疗组,而将多数轻病人放在中药治疗组,得出该中药治疗白喉效果可与抗毒素效果相比的结论。19世纪中叶,卫生统计学家、英国医生Farr根据统计学数据表明地势高低与霍乱死亡率的低、高有联系,而支持“瘴气”(miasma)是霍乱的病因。1854年他的同时代人Snow根据对霍乱死亡病例及死亡率的深入分析,则得出饮用被污染的水是发生霍乱的原因。
上述诸例子都有统计学的显著性,但与真实情况不符,这种联系是虚假的联系。虚假的联系是二事物实际上不存在联系,是在研究过程中有意或无意(如研究设计的缺陷、调查方法的错误等等偏倚)造成的假象。
(三)间接的联系
图7-2 间接联系示意图
当两种疾病(或事件)(B、C)都与某因素(A)有联系,则这两种疾病存在统计学上的联系,这两种疾病(或事件)的联系是间接的联系,见图7-2。如白发与年龄有关,癌或高血压患病率也随年龄而增加,于是就出现白发的人比非白发的人的高血压(或癌)患病率高,并且有统计学上显著意义。冠心病与肺癌都与吸烟有关,于是冠心病与肺癌的发病率也出现了相关。但是,白发与高血压及癌、冠心病与肺癌并非因果联系,治疗冠心病并不会减少肺癌发病率,治疗高血压也不会减少白发的现患率。这种间接联系的出现,系因有与两种疾病都有关,而其本身又是一个病因的混杂(混淆)因素的存在。此混杂因素在前个例子是年龄,在后个例子是吸烟。
(四)因果联系
排除了虚假的联系和间接的联系之后,两事件间的联系才有可能是因果联系,才可能进行病因推导。