医学论文中统计分析错误辨析与释疑_3定性资料分析方法的合理选择
时间:2025-05-14
时间:2025-05-14
259
争鸣与教育
医学论文中统计分析错误辨析与释疑———
定性资料分析方法的合理选择(3)
胡良平 刘惠刚 李子建
一、采取简单压缩的方法将三维表降为二维表很多医学期刊论著中都采用简单压缩的方法将三维列联表降为二维列联表,例如有人觉得不便用一般的χ2检验处理表1资料(因为它包含3个定性
表1 孕妇在两个诊所接受产前护理量与婴儿存活情况的
观察结果
接受护理地点诊所A诊所B
产前护理量少多少多
婴儿例数死
34172
χ2=51256,11863%)之间的差异具有统计学意义(
P=010219)。这样做对吗?其结论可信吗?
对差错的辨析:上述压缩的方法称为简单压缩,仅当被压缩掉的定性变量与保留下来的定性变量之间是互相独立时,这种简单压缩才不易导致错误的
结论,否则,很可能会得出错误的结论来。释疑:判断上述简单压缩的结论是否正确的简便方法是计算“比数比(”,若各分表(皆为四格表)的OR值接近,则采取简。本例:
==11249bc176×4对诊所B而言:OR===01992
bc197×2
这两个OR值都比较接近于1,对OR=11249
婴儿死亡率
活
17629319723
(%)1.6761.3477.9448.000
而言:OR=
变量,况),,使之仅包含产前护理量和婴儿存活状况两个定性变量,以便采用一般χ2检验处理之。他们采取的方法是:将来自两个地点的接受护理量少与接受护理量多的数据分别合并,使一个原本属于“结果变量为二值变量的三维列联表资料”变成了一个“四格表资料”,简单合并后的数据见表2,采用一般χ2检验对表2资料进行
表2 孕妇在两个诊所接受产前护理量与婴儿存活情况的
观察结果(表1的压缩表)
产前护理量
少
多
婴儿例数死
206
检验H0:总体OR=1、H1:总体OR≠1,得P=01773;对OR=01992检验H0:总体OR=1、H1:总
体OR≠1,得P=01992。故可认为:孕妇接受的产前护理量与婴儿存活状况之间的交互作用无统计学意义,即婴儿存活状况与孕妇产前接受护理量多少无关。但是,当我们计算一下表2资料中的OR值,并对其进行假设检验,结果如下。
对压缩后的资料而言:OR=21824
==bc373×6
此时,OR与1之间有较大的差距,若对OR=
婴儿死亡率
(%)5.0891.863
活
373316
21824检验H0:总体OR=1、H1:总体OR≠1,得P=01022。说明由表2资料应得出“孕妇接受的产前
护理量与婴儿存活状况之间的交互作用有统计学意义”的结论来,即“婴儿存活状况”与“孕妇产前接受的护理量多少”有关,接受护理量多者其所生婴儿的
死亡率明显降低。
上述两种分析方法得出了截然相反的结论,究竟谁对谁错?答案是后者(简单压缩法)错了!因为
(原因变量之一)与被合并掉的“孕妇接受护理地点”(原因变量之二)““孕妇接受护理量多少”、婴儿存活
(结果变量)之间都不独立,在这种情况下,是状况”
统计分析,得到的结果为:χ2=51256,P=010219,
专业结论为:孕妇在产前接受护理量少者其所生婴儿的死亡率明显高于孕妇在产前接受护理量多者其所生婴儿的死亡率,两个死亡率(分别为51089%与
作者单位:100850军事医学科学院生物医学统计咨询中心(胡良平、李子建);首都医科大学继续教育学院(刘惠刚)
260 不适合通过简单合并方式来消除“孕妇接受护理地
(原因变量之一)的影响的。点”
说明这一结论正确性的最好方法是采用“对数线性模型”处理表1资料,设:a代表“婴儿存活状况”、b代表“孕妇产前接受的护理量多少”、c代表“孕妇接受护理地点”,运用国际上著名的统计分析系统SAS软件中的CATMOD过程进行对数线性模型分析,其主要结果概括如下:
11包含a、b、c、ab、ac、bc、abc的饱和模型的计算结果:显示c、ab、abc无统计学意义,但对整个模型无法进行假设检验,因为没有误差项了,故不便作出明确评价。
21包含a、b、c、ab、ac、bc的非饱和模型的计算
孕妇接受护理地点)与变量a(婴儿存活状况)和变
量b(孕妇产前接受的护理量多少)之间都是互相不独立的,因此,不能通过简单合并的方法将其消除掉,简单消除后计算所得出的结论是错误的!
本例的正确结论应当是什么?从对数线性模型的结果似乎不能明显看出,若采用加权χ2检验和MHχ2检验消除“接受护理地点”的影响,着重考察“接受护理量少”与“接受护理量多”两种条件下“婴儿死亡率”之间的差别是否具有统计学意义,可得到如下的结果:
(1)回答产前护理量少与多的婴儿死亡率之间
2
的差别有无统计学意义的加权χ2检验χ加权=
表3 乳腺癌患者3年存活情况的调查研究结果
确诊患者炎症核的中心年龄反应量级东京
<50
结果:显示c、ab无统计学意义,对整个模型进行模型与资料是否吻合的拟合优度假设检验的结果为:似然比统计量的值=0104,自由度=1,P=018352,故可以认为此模型对资料的拟合优度较好,但由于模型中还包含无统计学意义的项,特别是包含ab这个无统计学意义的交互作用项,好的模型。
31包含a、b、c、ab、ac果:显示c,:似然比统计量的值=188112,自由度=2,P<010001,故可以认为此模型对资料的拟合优度很不好,需要进一步寻找好的模型。
41包含a、b、c、ab、bc的非饱和模型的计算结果:显示模型中的各项均有统计学意义,对整 …… 此处隐藏:2664字,全部文档内容请下载后查看。喜欢就下载吧 ……
上一篇:复旦大学本科生转专业实施细则
下一篇:三角形面积公式教案