样本量估算的统计学方法
时间:2025-07-08
时间:2025-07-08
8、样本量估算 的统计学方法骆福添 公共卫生学院参考教材:《生物医学研究的统计方法》
主编:方积乾,2007,高等教育出版社
一、临床研究为什么需 要估计样本含量
复习1:统计学三大任务与三大规则
任务:描述样本特征、估计总体参数、 检验总体差别
规则:(必须考虑) 数据类型、分布类型、对比类型
1. 统计描述任务例:某样本个体分布的集中趋势与离散趋势怎 样 ?(1V点,2V线,3V面.影子_线)
数据:计数(%),定量(平均数),等级 (平均Ridit值) 分布:正态(Mean,SD,95%CR),对数正 态(G),偏态(M, Q/R,P2.5~P97.5) (双/多变 量-相关回归) 对比:变量=两组观察值(各组均数与标准 差),变量=差值(差值的均数与标准差)
2. 置信区间任务例:某总体指标在哪一区间 ?(借鉴反推)
数据:计数(直接法/正态近似),计量(正 态法),等级(正态近似)
分布:正态(正态法),对数正态(lg值置信 区间),偏态(百分位数法)对比:变量参数置信区间,差值参数置信 区间(临床试验)
3. 假设检验任务例:某2个总体指标相同 ? (直接应用概率分布)
数据:计数(正态近似法u,卡方),计量 (均数检验),等级(秩和检验) 分布:正态(u,t),对数正态(lg值t检验), 偏态(秩和检验)对比:组间比较(u, t, H),与总体比较(u, t, H)
统计推断中的误差估计最基本公式:
误差=个体变异程度/n的平方根
均数误差 = 标准差/sqrt(n) 率的误差 = sqrt[p(1-p)/ n]
n大小举例
1、n=3,三个克隆 2、女大学生33%自动退学? n=? 3、n1=20,n2=100,n=? 4、1987年某产科医师为研究胎次与儿童智 力的关系,收集病案资料(考上大学人数): 第一胎19人、第二胎18人、第三胎10人、第 四胎7人、第五胎4人。由此得出结论:智力 与胎次有关,胎次愈多智力愈差,第一胎智 力最好。 n=?
可重复原则
样本含量(Sample)的估计是临床研 究科学设计的重要内容。
可重复性,是指任何科学研究必须遵
守的原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律 性的结论。
样本含量的大小
在临床研究中,样本含量越小,其抽 样误差越大。 若样本含量不足,可重复性差,检验 效能低,不能排除偶然因素的影响, 其结论缺乏科学性、真实性。 若样本含量过大,试验条件难以严格 控制,容易造成人力、物力和时间上 的浪费。
估计样本含量的目的
在保证某个临床试验/临床研究的结论 具有一定科学性、真实性和可靠性前
提下,确定某研究所
需的最小观察例数。
二、估计样本含量 的方法
两大类方法
1、公式法,可满足多种设计的要求, 目前应用广泛。
2、查表法,简单、方便,但受条件限制,有时不一定完全适应。
三、估计样本含 量的步骤
1、确定设计方法
任何临床试验,其设计方案是首先需 要确定的,而样本含量的估计也是在 设计方案基础上的。不同的临床科研 设计方法,其样本含量的估计方法不
相同
2、确定资料类型
当临床试验的设计方案确定后,需要 确定临床试验所得数据的类型,例如, 计量(数值)、计数(无序分类)、 等级(有序分类),因为样本含量估
计方法与数据类型有关
上一篇:小学生魔方比赛规则