2002级预防医学专业卫生统计学试题答案A卷
发布时间:2024-08-27
发布时间:2024-08-27
2002
山东大学公共卫生学院
(2005——2006学年第二学期)
2002级预防医学专业《卫生统计学》试题答案(A 卷)
一. 简答题
1、描述定量资料集中趋势的描常用指标有均数、几何均数、中位数等。 ①均数(mean ,average ):常用X 表示样本均数,μ表示总体均数。 a 、直接法:样本含量较少时,其公式为:n
X X X n X
X n ++==∑21 b 、加权法:用于频数表资料或样本中相同观察值较多时,其公式为:
f
fx f f f x f x f x f x k k k ∑∑=++++= 212211 适用范围:正态或近似正态分布的数值变量资料。
②几何均数:用G 表示。
a 、直接法: n n X X X G ...21=
或 )lg (lg )lg ...lg lg (lg 1211
n X n X X X G n ∑--=+++= b 、加权法: )lg (lg ....lg ...lg lg (lg 12122111
∑∑--=++++++=f X f f f f X f X f X f G k k k 适用范围:①对数正态分布;②等比级数资料。
③中位数: 用M 表示。
a 、直接法:n 为奇数 , 2)
1(+=n X M ; n 为偶数,)(21122++=n n X X M 。 b 、频数表法: ∑-+=)2
(L M f n f i
L M 式中:L 、i 、M f 分别为M 所在组段的下限、组距和频数;
∑L f 为小于L 的各组段
的累计频数。 适用范围:①非正态分布资料(对数正态分布除外);②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。
2、答案:假设检验中的第一类错误是指“拒绝了实际上成立的H 0假设”时所犯的错误,当H 0成立时犯第一类错误的概率等于检验水准α。假设检验中的第二类错误是指“不拒绝实际上不成立的H 0假设”时所犯的错误,其概率通常用β表示,其大小与抽样误差大小及设定的检验水准α有关。
3、答案: (1)当n ≥40且所有的T ≥5时,用2x 检验的基本公式,当p≈α时,改用四格表的fisher 确切概率法。
(2)当n ≥40但有15<≤T 时,用2x 检验的校正公式或改用fisher 确切概率法。
2002
(3)当n<40或T<1时,使用 fisher 确切概率法。
4、答案:方差分析的基本思想是:将所有观察值的总变异按照研究目的和设计类型分解为若干部分,每个部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差引起的变异(用F 值反映它们之间的关系),即可了解该因素对研究变量有无影响。 应用条件:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等,即方差齐。
5、答案:实验设计的基本要素包括:处理因素、受试对象、实验效应。
实验设计的基本原则包括:对照的原则、随机的原则、重复的原则,均衡的原则。
二、计算题
1、答案:①n=120 , x =418.0000 , s =29.0000,96.12=αu
95%正常成年女性红细胞数所在范围:
00.2996.100.4182⨯±=±s u x α=(361.16, 474.84)×104/mm 3
②已知:n=120 , x =418.0000 , s =29.0000,96.12=αu
总体标准差未知,故用样本标准差29.0000代替总体标准差,得:
95%可信区间为:
120/00.2996.100.418/⨯±=±n s u x α=( 412.81, 423.19)×104/mm 3
2、答案:
H0:差值的总体均数等于0
H1:差值的总体均数不等于0
α=0.0500
n=10,7950.0=,5283.0=d s ,
7587.410
/5283.07950.0/===n s d t d 262.29,2=αt ,可得P <0.05,按α=0.0500水准拒绝H0,接受H1,故可认为两组的结果有差别.
3、答案:
(1)、先作散点图:
2002
由散点图可知,存在直线趋势,可以进行回归分析。 相关系数(r)=0.89628654
(2)、求直线回归方程:
()92.15801263134761222=-=∑-
∑=n X X l XX
()()96.2341225.22463177.12026=⨯-=∑∑-∑=n Y X XY l XY ()47.4312
25.224141.4234222=-=∑-∑=n Y Y l YY
求回归系数和截距:
1486.092
.158096.234===XX XY l l b 87.10=-=X b Y a
故所求直线回归方程为 X Y
1486.087.10ˆ+=。
(3)、回归系数的假设检验:
①方差分析
Ho:总体回归系数等于0,即β=0
H1:总体回归系数不等于0,即β≠0
α=0.0500(双侧)
()()n
Y Y Y Y SS 222∑-∑=-∑=总 =43.47 XX
XY XY l l bl SS 2==回归 =34.92 回归总剩余SS SS SS -==8.55
剩回剩剩回
回MS MS SS SS F ==νν//=40.85
2002
结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,可以认为回归方程成立。 ②回归系数t 检验
Ho:总体回归系数等于0,即β=0
H1:总体回归系数不等于0,即β≠0
α=0.0500(双侧)
102122,3911.6=-=-===n s b t b b ν
查表得P=0.0001
结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,可以认为回归方程成立。 ③相关系数的假设检验:
Ho:总体相关系数等于0,即ρ=0
H1:总体相关系数不等于0,即ρ≠0
8963.047.4392.158096.234=⨯=YY XX XY
l l l r ;102,3911.62102=-==--=-=n n r
r s r t r ν
结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,故可认为自变量和因变量之间有直线关系.
三、计算机实验
A
1. 配对t 检验:
①建立假设: H 0:μd =0 H 1:μd ≠0 α=0.05
②计算统计量: t=-0.53 P=0.6075
③结论:P>0.05,不拒绝H 0,差异无统计学意义,尚不能认为该药对患者的白细胞数有影响。
2. 两组构成比比较:
①建立假设: H 0:脑血栓病人与健康人的血型分布构成相同
H 1:脑血栓病人与健康人的血型分布构成不同 α=0.05
②计算统计量: χ2 =3.9412 P=0.2679
③结论:P>0.05,不拒绝H 0,差异无统计学意义,尚不能认为脑血栓病人与健康人的血型分布不同。
3. 单因素方差分析:
①建立假设: H 0:三组煤矿工人的肺活量总体均数相同
H 1:三组煤矿工人的肺活量总体均数不全相同 α=0.05
②计算统计量: 方差分析表
变异来源 自由度 SS MS F P
组间 2 9.2657 4.6328 84.54 <0.0001
组内 28 1.5343 0.0548
总 30 10.8000
③结论:拒绝H 0,接受H 1,差异有统计学意义,认为三组煤矿工人的肺活量总体均数不全相同。
(两两比较不作要求)经SNK 法作两两比较:在α=0.05的水准上认为三组工人的肺活量各不相同
2002
4. 先作统计描述:
对照组: n=8 均数=0.555 标准差=0.2019
肝硬化病人:n=7 均数=1.517 标准差=1.0111 标准差相差悬殊,须作方差齐性检验:F=25.07 P=0.0004 认为方差不齐两样本均数比较t检验:
①建立假设: H0:μ1=μ2 H1:μ1≠μ2α=0.05
②计算统计量:t’= 2.47 P=0.0456
③结论:拒绝H0,接受H1,差异有统计学意义,可认为对照组和肝硬化病人的血浆肾素活性不同。
5.直线相关回归分析:
⑴相关分析:
①建立假设: H0:ρ=0 H1:ρ≠0 α=0.05
②计算统计量: r=0.8715 P=0.0010
③结论:P<0.001,拒绝H0,接受H1,相关系数有统计学意义,可认为儿童的发硒与
血硒有直线关系,且关系密切,可以建立回归方程。
⑵回归分析:建立回归方程: y=0.23581x-6.9803
回归系数假设检验:①建立假设: H0:β=0 H1:β≠0 α=0.05
②计算统计量:方差分析表
变异来源自由度SS MS F P
回归 1 75.6488 75.6488 25.27 0.0010
剩余8 23.9512 2.9939
总9 99.6000
或t检验: t=5.03 P=0.0010
③结论:P<0.001,拒绝H0,接受H1,回归系数有统计学意义,可用发硒测定值推测血硒含量。
B
1. 三组样本率比较:
①建立假设: H0:π1=π2=π3 H1:三地污染率不全相同α=0.05
②计算统计量:χ2 =1.0888 P=0.5802
③结论:P>0.05,不拒绝H0,差异无统计学意义,尚不能认为三地污染率有差别。
2. 先作统计描述:
肝炎病人: n=10 均数=2.324 标准差=0.124
健康人: n=10 均数= 2.732 标准差=0.1077 两样本均数比较t检验:方差齐性检验不作要求:F=1.33,P=0.6806
①建立假设: H0:μ1=μ2 H1:μ1≠μ2α=0.05
②计算统计量: t=7.86 p<0.0001
③结论:拒绝H0,接受H1,差异有统计学意义,可认为肝炎病人与健康人的血清转铁蛋白含量不同。
3. 随机区组设计方差分析:
①建立假设:处理间H0:三种饲料增重相同 H1:三种饲料增重不全相同
区组间H0:六组小鼠增重相同 H1:六组小鼠增重不全相同α=0.05
②计算统计量:方差分析表
2002
变异来源 自由度 SS MS F P 处理间 2 224.64 112.32 2.25 0.1563 区组间 5 2478.65 495.73 9.92 0.0012 误差 10 499.71 49.97 总
17
3203.00
③结论:处理间P>0.05,不拒绝H 0,差异无统计学意义,尚不能认为三种饲料增重效果不同;区组间P<0.05,拒绝H 0,接受H 1,差异有统计学意义,可认为六组小鼠增重不全相同。
4. 三组等级资料比较,秩和检验:
①建立假设: H 0:三种治疗方法疗效总体分布相同
H 1:三种治疗方法疗效总体分布不全相同 α=0.05
②计算统计量: K-W 检验 χ2
=-67.81 P<0.0001
③结论:拒绝H 0,接受H 1,差异有统计学意义,可认为三种方法疗效不全相同。
5. 绘制散点图发现其有曲线趋势,不存在直线关系。
不同距离空气中氯化物浓度
00.20.40.60.810
100
200
300
400
500
距离(m)
浓度(m g /m 3)
C
1. 两样本率比较:
①建立假设: H 0:π1=π2 H 1:π1≠π2 α=0.05
②计算统计量: χ2
=6.1331 P=0.0133
③结论:P<0.05,拒绝H 0,接受H 1,差异有统计学意义,可认为两种药物的疗效不同。
2.样本均数与总体均数比较:
①建立假设: H 0:μ=μ0 H 1:μ≠μ0 α=0.05 ②计算统计量: t=7.00 p<0.0001
③结论:拒绝H 0,接受H 1,差异有统计学意义,可认为慢性气管炎患者与正常人乙酰胆碱酯酶有差别。
3.两组比较秩和检验:
描述其平均水平:用中位数 M1=3.5 M2=2 ①建立假设: H 0:两组小鼠肺癌转移病灶个数的总体分布相同
H 1:两组小鼠肺癌转移病灶个数的总体分布不同 α=0.05
②计算统计量: (Wilcoxon 法比较): Z=2.0885 P=0.0368
③结论:拒绝H 0,接受H 1,差异有统计学意义,可认为两组小鼠肺癌转移病灶个数的总
2002
体分布不同。
4.两因素方差分析:
①建立假设:处理间H0:三种疗法效果相同 H1:三种疗法效果不全相同
区组间H0:八组患儿疗效相同 H1:八组患儿疗效不全相同α=0.05
②计算统计量:方差分析表
变异来源自由度SS MS F P
处理间 2 91.75 45.875 12.95 0.0007
区组间7 260.6667 37.238 10.51 0.0001
误差14 49.5833 3.5417
总23 402.0000
③结论:处理间P<0.05,拒绝H0,接受H1,差异有统计学意义,可认为三种疗法效果不全相同;区组间P<0.05,拒绝H0,接受H1,差异有统计学意义,可认为八组患儿疗效不全相同。
5. 直线相关回归分析:
⑴相关分析:
①建立假设: H0:ρ=0 H1:ρ≠0 α=0.05
②计算统计量: r=0.52554 P=0.0793
③结论:P>0.05,不拒绝H0,相关系数无统计学意义,尚不能认为新生儿的体重和胃容
量有直线关系。
D
1. 先作统计描述:
甲组: n=9 均数=6.18 标准差=1.15
乙组: n=9 均数=8.11 标准差=1.57
两样本均数比较t检验:方差齐性检验不作要求:F=1.87 P= 0.3962 方差齐
①建立假设: H0:μ1=μ2 H1:μ1≠μ2α=0.05
②计算统计量: t= 2.98 P=0.0089
③结论:拒绝H0,接受H1,差异有统计学意义,可认为两种食物对肠蠕动的效果不同。
2. 配对χ2检验:
①建立假设: H0:B=C H1:B≠C α=0.05
②计算统计量:χ2 =3.00 P=0.0833
③结论:不拒绝H0,差异无统计学意义,尚不能认为两种方法对乳腺癌的检出率有差别。
3. 单因素方差分析:
①建立假设: H0:三组大鼠脾中DNA含量总体均数相同
H1:三组大鼠脾中DNA含量总体均数不全相同α=0.05
②计算统计量:方差分析表
变异来源自由度SS MS F P
组间 2 47.1663 23.5831 10.55 0.0007
组内20 44.7180 2.2359
总22 91.8843
2002
③结论:拒绝H0,接受H1,差异有统计学意义,可认为三组大鼠脾中DNA含量总体均数不全相同。
(两两比较不作要求)经SNK法作两两比较:在α=0.05的水准上认为对照组高于其它两组。
4. 双向无序列联表,作χ 2 独立性检验
①建立假设: H0:幽门螺杆菌的基因分型与胃肠疾病无关
H1:幽门螺杆菌的基因分型与胃肠疾病有关α=0.05
②计算统计量:χ2=-11.10 P=0.0854
③结论:P>0.05,不拒绝H0,尚不能认为幽门螺杆菌的基因分型与胃肠疾病有关系。
5. Ⅰ型回归分析:
⑴在计算机上作散点图有直线趋势,作直线回归分析,不要求画在试卷上。
⑵回归分析:建立回归方程: y=13.13556+4.4300x
回归系数假设检验:①建立假设: H0:β=0 H1:β≠0 α=0.05
②计算统计量:方差分析表
变异来源自由度SS MS F P
回归 1 1177.49 1177.49 373.84 <0.0001
剩余7 22.05 3.15
总8 1199.54
或t检验: t=19.33 P<0.0001
③结论:P<0.001,拒绝H0,接受H1,回归系数有统计学意义,可
认为标准系列浓度与仪器测定值有线性关系。