抽样调查样本量的确定
时间:2026-01-22
时间:2026-01-22
维普资讯 http://www.77cn.com.cn
抽样调查样本量的确定侯志强吴启富。
(. 1北方工业大学,北京 104; . 00 1 2中国人民大学统计学院,北京 107; .首都经济贸易大学统计学院, 0 82 3北京 1 06 0 2) 0摘要:样本量确定是抽样调查中的一个重要内容。确定样本量需要综合考虑费用与精度。抽样方式也是影响样本量的一个重要因素。简单随机抽样估计总体比例确定样本量需要同时考虑两个精度要求,即估计量方差上限与估计量离散系数上限。分层随机抽样的样本量还受各层样本量分配方式的影响。复杂抽样的样本量需要借助抽样设计效应才能计算。样本量经过调整后才能满足实际调查的需要。 关键词:抽样调查;样本量;费用;精度;设计效应
引言抽样调查是按照随机原则从总体中抽取部分个体进行一
、
当/≤时, t ' L样本量可取 1与 1之间的任何值; 1 1, , 当/>1时,需认真权衡费用与精度,费用更重 t, ' 1 L 必若要,则取 1; 1否则,, 取。
观察并据此对总体参数作出一定可靠程度推断的科学。抽取个体的数量称为样本量。在一定抽样方式下,样本容量越大,估计精度就越高,所需费用也就越大。因此,样本量受费用与精度的双重制约。简单随机抽样样本量的确定是其它抽样方式样本量确定的基础。在简单随机抽样中,常需要经估计几个总体比例,有些总体比例较大,有些则较小,但许多
若需要估计总体比例 P则其简单估计量为样本比例P,,在重复抽样条件下,计量方差为估n, 1 n、
D( )= p 一
1 1,
() 6
若要求估计量 P的方差不许超过常数 V则有,1 1,
人总是根据估计量方差上限这个唯一的精度要求确定所谓的“保守”样本量,殊不知当所要估计的总体比例很小时,这个“保守”的样本量根本谈不上“守”保。本文试图解决这个问题,并探讨其它抽样方式下样本量的确定问题。
≤
() 7
从而样本量满足n; () 8
二、简单随机抽样样本■的确定在简单随机抽样下,若给定费用要求,则可通过费用函数确定样本量。通常的费用函数为C= 0+ l r c C1 1, () 1
容易知道, (一 ) P= .时取到最大值 02, P 1 P在 0
5 .5从而可得一个“保守”的样本量: a
02 5 .弋7_
() 9,
其中,示总费用,表示固定费用,。示调查一 C表 C 0 c表个样本单元的平均费用,1 1,表示样本量。 那么,量为样本CI-,n:——
许多人正是根据式 ( ) 9来确定所谓的“保守”本量,样但对于较小的总体比例 P这个“,保守”样本量从估计量离散系
数的角度看根本谈不上“保守”。详述如下:() 2
c O
已知估计量 P的离散系数为c( p)== ( 0 1)
C1
通过式 ( )以确定样本量的上限, 2可即总费用所允许的最大样本量,为 1。记 1, 简单随机抽样的样本量还可通过精度确定,常规定估通计量方差的上限。
从式 (0可以看出, 1“守” 1)当1保,取的样本量 1时, 1,随着 总体比例 P从 1 0变化,到估计量的离散系数 C ( )渐增 Vp逐加。不难想象, P小到一定程度时,C ( )大到不能容当 Vp将忍的程度。
例如,已知总体方差为 o, 2需估计总体均值,其简单估计量为样本均值,在重复抽样条件下,计量方差为则估D( ): 1, 1 () 3
个自然的修正方法是:除根据估计量的方差上限确定样本量外,根据估计量的离散系数上限确定样本量,后再然一
若要求估计量的方差不许超过常数 V则有,1 1,
取两者中较大者。
≤V
() 4
设最小的总体比例 P= L限定估计量 p的离散系数不 P,许超过常数 C。则根据式 (0,得另一个“守”样 1)可保的本量:
从而样本量满足2
n≥
() 5
—— CP 2L
L1 ) ( 1
通过式 ( )以确定样本量的下限, 5可即精度所允许的最小样本量,为 1。记 1,
这样,两个“守”本量的较大者,取这保样即r=rl(t, 6 t rx r r ) l t x ( 2 1)
1 8经济理论研究 O
维普资讯 http://www.77cn.com.cn
新视角则可同时满足估计量方差上限与估计量离散系数上限这两个精度要求。 当总体比例 P特别小且又得不到较可靠的估计 P时,利用式 ( ) 9或式 (1计算的样本量不太令人满意, 1)这是因为对于 P的波动非常敏感, P的较小
波动会导致的较大波动。逆抽样方法可以解决这个问题。 逆抽样方法要求事先确定一个较小的正整数 m(m越大,估计精度就越高)然后进行简单随机抽样,,直到抽中 m 个具有所考虑特征的单元为止。设此时样本量为 n容易知,道,是一个随机变量, n且近似服从负二项分布,其期望为E( ): m n (3 1)
样,第一阶段采用分层 P S抽样抽取初级抽样单元 ( S ) P PU,第二阶段采用整群系统抽样抽取最终抽样单元 ( S ) U U。当实际产生的 U U过大时, S还需要进行第三阶段抽样。 CS P对全国失业率估计的精度要求是离散系数不许超过 18 .%。假定全国失业率的下限=%则根据式( 1可 5 1)以确定简单随机抽样的样本量=562人,需调查 84即562个经济活动人口。按每户两个经济活动人口折算, 84共需调查 2 3 1家庭。 92户
根据历史数据,值在 13左右, d .因此,P C S的样本量应为 23 1 . 3 18。 92×13= 8 1户
五、样本量的调整抽样调查不可避免存在无回答现象,以,所实际调查中,必须对上述样本量进行调整。调整公式为调整后样本量=
下一篇:《图像处理》实验4:伪彩色增强