Math——有限总体校正


整体说明

  • 为了从总体 规模为 \( N \) 的有限样本中需要抽取的样本单位数量,用于在满足特定精度要求的前提下开展抽样调查或统计分析
  • 统计学中称满足特定精度最小需要的样本总数有限总体校正(Finite Population Correction, FPC)
  • 最小需要的样本总数常常用 \( n \)

有限总体校正的定义

  • 有限总体校正(Finite Population Correction, FPC)样本量计算公式:
    $$ n = \frac{N \cdot Z^2 \cdot \sigma^2}{E^2 \cdot (N-1) + Z^2 \cdot \sigma^2} $$
    • 上述公式适用于总体规模 \( N \) 有限(而非无限大)的场景(例如从1000人的班级中抽样,而非从“所有中国人”中抽样)
  • 各参数含义如下:
    • \( n \) :目标样本量 ,最终需要抽取的样本数量,公式计算结果
    • \( N \) :总体规模 ,研究对象的总数量,如某学校的总学生数、某企业的总员工数
    • \( Z \) :Z值 ,对应指定置信水平的标准正态分布分位数,如95%置信水平对应的 \( Z \approx 1.96 \),99%置信水平对应的 \( Z \approx 2.58 \)
    • \( \sigma^2 \) :总体方差 ,总体中研究变量的离散程度,若总体方差未知,通常用历史数据或预调查的样本方差 \( s^2 \) 替代
    • \( E \) :边际误差(允许误差) ,抽样结果与总体真实值的最大允许偏差,如“调查结果误差不超过3%”,则 \( E = 0.03 \)

有限总体校正公式适用场景

  • 当总体规模 \( N \) 较大(如 \( N > 1000 \))且抽样比例(\( n/N \))较小时(通常小于5%),有限总体校正的影响可忽略,公式可简化为无限总体下的样本量公式:
    $$ n \approx \frac{Z^2 \cdot \sigma^2}{E^2} $$
  • 当总体规模 \( N \) 有限(如 \( N < 1000 \))或抽样比例较大(如超过5%)时,必须使用原公式(含有限总体校正项)计算 \( n \),否则会导致样本量估算偏大,造成资源浪费