【样本量计算公式】在进行科学研究、临床试验或市场调研等项目时,确定合适的样本量是保证研究结果科学性和可靠性的关键步骤。样本量计算不仅有助于节省资源,还能提高研究的统计效力(power),避免因样本过小导致无法检测到实际存在的差异。
样本量的计算通常基于以下几个因素:
- 研究设计类型(如比较两组均值、比例、相关性等)
- 显著性水平(α)(通常设为0.05)
- 统计功效(1 - β)(通常设为0.8或0.9)
- 预期效应大小(effect size)
- 总体变异程度(如标准差)
以下是几种常见研究设计下的样本量计算公式及说明:
一、两独立样本均值比较(t检验)
公式:
$$
n = \frac{2(Z_{\alpha/2} + Z_{\beta})^2 \sigma^2}{d^2}
$$
- $ Z_{\alpha/2} $:对应于显著性水平的Z值(如α=0.05时为1.96)
- $ Z_{\beta} $:对应于统计功效的Z值(如β=0.2时为0.84)
- $ \sigma $:总体标准差
- $ d $:两组均值的差异(即效应量)
示例:
参数 | 值 |
α | 0.05 |
β | 0.2 |
σ | 1.5 |
d | 0.5 |
代入公式得:
$$
n = \frac{2(1.96 + 0.84)^2 \times 1.5^2}{0.5^2} = \frac{2(7.84) \times 2.25}{0.25} = 141.12
$$
因此,每组需要约 71人(向上取整)。
二、两独立样本比例比较(卡方检验)
公式:
$$
n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 (p_1(1-p_1) + p_2(1-p_2))}{(p_1 - p_2)^2}
$$
- $ p_1, p_2 $:两组的比例
- 其他参数同上
示例:
参数 | 值 |
α | 0.05 |
β | 0.2 |
p1 | 0.3 |
p2 | 0.4 |
代入公式得:
$$
n = \frac{(1.96 + 0.84)^2 (0.3×0.7 + 0.4×0.6)}{(0.3 - 0.4)^2} = \frac{7.84 × (0.21 + 0.24)}{0.01} = \frac{7.84 × 0.45}{0.01} = 352.8
$$
因此,每组需要约 177人。
三、配对样本均值比较(配对t检验)
公式:
$$
n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 \sigma_d^2}{d^2}
$$
- $ \sigma_d $:差值的标准差
- $ d $:期望的差值(效应量)
示例:
参数 | 值 |
α | 0.05 |
β | 0.2 |
σd | 2.0 |
d | 1.0 |
代入公式得:
$$
n = \frac{(1.96 + 0.84)^2 × 2^2}{1^2} = \frac{7.84 × 4}{1} = 31.36
$$
因此,需要约 32人。
四、单样本均值比较(单样本t检验)
公式:
$$
n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 \sigma^2}{d^2}
$$
- $ d $:与已知均值的差异
- 其他参数同前
示例:
参数 | 值 |
α | 0.05 |
β | 0.2 |
σ | 2.5 |
d | 1.0 |
代入公式得:
$$
n = \frac{(1.96 + 0.84)^2 × 2.5^2}{1^2} = \frac{7.84 × 6.25}{1} = 49
$$
因此,需要约 49人。
五、相关性分析(Pearson相关系数)
公式:
$$
n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 + 2Z_{\alpha/2}}{(\log(1 + r) / \sqrt{1 - r^2}))^2}
$$
- $ r $:预期的相关系数
- 其他参数同前
示例:
参数 | 值 |
α | 0.05 |
β | 0.2 |
r | 0.3 |
代入公式后计算得出约为 85人。
总结表格
研究类型 | 样本量公式 | 示例计算结果 |
两独立样本均值比较 | $ n = \frac{2(Z_{\alpha/2} + Z_{\beta})^2 \sigma^2}{d^2} $ | 每组约71人 |
两独立样本比例比较 | $ n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 (p_1(1-p_1) + p_2(1-p_2))}{(p_1 - p_2)^2} $ | 每组约177人 |
配对样本均值比较 | $ n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 \sigma_d^2}{d^2} $ | 约32人 |
单样本均值比较 | $ n = \frac{(Z_{\alpha/2} + Z_{\beta})^2 \sigma^2}{d^2} $ | 约49人 |
相关性分析 | 复杂公式(需查表或软件) | 约85人 |
通过合理使用样本量计算公式,可以有效提升研究的科学性与可行性。实际应用中,建议结合专业统计软件(如GPower、SPSS、R等)进行精确计算。