【样本标准差公式】在统计学中,样本标准差是一个重要的指标,用于衡量一组数据的离散程度。它反映了数据点与样本均值之间的偏离程度。由于样本数据通常不包含全部总体信息,因此样本标准差的计算方式与总体标准差有所不同。
一、样本标准差的定义
样本标准差(Sample Standard Deviation)是描述样本数据波动大小的一个统计量,其计算公式为:
$$
s = \sqrt{\frac{1}{n - 1} \sum_{i=1}^{n}(x_i - \bar{x})^2}
$$
其中:
- $ s $ 表示样本标准差
- $ n $ 表示样本容量
- $ x_i $ 表示第 $ i $ 个样本数据
- $ \bar{x} $ 表示样本均值
注意:与总体标准差不同,样本标准差使用的是 $ n - 1 $ 而不是 $ n $,这是为了对总体标准差进行无偏估计。
二、样本标准差的计算步骤
1. 计算样本均值:将所有数据相加,除以样本数量 $ n $。
2. 计算每个数据与均值的差:即 $ x_i - \bar{x} $。
3. 平方这些差值:得到 $ (x_i - \bar{x})^2 $。
4. 求和这些平方差:即 $ \sum (x_i - \bar{x})^2 $。
5. 除以 $ n - 1 $:得到样本方差。
6. 开平方:得到样本标准差。
三、样本标准差与总体标准差的区别
| 项目 | 样本标准差 | 总体标准差 |
| 公式 | $ s = \sqrt{\frac{1}{n - 1} \sum (x_i - \bar{x})^2} $ | $ \sigma = \sqrt{\frac{1}{N} \sum (x_i - \mu)^2} $ |
| 分母 | $ n - 1 $(无偏估计) | $ N $(整体数据) |
| 应用场景 | 从总体中抽取样本时使用 | 已知全部数据时使用 |
四、举例说明
假设我们有以下样本数据:
5, 7, 8, 10, 12
1. 计算均值:
$$
\bar{x} = \frac{5 + 7 + 8 + 10 + 12}{5} = \frac{42}{5} = 8.4
$$
2. 计算每个数据与均值的差并平方:
$$
(5 - 8.4)^2 = 11.56 \\
(7 - 8.4)^2 = 1.96 \\
(8 - 8.4)^2 = 0.16 \\
(10 - 8.4)^2 = 2.56 \\
(12 - 8.4)^2 = 12.96
$$
3. 求和:
$$
11.56 + 1.96 + 0.16 + 2.56 + 12.96 = 30.2
$$
4. 除以 $ n - 1 = 4 $:
$$
\frac{30.2}{4} = 7.55
$$
5. 开平方:
$$
s = \sqrt{7.55} \approx 2.75
$$
因此,该样本的标准差约为 2.75。
五、总结
样本标准差是衡量数据离散程度的重要工具,尤其在实际数据分析中广泛应用。它的计算方式不同于总体标准差,主要体现在分母使用的是 $ n - 1 $,以保证对总体的无偏估计。掌握样本标准差的公式与计算方法,有助于更好地理解数据分布特征。
| 关键点 | 内容 |
| 样本标准差公式 | $ s = \sqrt{\frac{1}{n - 1} \sum (x_i - \bar{x})^2} $ |
| 用途 | 描述样本数据的离散程度 |
| 与总体标准差区别 | 分母为 $ n - 1 $,用于无偏估计 |
| 计算步骤 | 均值 → 差值 → 平方 → 求和 → 除以 $ n - 1 $ → 开根号 |
如需进一步了解样本方差或标准差在实际中的应用,可参考相关统计分析案例。


