【峰度计算公式是什么】在统计学中,峰度(Kurtosis)是用来衡量一组数据分布的尖峭程度或尾部厚度的一个指标。它反映了数据分布与正态分布相比的“高峰”或“低谷”特性。峰度可以帮助我们了解数据集中趋势以外的形状特征,对于数据分析和建模具有重要意义。
一、峰度的基本概念
峰度是描述数据分布形态的一个统计量,通常用于判断数据是否具有“尖峰”或“平峰”的特性。与偏度不同,峰度关注的是数据分布的“尾部”和“中心”。
- 高峰度(Leptokurtic):数据分布比正态分布更尖,尾部更厚,极端值出现的概率更高。
- 低峰度(Platykurtic):数据分布比正态分布更平,尾部更薄,极端值出现的概率较低。
- 中峰度(Mesokurtic):与正态分布相似,峰度为3。
二、峰度的计算公式
峰度的计算方式有多种,常见的包括样本峰度和总体峰度两种形式。以下是常用的计算公式:
1. 总体峰度公式(Population Kurtosis)
$$
\text{Kurtosis} = \frac{1}{N} \sum_{i=1}^{N} \left( \frac{x_i - \mu}{\sigma} \right)^4
$$
其中:
- $ x_i $ 是第 $ i $ 个数据点;
- $ \mu $ 是总体均值;
- $ \sigma $ 是总体标准差;
- $ N $ 是数据总数。
2. 样本峰度公式(Sample Kurtosis)
$$
\text{Kurtosis} = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)}
$$
其中:
- $ x_i $ 是第 $ i $ 个样本数据;
- $ \bar{x} $ 是样本均值;
- $ s $ 是样本标准差;
- $ n $ 是样本数量。
> 注意:有些软件或教材中会使用不同的调整方式,例如将峰度减去3,以使其与正态分布对比时更直观(即“超额峰度”)。此时峰度值为0表示与正态分布相同。
三、峰度的分类与解释
| 峰度值 | 分类 | 特征说明 |
| < 3 | 低峰度 | 数据分布较平坦,尾部较薄 |
| = 3 | 中峰度 | 与正态分布相似 |
| > 3 | 高峰度 | 数据分布更尖,尾部更厚 |
四、总结
峰度是衡量数据分布形态的重要指标,能够帮助我们理解数据的集中趋势和尾部行为。通过计算峰度,我们可以判断数据是否服从正态分布,或者是否存在异常值。在实际应用中,峰度常与偏度一起使用,以全面分析数据的分布特征。
| 指标 | 公式 | 说明 |
| 总体峰度 | $ \frac{1}{N} \sum_{i=1}^{N} \left( \frac{x_i - \mu}{\sigma} \right)^4 $ | 适用于总体数据 |
| 样本峰度 | $ \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)} $ | 适用于样本数据,考虑无偏估计 |


