【四分位差怎么计算】四分位差(Interquartile Range,简称IQR)是统计学中用于衡量数据分布离散程度的一个重要指标。它表示中间50%的数据范围,即第三四分位数(Q3)与第一四分位数(Q1)之间的差值。相比极差(最大值减最小值),四分位差更能反映数据的集中趋势,且对异常值不敏感。
一、什么是四分位差?
四分位差(IQR)= Q3 - Q1
其中:
- Q1(第一四分位数):将数据从小到大排列后,位于25%位置的数值。
- Q3(第三四分位数):将数据从小到大排列后,位于75%位置的数值。
四分位差越大,说明数据越分散;反之,数据越集中。
二、四分位差的计算步骤
| 步骤 | 内容 |
| 1 | 将数据按从小到大的顺序排列。 |
| 2 | 确定数据个数n,并计算Q1和Q3的位置。 |
| 3 | 根据位置公式找到对应的数值,确定Q1和Q3。 |
| 4 | 计算IQR = Q3 - Q1 |
三、如何计算Q1和Q3?
1. 数据个数为奇数时:
例如:数据为 [1, 3, 5, 7, 9
- 中位数(Q2)为5
- Q1为第(1+5)/4 = 第2个数,即3
- Q3为第(3×(1+5))/4 = 第4个数,即7
- IQR = 7 - 3 = 4
2. 数据个数为偶数时:
例如:数据为 [2, 4, 6, 8, 10, 12
- 中位数为 (6 + 8)/2 = 7
- Q1为第(1+6)/4 = 第1.75个数,取第1和第2个数的平均值,即(2 + 4)/2 = 3
- Q3为第(3×(1+6))/4 = 第5.25个数,取第5和第6个数的平均值,即(10 + 12)/2 = 11
- IQR = 11 - 3 = 8
四、四分位差的应用场景
| 场景 | 应用 |
| 数据分析 | 判断数据的集中趋势和离散程度 |
| 异常值检测 | 通过IQR识别异常值(通常定义为低于Q1 - 1.5×IQR或高于Q3 + 1.5×IQR) |
| 比较不同数据集 | 快速比较两组数据的波动情况 |
五、四分位差的优缺点
| 优点 | 缺点 |
| 对异常值不敏感 | 不能反映所有数据的离散程度 |
| 易于理解和计算 | 需要数据排序,计算过程稍繁琐 |
六、表格总结
| 指标 | 定义 | 公式 | 用途 |
| 四分位差 | 中间50%数据的范围 | IQR = Q3 - Q1 | 衡量数据离散程度 |
| Q1 | 第25%位置的数值 | 位置公式:(n + 1) × 0.25 | 反映下四分位数据 |
| Q3 | 第75%位置的数值 | 位置公式:(n + 1) × 0.75 | 反映上四分位数据 |
通过以上方法,可以快速准确地计算出四分位差,并用于数据分析和决策支持。在实际应用中,建议结合其他统计指标(如标准差、极差等)综合判断数据特征。


