导读 Pearson相关系数是衡量两个变量线性关系强度的经典指标,其公式有多种表达方式,适用于不同场景。第一种是最常见的标准化协方差公式:`r =...
Pearson相关系数是衡量两个变量线性关系强度的经典指标,其公式有多种表达方式,适用于不同场景。第一种是最常见的标准化协方差公式:`r = cov(X, Y) / (std(X) std(Y))`;第二种是基于均值与偏差的展开式:`r = Σ((Xᵢ - X̄)(Yᵢ - Ȳ)) / √(Σ(Xᵢ - X̄)² · Σ(Yᵢ - Ȳ)²)`;第三种是直接用数据点计算的简化版;第四种则是矩阵运算形式,适合多维数据分析。
通过Python实现Pearson相关系数非常直观。例如,利用NumPy库可以直接调用`np.corrcoef()`函数,轻松完成计算。以下是基本代码示例:
```python
import numpy as np
x = [1, 2, 3, 4, 5]
y = [5, 4, 3, 2, 1]
corr = np.corrcoef(x, y)[0, 1]
print("Pearson相关系数:", corr)
```
Pearson相关系数值介于-1到1之间,正值表示正相关,负值为负相关,接近0则无明显线性关系。无论是学术研究还是工程实践,这一工具都不可或缺!✨