Pearson's r是什么意思?

发布时间:2023-05-20

一、Pears是什么意思?

Pears是一种水果,通常呈梨形或圆形,具有白色果肉和绿色或黄色外皮。然而,当我们谈论Pearson's r时,我们实际上正在谈论一种用于衡量两个变量之间关系的统计方法。它可以告诉我们这两个变量之间的关系是否为正相关、负相关或不相关。

二、Pearson是什么意思?

Pearson是Karl Pearson的姓氏,他是19世纪末和20世纪初英国的一位统计学家。他发明了Pearson's r这一统计方法。Pearson's r也被称为Pearson相关系数或Pearson积矩相关系数。它是指从两个样本中计算出的一个值,可以用于衡量两个变量之间的线性关系程度。

三、Pearson's r的定义

Pearson's r是一种统计方法,用于衡量两个变量之间的线性关系程度。它定义为两个变量之间的协方差除以它们各自标准差的乘积。

def pearson_r(x, y):
    """
    计算两个变量之间的Pearson's r
    x: 变量1的值列表
    y: 变量2的值列表
    返回两个变量之间的Pearson's r
    """
    n = len(x)
    mean_x = sum(x) / n
    mean_y = sum(y) / n
    cov_xy = sum((x[i] - mean_x) * (y[i] - mean_y) for i in range(n))
    std_x = (sum((x[i] - mean_x)**2 for i in range(n)) / n) ** 0.5
    std_y = (sum((y[i] - mean_y)**2 for i in range(n)) / n) ** 0.5
    return cov_xy / (std_x * std_y)

四、Pearson's r的应用

Pearson's r可以应用于很多领域,例如金融、医学和社会科学等。在金融领域,它可以用于衡量股票收益和指数收益之间的相关性。在医学领域,它可以用于研究药物疗效和副作用之间的关系。在社会科学领域,它可以用于分析家庭收入和教育程度之间的关系。在Python中,我们可以使用pandas和numpy模块计算两个变量之间的Pearson's r。

import pandas as pd
import numpy as np
# 读取数据
data = pd.read_csv('data.csv')
# 计算Pearson's r
corr, _ = np.corrcoef(data['x'], data['y'])
print('Pearson\'s r:', corr)

五、总结

Pearson's r是一种用于衡量两个变量之间关系的统计方法。它定义为两个变量之间的协方差除以它们各自标准差的乘积。它可以应用于很多领域,包括金融、医学和社会科学等。在Python中,我们可以使用pandas和numpy模块计算两个变量之间的Pearson's r。