当前位置:首页 > 行业动态 > 正文

python 如何计算决定系数

决定系数(Coefficient of Determination),简称 R²,是统计学中用来衡量回归模型拟合优度的指标,它表示自变量和因变量之间关系的强度和方向,R²的值介于0和1之间,越接近1,表示模型拟合效果越好;越接近0,表示模型拟合效果越差,在Python中,我们可以使用numpy库的polyfit函数来计算决定系数。

python 如何计算决定系数  第1张

以下是详细的计算过程:

1、导入所需库

我们需要导入numpy库,这是一个用于处理数组和矩阵的强大库。

import numpy as np

2、准备数据

我们需要准备两组数据,一组是自变量(x),另一组是因变量(y),这里我们使用numpy库生成一些示例数据。

生成自变量数据
x = np.array([0, 1, 2, 3, 4, 5])
生成因变量数据
y = np.array([0, 0.8, 0.9, 0.1, 0.8, 1])

3、计算多项式拟合

接下来,我们使用numpy的polyfit函数对数据进行多项式拟合,这里我们选择2阶多项式拟合。

设置多项式阶数
degree = 2
计算多项式系数
coefficients = np.polyfit(x, y, degree)

4、计算决定系数

现在我们已经得到了多项式的系数,接下来我们需要计算决定系数,我们可以使用numpy的polyval函数计算拟合后的y值,然后使用numpy的corrcoef函数计算相关系数矩阵,最后取第一个元素作为决定系数。

计算拟合后的y值
y_fit = np.polyval(coefficients, x)
计算相关系数矩阵
correlation_matrix = np.corrcoef(y, y_fit)
获取决定系数
r_squared = correlation_matrix[0, 1]

5、输出结果

我们将决定系数输出到控制台。

print("决定系数:", r_squared)

将以上代码整合到一起,完整的Python代码如下:

import numpy as np
生成自变量数据
x = np.array([0, 1, 2, 3, 4, 5])
生成因变量数据
y = np.array([0, 0.8, 0.9, 0.1, 0.8, 1])
设置多项式阶数
degree = 2
计算多项式系数
coefficients = np.polyfit(x, y, degree)
计算拟合后的y值
y_fit = np.polyval(coefficients, x)
计算相关系数矩阵
correlation_matrix = np.corrcoef(y, y_fit)
获取决定系数
r_squared = correlation_matrix[0, 1]
输出结果
print("决定系数:", r_squared)

通过运行上述代码,我们可以得到自变量和因变量之间的决定系数,这个值可以帮助我们评估回归模型的拟合效果,从而为进一步的数据分析和建模提供依据。

0