R语言中R-squared与Adjust R-squared参数的解释
前言
最近做项目时,使用R语言对一些数据做回归计算,分析数据时,想查看这堆数据的相关性,得知R-squared可以得到我想要的信息,但是在打印线性关系式时,看到了R-squared,AdjustR-squared这两个参数,有点疑惑,上网也查看了一部分资料,最后,发现有两道题可以很明白解释这两个参数,如下:
题一
如果在线性回归模型中增加一个特征变量,下列可能发生的是(多选)?
A.R-squared增大,AdjustR-squared增大
B.R-squared增大,AdjustR-squared减小
C.R-squared减小,AdjustR-squared减小
D.R-squared减小,AdjustR-squared增大
答案:AB
**解析:**线性回归问题中,R-Squared是用来衡量回归方程与真实样本输出之间的相似程度。其表达式如下所示
上式中,分子部分表示真实值与预测值的平方差之和,类似于均方差MSE;分母部分表示真实值与均值的平方差之和,类似于方差Var。一般来说,R-Squared越大,表示模型拟合效果越好。R-Squared反映的是大概有多准,因为,随着样本数量的增加,R-Squared必然增加,无法真正定量说明准确程度,只能大概定量。
单独看R-Squared,并不能推断出增加的特征是否有意义。通常来说,增加一个特征特征,R-Squared可能变大也可能保持不变,两者不一定呈正相关。
如果使用校正决定系数(AdjustedR-Squared):
其中,n是样本数量,p是特征数量。AdjustedR-Squared抵消样本数量对R-Squared的影响,做到了真正的0~1,越大越好。
增加一个特征变量,如果这个特征有意义,AdjustedR-Square就会增大,若这个特征是冗余特征,AdjustedR-Squared就会减小。
题二
在一个线性回归问题中,我们使用R平方(R-Squared)来判断拟合度。此时,如果增加一个特征,模型不变,则下面说法正确的是?
A.如果R-Squared增加,则这个特征有意义
B.如果R-Squared减小,则这个特征没有意义
C.仅看R-Squared单一变量,无法确定这个特征是否有意义。
D.以上说法都不对
答案:C
解析:看题一解析
总结
到此这篇关于R语言中R-squared与AdjustR-squared参数解释的文章就介绍到这了,更多相关R语言R-squared与AdjustR-squared内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。