【R】多元线性回归 - R语言

TOP

【R】多元线性回归(四)

2017-10-10 12:09:59 【大中小】浏览:10110次

Tags：多元线性回归

ton)

plot(fit1,which = 1)

可以看到这个一元线性回归模型的残差图中，散点的规律还是比较明显，说明线性关系较弱。

fit1_1 <- lm(medv~poly(lstat,2),data = Boston)

plot(fit1_1,which = 1)

将自变量进行2次多项式回归后，发现现在的残差图好多了，散点基本无规律，线性关系较明显。

再看看两个模型的整体效果——

summary(fit1)

summary(fit1_1)

可见多项式回归的模型Adjusted R2也增大了，模型的解释性也变强了。

多项式回归在《统计学习》后面的非线性模型中还会提到，到时候再讨论。

（2）Box-Tidwell变换

car包中的boxTidwell() 函数通过获得预测变量幂数的最大似然估计来改善线性关系。

library(car)

boxTidwell(Murder~Population+Illiteracy,data=states)

Score Statistic p-value MLE of lambda

Population -0.3228003 0.7468465 0.8693882

Illiteracy 0.6193814 0.5356651 1.3581188

iterations = 19

#这里看lambda，表示各个变量的幂次数

lmfit <- lm(Murder~Population+Illiteracy,data=states)

lmfit2 <- lm(Murder~I(Population^0.87)+I(Illiteracy^1.36),data=states)

plot(lmfit,which = 1)

plot(lmfit2,which = 1)

summary(lmfit)

summary(lmfit2)

可以发现残差图和Adjusted R2的提升都甚微，因此没有必要作非线性转换。

4、模型分析

（1）模型比较

前面只是简单得用Adjusted R2来比较模型，《R语言实战》里介绍了可以用方差分析来比较嵌套模型（即它的一些项完全包含在另一个模型中）有没有显著性差异。方差分析的思想是：如果线性模型y~x1+x2+x3与y~x1+x2没有显著性差异，若同时x3变量对模型也不显著，那就没必要加上变量x3。下面进行试验：

aovfit1 <- lm(Murder~Population+Illiteracy+Income+Frost,data=states)

aovfit2 <- lm(Murder~Population+Illiteracy,data=states)

anova(aovfit1,aovfit2)

Analysis of Variance Table

Model 1: Murder ~ Population + Illiteracy + Income + Frost

Model 2: Murder ~ Population + Illiteracy

Res.Df RSS Df Sum of Sq F Pr(>F)

1 45 289.17

2 47 289.25 -2 -0.078505 0.0061 0.9939

summary(aovfit1)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.235e+00 3.866e+00 0.319 0.7510

Population 2.237e-04 9.052e-05 2.471 0.0173 *

Illiteracy 4.143e+00 8.744e-01 4.738 2.19e-05 ***

Income 6.442e-05 6.837e-04 0.094 0.9253

Frost 5.813e-04 1.005e-02 0.058 0.9541

Residual standard error: 2.535 on 45 degrees of freedom

Multiple R-squared: 0.567, Adjusted R-squared: 0.5285

F-statistic: 14.73 on 4 and 45 DF, p-value: 9.133e-08

summary(aovfit2)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.652e+00 8.101e-01 2.039 0.04713 *

Population 2.242e-04 7.984e-05 2.808 0.00724 **

Illiter

首页上一页 1 2 3 4 5 6 7 下一页尾页 4/7/7
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：“ML_for_Hackers”[1]	下一篇：用贝叶斯判别分析再次预测股票涨..