異常點與強影響點的診斷r語言代碼


y=c(160,260,210,265,240,220,275,160,275,250)
x1=c(70,75,65,74,72,68,78,66,70,65)
x2=c(35,40,40,42,38,45,42,36,44,42)
x3=c(1,2.4,2,3,1.2,1.5,4,2,3.2,3)
shuju<-data.frame(y,x1,x2,x3)
shuju
shuju.reg=lm(y~.,data=shuju)#(2)求三元線性回歸方程(3)擬合優度檢驗
summary(shuju.reg)


#異常值與強影響點
#殘差
shuju.stdres<-rstudent(shuju.reg);shuju.stdres     
#中心化杠桿值
ch<-hatvalues(shuju.reg)-1/10;ch
#Cook距離
shuju.cooks<-cooks.distance(shuju.reg);shuju.cooks
#找異常值
isoutlier<-abs(shuju.stdres)>3;isoutlier  #殘差選擇正負3倍標准差以外的
isch<-ch>2*1/10;isch     #杠桿值大於兩倍的hba
iscooks<-shuju.cooks>1;iscooks    #庫克距離大於1的

isch*iscooks       #杠桿值和庫克距離結合起來判斷



下表為r語言計算得出的刪除學生化殘差、杠桿值、庫克距離的數據:

 

序列

刪除學生化殘差

杠桿值

庫克距離

1

0.3541804

0.3541804

1.66E-01

2

0.1402491

0.1402491

3.11E-02

3

0.1607884

0.1607884

6.20E-03

4

0.0993465

0.0993465

1.17E-06

5

0.2470184

0.2470184

4.09E-01

6

0.6418682

0.6418682

3.22E+00

7

0.4927659

0.4927659

5.01E-01

8

0.3612936

0.3612936

2.89E-01

9

0.1636641

0.1636641

1.50E-02

10

0.3388255

0.3388255

2.22E-01

 

    下圖是根據不同的准則判斷出來的異常值和強影響點,根據最后的判斷為第6個數據為異常值。



注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2020 ITdaan.com