柚子快報(bào)邀請碼778899分享:線性回歸系數(shù)解釋
線性回歸系數(shù)解釋
線性回歸系數(shù)1、
R
2
R^2
R2(R方,R-Square)2、
A
d
j
?
R
2
Adj-R^2
Adj?R2(調(diào)整后的 R 方)3、標(biāo)準(zhǔn)誤差4、
F
F
F 值5、
F
F
F 顯著度6、置信區(qū)間7、
P
P
P 值
線性回歸系數(shù)
回歸模型得到后會有多個系數(shù),這些系數(shù)都有不同的功能,能揭示的東西很多。以 Python 求解的多元線性回歸結(jié)果為例:
1、
R
2
R^2
R2(R方,R-Square)
R
2
R^2
R2 表明模型與實(shí)際值的擬合度,介于
0
~
1
0\sim 1
0~1 之間,越接近
1
1
1 說明擬合度越高,但不一定說明模型就越好,可能過擬合。
2、
A
d
j
?
R
2
Adj-R^2
Adj?R2(調(diào)整后的 R 方)
調(diào)整后的
R
2
R^2
R2 類似
R
2
R^2
R2 ,但更加重要,表明在因變量的變動中,有多少可以由自變量的變動來解釋。若
A
d
j
?
R
2
=
0.88
Adj-R^2=0.88
Adj?R2=0.88,則說明
y
y
y 的變動,有
88
%
88\%
88% 可以由
x
x
x 來解釋,剩下的
12
%
12\%
12% 是隨機(jī)變動,也是模型無法解釋的部分。
3、標(biāo)準(zhǔn)誤差
是通過模型得到預(yù)測值與真實(shí)值之間的誤差的標(biāo)準(zhǔn)差。和不同參數(shù)的模型或者其他模型相比較,這個值越大,說明模型預(yù)測的數(shù)據(jù)就越離散,模型的準(zhǔn)確度也就越低。
4、
F
F
F 值
F
F
F 值越大,表明線性回歸越顯著,說明模型越能解釋因變量
y
y
y 的變化。線性回歸的均方誤差是模型可以解釋的部分,殘差均方誤差是模型沒法解釋的(隨機(jī)的)部分,
F
F
F 值則是前者與后者的比值。
5、
F
F
F 顯著度
F
F
F 值對應(yīng)的是
F
F
F 顯著度,反映的是線性回歸模型不成立(即兩個變量之間不存在線性關(guān)系)的概率。若
F
F
F 顯著度幾乎為
0
0
0,則表面兩個變量之間不存在線性關(guān)系的概率幾乎為
0
0
0,當(dāng)參數(shù)大于我們常用的
0.05
0.05
0.05 時,一般認(rèn)為模型不成立。
6、置信區(qū)間
因?yàn)楹苌贂梦ㄒ恢祦碜鰶Q定,通常會用一個區(qū)間來判斷模型的擬合度,這就是置信區(qū)間的由來。若參數(shù)
k
k
k 的置信區(qū)間
[
a
,
b
]
[a,b]
[a,b] 說明在
95
%
95\%
95% 的情況下,參數(shù)
k
k
k 會介于
a
a
a 和
b
b
b 之間,這一區(qū)間越小越好,說明模型的擬合度更高,預(yù)測準(zhǔn)確度也更高。
7、
P
P
P 值
這是我們最常看的一個值,和
F
F
F 顯著度差不多,表示系數(shù)為
0
0
0 的概率,若
P
P
P 值越小,則系數(shù)為
0
0
0 的概率越?。ɡ?/p>
y
=
k
x
+
b
y=kx+b
y=kx+b,若系數(shù)
k
k
k 為
0
0
0,則表明兩個變量之間不存在線性關(guān)系,可以猜測此時
P
P
P 值很大,可能是
1
1
1),若
P
P
P 值幾乎為
0
0
0 則表明兩個變量之間的線性關(guān)系很強(qiáng),即系數(shù)存在。若
P
P
P 值大于我們常用的
0.05
0.05
0.05,則可以認(rèn)為系數(shù)為
0
0
0。
柚子快報(bào)邀請碼778899分享:線性回歸系數(shù)解釋
精彩內(nèi)容
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。