Transcript
ANALISE DE REGRESSÃO Modelo Linear
yi = α + β .xi + ε i α e β são parâmetros do modelo
εi é o erro do modelo tal que
lfpabreu
E (ε i ) = 0
ANALISE DE REGRESSÃO Sendo a e b estimativas tal que:
E (b ) = β
E (a ) = α
A estimativa do modelo linear será
∧
y i = a + b.xi lfpabreu
ANALISE DE REGRESSÃO Determinação dos coeficientes a e b ∧
ei = y i − y i = y i − ( a + b . x i )
∑ n
min f (a, b) =
i =1
lfpabreu
2 ei
ANALISE DE REGRESSÃO Determinação dos coeficientes a e b
S xy b = S xx
∂f (a , b ) =0 ∂a ∂f (a , b ) =0 ∂b
_
_
a = y − b. x lfpabreu
ANALISE DE REGRESSÃO 80
_
60
∧
y
y i = a + b.xi
40
yi
20 0 0
10
20
30 lfpabreu
40
50
ANALISE DE REGRESSÃO
∑ (y n
SQT =
i =1 n
SQR =
∑
_ i − y) ∧
2
( yi − y i )
i =1
lfpabreu
2
= S yy
= S yy − b .S xy
ANALISE DE REGRESSÃO 80 60 40 20 0 0
10
20
30 lfpabreu
40
50
ANALISE DE REGRESSÃO Ao passar de modelo simples para modelo de regressão linear, observamos uma redução da Soma de Quadrados igual a SQT-SQR. Este “lucro” é devido a redução da aleatoriedade da variável y, propiciada pelo modelo de regressão linear e será chamado de SQReg
SQT − SQR = SQ Re g lfpabreu
ANALISE DE REGRESSÃO A redução da aleatoriedade propiciada pelo modelo de regressão pode então ser expresso pela Soma de Quadrados da Regressão, SQReg:
SQ Re g = b.S xy lfpabreu
ANALISE DE REGRESSÃO Podemos medir o nível de explicação propiciada pelo modelo para a aleatoriedade através da estatística r2:
b . S SQ Re g xy 2 r = = SQT S yy lfpabreu
ANALISE DE REGRESSÃO Fonte de
Soma de
variação
Quadrados
Regressão
SQReg=b.S xy
1
Resíduo
SQR=SQT-SQReg
n-2
Total
SQT=S YY
n-1
G.L.
Quadrado Médio QMReg=b.S xy
lfpabreu
s r 2 =SQR/(n-2)
Fcalc
Fcrítico
b.S xy /s r 2 F 1;n-2;alfa
Regressão Múltipla Introdução-Dados Reação
Dados Ident 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Tempo 96 92 106 100 98 104 110 101 116 106 109 100 112 105 118 108 113 112 127 117
Sexo 1 0 1 0 0 1 1 0 0 1 1 0 0 0 1 1 0 0 1 1
Idade 20 20 20 20 25 25 25 25 30 30 30 30 35 35 35 35 40 40 40 40
Acuid 90 100 80 90 100 90 80 90 70 90 90 80 90 80 70 90 90 90 60 80
Y=f(idade) + e Fon te Regressã o Resídu o Tota l
gl
SQ MQ 1 810 810.00 18 563 31.28 19 1373
Fon te Coefs In terseçã o 80.50 Ida de 0.90
F ND 25.90 8E -05
E P S tat t ND 5.45 14.77 2E -11 0.18 5.09 8E -05
LI LS 69.05 91.95 0.53 1.27
Y=f(acuidade visual) + e gl Regressã o Resídu o Tota l
SQ MQ 1 783.37 783.37 18 589.63 32.76 19 1373.00
Fon te Coefs In terseçã o 162.08 Acu id -0.64
F ND 23.91 1E -04
EP S tat t ND LI LS 11.23 14.43 2E -11 138.48 185.68 0.13 -4.89 1E -04 -0.92 -0.37
Y = f(id,av) + e gl Regressã o Resídu o Tota l
SQ MQ 2 1139.03 569.51 17 233.97 13.76 19 1373
Coefs In terseçã o 126.56 IDD 0.65 AV -0.45
F ND 41.38 3E -07
EP S tat t ND LI LS 10.09 12.54 5E -10 105.27 147.85 0.13 5.08 9E -05 0.38 0.92 0.09 -4.89 1E -04 -0.65 -0.26
Análise dos resíduos ID 1 2 . 12 . 18 19 20
TR 96 92 . 100 . 112 127 117
SX 1 0 . 0 . F 1 1
ID 20 20 . 30 . 40 40 40
AV 90 100 . 80 . 90 60 80
m od(0) m od(id) m od(a v) m od(id,a v) -11.50 -2.50 -8.30 -3.06 -15.50 -6.50 -5.88 -2.56 . . . . -7.50 -12.00 -10.72 -10.06 . . . . 4.50 -4.50 7.70 -0.06 19.50 10.50 3.44 1.44 9.50 0.50 6.28 0.44
m e 107.50 0.50 30.00 85.00 0.00 SQ 1373.00 GL 19 Va r 72.26 0.26 52.63 100.00 72.26 DP 8.50 0.51 7.25 10.00 8.50
0.00 563.00 18 31.28 5.59
-0.01 589.63 18 32.76 5.72
-0.31 235.92 17 13.88 3.73
Interpretação dos coeficientes • Modelo y’(id,av)=126,56 +0,65.id-0,45.av • Como ficaria o modelo restrito às pessoas com 100% de AV? • y’(id|av=100)=126,56 +0,65.id - 0,45(100) • y’(id |av=100) = 81,56 + 0,65.id • De modo análogo para as pessoas com 70% de AV, temos • y’(id |av=70) = 94,80 + 0,65.id • Comparar com o modelo só com a idade • y’(id) =80,50 + 0,90.id
Comparação Coeficientes de regressão múltipla 130.0 120.0
f(id) f(id,100)
110.0
f(id,70) 100.0 90.0 15
20
25
30
35
40
45
Análise dos coeficientes Modelo β0 + ε
β 0 + β1 ⋅ id + ε
β 0 + β 2 ⋅ av + ε
β 0 + β1 ⋅ id + β 2 ⋅ av + ε
SQRes 1373,00 563,00 589,63 233,97
gl MQ= se2 19 72,26 18 31,28 18 32,76 17 13,76
se
8,50 5,50 5,72 8,71
Análise dos coeficentes Comparação 0 para id 0 para av 0 para id,av Iv para id,av Av para id,av
Lucro gl 810.00 1 783.36 1 1139.03 2 329.37 1 355.66 1
MQ 810.00 783.36 569.51 329.37 355.66
F 25.90 23.91 41.38 23.92 -4.89 25.84 5.08
Anova var sexo
Groups Count Sum Femi 10 1049 Masc 10 1101
Média 104.9 110.1
FONTE SS Entre 135 Dentro 1238 Total 1373
MS 135.20 68.77
df 1 18 19
Var 62.99 74.54 F alfa 1.97 0.18
Fc 4.41
Modelo y’= alfa + beta.sexo +e gl Regressão Resíduo Total
1 18 19
Fonte Coefs Interseção 104.90 Sexo 5.20
SQ MQ 135.20 135.20 1237.80 68.77 1373.00 EP 2.62 3.71
F alfa 1.97 0.1779
t alfa Linf95%Lsup95% 40.00 0.0000 99.39 110.41 1.40 0.1779 -2.59 12.99