Preview only show first 10 pages with watermark. For full document please download

Regressao Linear Multipla

Última aula do Prof Luiz Fernando de Estatistica 1 - regressão linear + multipla

   EMBED


Share

Transcript

ANALISE DE REGRESSÃO Modelo Linear yi = α + β .xi + ε i α e β são parâmetros do modelo εi é o erro do modelo tal que lfpabreu E (ε i ) = 0 ANALISE DE REGRESSÃO Sendo a e b estimativas tal que: E (b ) = β E (a ) = α A estimativa do modelo linear será ∧ y i = a + b.xi lfpabreu ANALISE DE REGRESSÃO Determinação dos coeficientes a e b ∧ ei = y i − y i = y i − ( a + b . x i ) ∑ n min f (a, b) = i =1 lfpabreu 2 ei ANALISE DE REGRESSÃO Determinação dos coeficientes a e b S xy b = S xx ∂f (a , b ) =0 ∂a ∂f (a , b ) =0 ∂b _ _ a = y − b. x lfpabreu ANALISE DE REGRESSÃO 80 _ 60 ∧ y y i = a + b.xi 40 yi 20 0 0 10 20 30 lfpabreu 40 50 ANALISE DE REGRESSÃO ∑ (y n SQT = i =1 n SQR = ∑ _ i − y) ∧ 2 ( yi − y i ) i =1 lfpabreu 2 = S yy = S yy − b .S xy ANALISE DE REGRESSÃO 80 60 40 20 0 0 10 20 30 lfpabreu 40 50 ANALISE DE REGRESSÃO Ao passar de modelo simples para modelo de regressão linear, observamos uma redução da Soma de Quadrados igual a SQT-SQR. Este “lucro” é devido a redução da aleatoriedade da variável y, propiciada pelo modelo de regressão linear e será chamado de SQReg SQT − SQR = SQ Re g lfpabreu ANALISE DE REGRESSÃO A redução da aleatoriedade propiciada pelo modelo de regressão pode então ser expresso pela Soma de Quadrados da Regressão, SQReg: SQ Re g = b.S xy lfpabreu ANALISE DE REGRESSÃO Podemos medir o nível de explicação propiciada pelo modelo para a aleatoriedade através da estatística r2: b . S SQ Re g xy 2 r = = SQT S yy lfpabreu ANALISE DE REGRESSÃO Fonte de Soma de variação Quadrados Regressão SQReg=b.S xy 1 Resíduo SQR=SQT-SQReg n-2 Total SQT=S YY n-1 G.L. Quadrado Médio QMReg=b.S xy lfpabreu s r 2 =SQR/(n-2) Fcalc Fcrítico b.S xy /s r 2 F 1;n-2;alfa Regressão Múltipla Introdução-Dados Reação Dados Ident 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Tempo 96 92 106 100 98 104 110 101 116 106 109 100 112 105 118 108 113 112 127 117 Sexo 1 0 1 0 0 1 1 0 0 1 1 0 0 0 1 1 0 0 1 1 Idade 20 20 20 20 25 25 25 25 30 30 30 30 35 35 35 35 40 40 40 40 Acuid 90 100 80 90 100 90 80 90 70 90 90 80 90 80 70 90 90 90 60 80 Y=f(idade) + e Fon te Regressã o Resídu o Tota l gl SQ MQ 1 810 810.00 18 563 31.28 19 1373 Fon te Coefs In terseçã o 80.50 Ida de 0.90 F ND 25.90 8E -05 E P S tat t ND 5.45 14.77 2E -11 0.18 5.09 8E -05 LI LS 69.05 91.95 0.53 1.27 Y=f(acuidade visual) + e gl Regressã o Resídu o Tota l SQ MQ 1 783.37 783.37 18 589.63 32.76 19 1373.00 Fon te Coefs In terseçã o 162.08 Acu id -0.64 F ND 23.91 1E -04 EP S tat t ND LI LS 11.23 14.43 2E -11 138.48 185.68 0.13 -4.89 1E -04 -0.92 -0.37 Y = f(id,av) + e gl Regressã o Resídu o Tota l SQ MQ 2 1139.03 569.51 17 233.97 13.76 19 1373 Coefs In terseçã o 126.56 IDD 0.65 AV -0.45 F ND 41.38 3E -07 EP S tat t ND LI LS 10.09 12.54 5E -10 105.27 147.85 0.13 5.08 9E -05 0.38 0.92 0.09 -4.89 1E -04 -0.65 -0.26 Análise dos resíduos ID 1 2 . 12 . 18 19 20 TR 96 92 . 100 . 112 127 117 SX 1 0 . 0 . F 1 1 ID 20 20 . 30 . 40 40 40 AV 90 100 . 80 . 90 60 80 m od(0) m od(id) m od(a v) m od(id,a v) -11.50 -2.50 -8.30 -3.06 -15.50 -6.50 -5.88 -2.56 . . . . -7.50 -12.00 -10.72 -10.06 . . . . 4.50 -4.50 7.70 -0.06 19.50 10.50 3.44 1.44 9.50 0.50 6.28 0.44 m e 107.50 0.50 30.00 85.00 0.00 SQ 1373.00 GL 19 Va r 72.26 0.26 52.63 100.00 72.26 DP 8.50 0.51 7.25 10.00 8.50 0.00 563.00 18 31.28 5.59 -0.01 589.63 18 32.76 5.72 -0.31 235.92 17 13.88 3.73 Interpretação dos coeficientes • Modelo y’(id,av)=126,56 +0,65.id-0,45.av • Como ficaria o modelo restrito às pessoas com 100% de AV? • y’(id|av=100)=126,56 +0,65.id - 0,45(100) • y’(id |av=100) = 81,56 + 0,65.id • De modo análogo para as pessoas com 70% de AV, temos • y’(id |av=70) = 94,80 + 0,65.id • Comparar com o modelo só com a idade • y’(id) =80,50 + 0,90.id Comparação Coeficientes de regressão múltipla 130.0 120.0 f(id) f(id,100) 110.0 f(id,70) 100.0 90.0 15 20 25 30 35 40 45 Análise dos coeficientes Modelo β0 + ε β 0 + β1 ⋅ id + ε β 0 + β 2 ⋅ av + ε β 0 + β1 ⋅ id + β 2 ⋅ av + ε SQRes 1373,00 563,00 589,63 233,97 gl MQ= se2 19 72,26 18 31,28 18 32,76 17 13,76 se 8,50 5,50 5,72 8,71 Análise dos coeficentes Comparação 0 para id 0 para av 0 para id,av Iv para id,av Av para id,av Lucro gl 810.00 1 783.36 1 1139.03 2 329.37 1 355.66 1 MQ 810.00 783.36 569.51 329.37 355.66 F 25.90 23.91 41.38 23.92 -4.89 25.84 5.08 Anova var sexo Groups Count Sum Femi 10 1049 Masc 10 1101 Média 104.9 110.1 FONTE SS Entre 135 Dentro 1238 Total 1373 MS 135.20 68.77 df 1 18 19 Var 62.99 74.54 F alfa 1.97 0.18 Fc 4.41 Modelo y’= alfa + beta.sexo +e gl Regressão Resíduo Total 1 18 19 Fonte Coefs Interseção 104.90 Sexo 5.20 SQ MQ 135.20 135.20 1237.80 68.77 1373.00 EP 2.62 3.71 F alfa 1.97 0.1779 t alfa Linf95%Lsup95% 40.00 0.0000 99.39 110.41 1.40 0.1779 -2.59 12.99