Transcript
Escola Politécnica da Universidade de São Paulo Departamento de Engenharia de Produção
PRO 2201 Estatística
André Leme Fleury
Análise de Variância (ANOVA) Objetivo: Testar se diversas médias são ou não iguais.
H 0 : 1 2 ... k H 1 : (i, j ) / i j
O teste ANOVA substitui o teste das médias, comparando as variâncias dentro das amostras com a variância entre as amostras
Análise de Variância (ANOVA) Situação A
Situação B x
xxx xA x xx x
x
xxx x x x x xB
xxxx xx x
xC
x x x
x
x
x
x
x
x x
x x
x x
x
x
x x
x
x x
Situação A: aparentemente as médias não são iguais – as médias amostrais XA, XB e XC estão distantes entre si e a variância em cada amostra é relativamente pequena. Situação B: as médias estão afastadas, mas as variâncias amostrais são grandes, inviabilizando a conclusão sobre a igualdade ou não das médias.
Análise de Variância (ANOVA) Sejam xj1, xj2, ...., xjn os elementos da j-ésima amostra. Supomos existir k amostras. xj, é a média amostral da amostra j. n
x
ij
xj
i 1
nj
S2j é a variância amostral da amostra j
1 n 2 Sj ( x ij xj ) nj 1 i 1 2
Análise de Variância (ANOVA) Objetivo: comparar SE2 com SP2, onde: k
SE 2
2 n i ( xi x ) i 1
k 1
e k
SP 2
2 ( n i 1) Si i 1
(ni 1)
Análise de Variância (ANOVA) Assumindo a hipótese de hemocedasticidade (isto é, a variância é a mesma, σ2, para todas as k populações). Sendo esta hipótese verdadeira, pode-se garantir que SE2 e SR2 são estimadores de σ2 e podem ser comparados.
H 0 : E 2 P2 H 1 : E 2 P2 Se SE2 é maior que SP2, ao nível de significância proposto, conclui-se que as médias são diferentes Utiliza-se o estimador acima, que tem distribuição F com k-1 graus de liberdade no numerador e i i graus de liberdade no denominador
(n 1) (n ) k
Exercício 1. Os dados a seguir provêm de um experimento de comparação do grau de resíduos em tecidos copolimerizados com três diferentes misturas de ácido metacrílico. Verifique se existe diferença entre as misturas ao nível de significância de 1%
Mistura 1
0,56
1,12
0,90
1,07
0,94
Mistura 2
0,72
0,69
0,87
0,78
0,91
Mistura 3
0,62
1,08
1,07
0,99
0,93
Exercício 2. Os salários horários médios de mecânicos de automóveis foram estudados por um grupo de consumidores. A finalidade era determinar a eventual existência de diferenças entre as quatro localidades. Os resultados obtidos são apresentados abaixo. Considerando α = 5%, pode-se considerar que existem diferenças?
Local Obs
A
B
C
D
1
6
12
11
9
2
9
11
8
7
3
9
10
12
10
4
6
8
9
10
5
5
9
10
9
Exercício 3. Queremos verificar o efeito do tipo de impermebialização na condutividade de tubos de TV. Que conclusão sobre o efeito da impermebialização podemos obter com α = 1%?
I
II
III
IV
56
64
45
42
55
61
46
39
62
50
45
45
69
55
39
56
Teste de Tukey Numa ANOVA, para identificar quais são as médias diferentes quando o número de elementos em cada amostra é igual, emprega-se o teste de Tukey. Para cada par de médias (i,j), calcule:
Sp2 1 1 i, j St(,k,k(n 1)) 2 n i n j Onde
St(,k,k(n 1))
corresponde a uma distribuição de amplitude studentizada com parâmetros k e k(n-1)
| xj xi | ij Se
então as médias são diferentes
Exercício 4. Em relação ao exercício 2, em quais localidades existe diferença entre os salários?
Local Obs
A
B
C
D
1
6
12
11
9
2
9
11
8
7
3
9
10
12
10
4
6
8
9
10
5
5
9
10
9
Teste de Scheffe Numa ANOVA, para identificar quais são as médias diferentes quando o número de elementos em cada amostra é diferente, emprega-se o teste de Scheffe. Para cada par de médias (i,j), calcule:
1 1 i, j Sp n n (k 1)F(,k 1,n k) i j 2
Se
| xj xi | ij
então as médias são diferentes
Exercício 5. Em relação ao exercício 3, em quais localidades existe diferença entre os salários?
I
II
III
IV
56
64
45
42
55
61
46
39
62
50
45
45
69
55
39
56