Preview only show first 10 pages with watermark. For full document please download

Efeito Interação Após O Teste Anova 2 Fatores

Estatística - Análise de variância 2 fatores (two-way)

   EMBED


Share

Transcript

Após o teste ANOVA (2 fatores) com Efeito Interação Significante: - O que fazer? Referências. 1) Huck, Schuyler W; Reading statistics and research. 5th ed Schuyler W. Huck; Boston Pearson/Allyn & Bacon c2008; 2) http://www2.gsu.edu/~epstco/aeraMain.pdf: T. Cris Oshima and Frances McCarty. How Should We teach Follow-Up Tests After Significant Interaction in Factorial Analysis of Variance. American Educational Research Association, New Orleans, April 2000; 3) http://www2.gsu.edu/~epstco/aeraStudent.pdf: Factorial Analysis of Variance. Statistically Significant Interactions: What’s the next step? T.C. Oshima and F. McCarty. Georgia State University. Nos livros de estatística, nível introdutório, básico ou intermediário, não se encontra uma explicação clara, convincente, completa, do que fazer, como proceder, após o teste ANOVA fatorial, indicar efeito interação estatisticamente significante. Embora a maioria dos livros textos inclua esse tópico de análise fatorial da análise de variância, o procedimento de, como prosseguir após o efeito interação significante, de como efetuar um teste “follow-up tests” é rápido, superficial. Segundo Huck♣, há três estratégias, para ganharmos compreensão do efeito interação significante, após o teste ANOVA (2 fatores): Estratégia 1 (Graph): Investigar o gráfico de médias (graph of cell means). Estratégia 2 (APC): Efetuar uma comparação estatística das médias (all comparison of cell means). Estratégia 3 (SME): Conduzir testes “simple main effects”. Exemplo Suponha um delineamento tipo CRD: (completely randomized design) com dois fatores: Medicamento (3 níveis) e Gênero (masculino e feminino). Primeira estratégia (Graph). Vamos observar o gráfico de médias e avaliar as linhas não paralelas. A estatística F na interação significante sugere que essas linhas, provavelmente, não vêem de linhas que são paralelas na população. Essa estratégia é útil e podemos até considerá-la etapa necessária para investigar a natureza da interação, porém, não é uma estratégia completa. Enfim, as médias das linhas, se visualmente diferem, pertencem a uma abordagem descritiva. Segunda estratégia (APC). As médias são comparadas simultaneamente mediante um teste post-hoc, o teste de comparação múltipla de Tukey, por exemplo. Essa estratégia é direta e de fácil entendimento. Porém, essa estratégia é muito conservadora e apresenta muitas comparações que não são de interesse para o pesquisador. Voltando ao exemplo do CRD, com R Huck, Schuyler W; Reading statistics and research ( 3ª ed.), New York: Harper Collins. 2 Medicamentos e Gênero, seria útil uma comparação do medicamento tipo 1 em relação ao medicamento tipo 2 para os pacientes do sexo masculino; mas, não seria interessante uma comparação entre o medicamento tipo 1 para homens em relação ao medicamento 2 para mulheres. Porque o pesquisador não quer saber qual medicamento administrar uma vez estabelecido o sexo do paciente. Terceira estratégia (SME). Conhecida como “simple-main effects”, é a estratégia mais difícil de ser ensinada aos estudantes. Nesta estratégia, após a interação se apresentar como significante, os dados são separadas para cada nível de um fator e, a seguir, é efetuada o teste ANOVA 1 fator. Voltando ao exemplo do CRD, com Medicamentos e Gênero, uma ANOVA (1 fator) é conduzida para homens para descobrir qual o melhor medicamento e, um outro teste ANOVA (1 fator) é efetuado para as mulheres a fim de descobrir qual o melhor medicamento. Assim, como em qualquer outra aplicação do teste ANOVA (1 fator), após o efeito apresentarse como significante, qualquer teste post-hoc, o teste de comparação múltipla de Tukey, por exemplo, pode ser aplicado. Porém, para a aplicação do teste post-hoc, é aconselhável considerar a variância residual (MSE: mean square error, do CRD fatorial, ou seja, da tabela ANOVA (2 fatores). Após conhecermos essas três estratégias, vamos a um exemplo prático. Mas, antes de apresentá-lo, convém considerar o significado do efeito interação na estatística, que nada tem a ver com o efeito interação da farmacologia. Nessa ciência biológica, o efeito combinado de dois medicamentos pode ou não conduzir a efeitos sinérgicos; enquanto, na estatística, o efeito interação do modelo ANOVA pode ser entendido como “diferença das diferenças”. Interpretação do Efeito Interação (diferença das diferenças). Quando existe uma interação significante, o efeito de uma variável independente (VI) sobre a variável resposta ou dependente (VD) depende do valor (nível) de alguma outra VI incluída no delineamento experimental. Em outras palavras, o teste de interação dá ênfase (focus) na questão de se o efeito de um fator é o mesmo para cada nível do outro fator, ou se o efeito de um fator não é o mesmo para cada nível do outro fator. Em qualquer um desses dois casos, o nosso interesse vai para as médias das condições experimentais estabelecidas palas variáveis em estudo (VIs). Então, estamos, agora, considerando essas médias das células (cell means) e não as médias marginais (das linhas e das colunas). Para recordar, os testes de efeitos principais, consideram (focus) nas médias marginais. Quando existe uma interação significante, evitamos interpretar os efeitos principais e interpretamos, apenas, o efeito interação. Porque interpretar os efeitos principais na presença de uma interação significante pode conduzir-nos a conclusões errôneas. Ainda, antes de apresentarmos um exemplo prático, vamos apresentar dois termos propostos por JACCARD• em 1998, que facilita o entendimento, quando se opta pela estratégia 3, referente simple-effects means. Esse autor propõe uma distinção entre variável independente focal e variável independente moderadora. Assim, a VI focal é a variável que o pesquisador está mais interessado em comparar e é comumente manipulada (tal como tratamento A versus JACCARD, J. Interactions effects in factorial analysis of variance, SAGE University Papers Series on Quantitative Applications in Social Sciences, 07-118. Thousand Oaks, CA: SAGE. R 3 tratamento B). Uma VI moderadora é a variável na qual o pesquisador acredita que o efeito da variável focal na variável dependente é “moderada” (tal como o gênero). Então, a VI moderadora pode ser julgada como a variável que interessa devido ao seu efeito potencial na VI focal, que é a de interesse principal. De outra forma, pode-se considerar como variável moderadora aquela referente às características intrínsecas do sujeito; enquanto a VI focal é aquela determinada de forma ativa pelo pesquisador, ou seja, características extrínsecas que foram determinadas pelo pesquisador. Exemplo 1. (SME). Simple Main effects. Um pesquisador está interessado em avaliar o efeito de três métodos de redução de esgotamento físico e mental, stress (yoga, meditação, e exercício). Com fundamento em pesquisas anteriores, o pesquisador sente que o gênero pode ter algum impacto nos efeitos de redução de tensão. Com isso em mente, o pesquisador delineia um estudo onde noventa participantes (45 homens e 45 mulheres) são designados, aleatoriamente, a um dos três métodos de redução de stress. No final do estudo, cada participante preencheu um questionário (menor escore indica menor stress). Os dados foram analisados via ANOVA fatorial. A variável dependente (resposta) foi a quantidade de stress medida pelo questionário. As variáveis independentes foram duas. A saber, o método de redução de stress, com três níveis (yoga, meditação, e exercício), e o gênero, com dois níveis (masculino e feminino). A tabela ANOVA (2 fatores) aplicada aos dados de redução de stress, é apresentada: Efeito gl SQ QM F p-valor Método 2 1361,22 680,61 28,30 0,0001 Gênero 1 220,00 220,00 9,15 0,003 Interação 2 1120,23 560,11 23,29 0,0001* Resíduo 84 2020,05 24,05 Total 89 4721,50 *p<0,05 Pode-se verificar, tabela acima, que o efeito interação foi significante e a nossa atenção está sobre esse efeito. Estratégia 1 (Graph): Investigar o gráfico de médias (graph of cell means). 4 Redução de Stress 50 Gênero feminino masculino 45 escore médio 40 35 30 20 10 0 1: Yoga 2: Meditaçao Método 3: Exercício Quanto menor o valor de escore menor é o nível de stress. Figura 1. Gráfico de médias referente às seis condições experimentais. As médias obtidas são apresentadas na Tabela 1, mostrada a seguir. Tabela 1. Médias dos escores de redução de stress, das seis condições experimentais estabelecidas pelas variáveis: Método e Gênero. Método Gênero 1: yoga 2: meditação 3: exercício masculino 44,66* 40,95 38,11 feminino 35,22 47,67 31,47 *n = 15 pacientes A variável focal é o método de redução de stress: característica extrínseca, criada pelo pesquisador. A variável moderadora é o gênero: característica intrínseca, não criada pelo pesquisador. Essa distinção nos ajudará a estabelecer os nossos testes de simple effects. Terceira estratégia (SME). ANOVA (1 fator) para os dados de escore obtidos para o sexo masculino. 5 ANOVA (1 fator) para os dados de escore obtidos para o sexo feminino. Sexo masculino Efeito Entre Métodos Resíduo Total gl 2 42 44 SQ 325,019 945,135 1270,154 QM 162,510 22,503 F 7,222 p-valor 0,002* F recalculado para masculino: 162,510 /24,05 = 6,757 Sexo feminino Efeito Entre Métodos Resíduo Total gl SQ QM F 2 2156,429 1078,214 42,129 42 1074,916 25,593 44 3231,345 F recalculado para feminino: 1078,214 /24,05 = 44,832 p-valor 0,0001* A tabela ANOVA (2 fatores) aplicada aos dados de redução de stress, é apresentada: Efeito Método Gênero Interação gl 2 1 2 SQ 1361,22 220,00 1120,23 QM 680,61 220,00 560,11 Resíduo 84 2020,05 24,05 Total 89 4721,50 F 28,30 9,15 p-valor 0,0001 0,003 23,29 0,0001* *p<0,05 F recalculado para masculino: 162,510 /24,05 = 6,757 > Fgl(2; 84) 5% = 3,15 F recalculado para feminino: 1078,214 /24,05 = 44,832 > Fgl(2; 84) 5%= 3,15 IC (95%) do teste de Tukey (5%): ( x i- x j) = ±qα ,gl(k grupos; resíduo)√(QMresíduo/n) n = 15 ... tamanho comum do grupo q .... valor tabelado (estatística faixa de Student) = 3,399 ( x i- x j) .... médias dos métodos em comparação gl resíduo = 84 gl k = 3 ... três métodos em comparação QMErro (ou resíduo) = 23,29 associado com gl resíduo = 84 ( x i- x j) = ±qα ,gl(k grupos; resíduo)√(QMresíduo/n) = dms = 3,399)√(23,29/15) = 4,304 dms = 3,399)√(23,29/15) = 4,304 para masculino dms = 3,399)√(23,29/15) = 4,304 para feminino MASCULINO dms = 3,399√(23,29/15) = 4,304 para masculino Comparação Yoga – Meditação diferença IC (95%) do teste de Tukey 44,68-40,95 = 3,73 dms 40,95-38,11 = 2,84 dms 8,146 a 16,754 35,22-31,47 = 3,75 dms 11,896 a 20,504 Yoga – Meditação → etc... µdifª = 12,45±4,304 = 8,146 a 16,754 Conclusão: Por meio da tabela ANOVA(2 fatores) verificamos que o Método depende do Gênero. Uma análise de simple effects indica que as médias foram diferentes para os homens (Fgl(2;84) = 6,757; p<0,05) e para as mulheres (F gl(2;84) = 44,832; p<0,05). Para os homens, o teste de Tukey (5%) indica que o método Yoga difere apenas do Exercício. Para as mulheres, o teste de Tukey (5%) indica que o método difere do Exercício e da Meditação. O método de Exercícios para os homens pode trazer um maior alívio, quando comparado com Yoga. Os métodos de Exercícios e de Yoga para as mulheres podem trazer um maior alívio, quando comparado com a Meditação. Exemplo 2. Segunda estratégia (APC). introdução Essa abordagem pode ser útil quando o pesquisador está interessado em descobrir qual combinação de fatores produzirá resultados mais desejáveis; neste contexto, uma consideração 7 importante é saber se (ou não), os grupos criados pelas variáveis independentes proporcionam comparações de interesse, do ponto de vista de significado clínico. Essa abordagem é comumente empregada quando ambas as VIs são ativas, isto é, pesquisador tem controle sobre elas (foram manipuladas, criadas por ele). Essa abordagem é mais direta do que a SME (simple effects). Compara todas as possíveis médias das condições experimentais. Por exemplo, num delineamento tipo 2 x 2 teremos 4 médias a serem comparadas entre si (C4,2 = total de 6 comparações). Enunciado da Pesquisa Um pesquisador está interessado em avaliar o efeito de Exercícios para casa (EPC) e da Duração do curso (DC) sobre o aprendizado. Assim, ele delineou um estudo onde 28 estudantes foram distribuídos, ao acaso, às condições de: (i) alunos que receberam EPC num curso com duração de 8 semanas; (ii) alunos que receberam EPC num curso com duração de 16 semanas; (iii) alunos que não receberam o EPC num curso com duração de 8 semanas; (iv) alunos que não receberam o EPC num curso com duração de 16 semanas. Nesse experimento 7 alunos participaram em cada uma das quatro condições experimentais. No final de cada curso, foram submetidos a uma avaliação (exame). As notas foram analisadas por meio do teste ANOVA fatorial (2 fatores). A variável dependente (resposta) foram as notas obtidas pelos alunos no exame. As variáveis independentes foram duas. A saber, a tarefa de exercícios para casa, com dois níveis (alunos que receberam e alunos que não receberam), e o tempo de duração do curso, com dois níveis (8 semanas e 16 semanas). A tabela ANOVA (2 fatores) aplicada às notas obtidas Efeito gl SQ QM Exercício em casa 1 276,901 276,901 Tempo 1 173,507 173,507 Interação 1 555,111 555,111 Resíduo 24 475,591 19,816 Total 27 F 13,973 8,756 28,013 p-valor 0,0001 0,007 0,0001* *p<0,05 Pode-se verificar, tabela acima, que o efeito interação foi significante e a nossa atenção está sobre esse efeito. 8 Notas Exercício não sim média 100 95 90 85 80 75 70 60 50 40 30 20 10 0 8 16 Tempo(s) As médias obtidas são apresentadas na Tabela 1, mostrada a seguir. Tabela 1. Médias (dp) obtidas pelos alunos, nas quatro condições experimentais estabelecidas pelas variáveis: tempo de duração do curso e Exercícios para casa Exercício para casa Tempo 1: não receberam 2: receberam linha 8 semanas 76,864(4,69)* 92,058(2,76) 84,461 16 semanas 90,747(4,50) 88,132(5,42) 89,439 coluna 83,805 90,095 *n = 7 pacientes A tabela ANOVA (2 fatores) aplicada às notas obtidas Efeito gl SQ QM Exercício em casa 1 276,901 276,901 Tempo 1 173,507 173,507 Interação 1 555,111 555,111 Resíduo 24 475,591 19,816 Total 27 F 13,973 8,756 28,013 p-valor 0,0001 0,007 0,0001* *p<0,05 Para aplicar o teste de Tukey (5%): q ... valor tabelado para k = 4 médias e gl = 24 é igual a 3,90 ( x i- x j) = ±qα ,gl(k grupos; resíduo)√(QMresíduo/n) = dms = 3,90√(19,816/7) = dms = 3,90√(19,816/7) = 3,90 (1,683) = 6,562 Tempo 1: não receberam Exercício para casa 2: receberam linha 9 8 semanas 16 semanas coluna 76,864(4,69)* 90,747(4,50) 83,805 92,058(2,76) 88,132(5,42) 90,095 84,461 89,439 Teste de Tukey (5%) aplicado aos quatro grupos Comparações 8s / EPC (92,06) 16s / sem 8s / sem EPC EPC(90,75) (76,86) 16s / EPC(88,13) 8s / EPC 16s / sem (92,06) EPC(90,75) 16s / EPC (88,13) 16s / sem EPC 16s / EPC(88,13) (90,75) diferença média 15,19* 13,88* dms* Interpretação difere difere 6,56 11,27* 1,31 2 3,93 1,32 difere não difere não difere não difere *dms = 3,90√(19,816/7) = 3,90 (1,683) = 6,562 Notas Exercício não sim média 100 95 90 85 80 75 70 60 50 40 30 20 10 0 8 16 Tempo(s) Conclusão: A condição: 8 semanas/ Sem Exercício para casa (EPC) difere das outras três condições experimentais. Essa condição apresentou o pior desempenho (média igual a 76,86). A recomendação é, portanto, impedir a existência de cursos de pequena duração e que não passam exercícios para casa aos alunos. Considerações adicionais: Efeito Interação Tripla estatisticamente significante. No caso de ANOVA fatorial com três fatores, tipo 2 x 2 x 2, por exemplo, o raciocínio é análogo ao que já vimos. Se encontrarmos um efeito interação tripla estatisticamente significante, então, uma abordagem seria efetuar duas ANOVA (2 fatores), separadamente, uma para cada nível do terceiro fator e usar o termo erro (resíduo) da original ANOVA três fatores. 10 E, caso uma interação dupla seja significante, então, podemos seguir as estratégias (gráfica e simple effects ou gráfica e todas as comparações possíveis, APC) aqui apresentadas.