Preview only show first 10 pages with watermark. For full document please download

Estatistica

Apostila Estatística. Notas de Aula. PRO2201. Prof. Mesquita

   EMBED


Share

Transcript

ESCOLA POLITÉCNICA Universidade de São Paulo Departamento de Engenharia de Produção PRO2201 ESTATÍSTICA Notas de Aula Prof. Dr. Marco Aurélio de Mesquita São Paulo, 2003 PRO2201 ESTATÍSTICA SUMÁRIO 1 ESTATÍSTICA DESCRITIVA 2 CÁLCULO DE PROBABILIDADES 3 DISTRIBUIÇÕES DE PROBABILIDADES 4 DISTRIBUIÇÕES CONTÍNUAS 5 INTERVALOS DE CONFIANÇA 6 TESTES DE HIPÓTESES 7 ANÁLISE DE VARIÂNCIA 8 CORRELAÇÃO E REGRESSÃO LINEAR EPUSP - PRO Prof. Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.1 1 ESTATÍSTICA DESCRITIVA ESTATÍSTICA CIÊNCIA DOS DADOS. PROPORCIONA MÉTODOS PARA COLETA, REPRESENTAÇÃO, ANÁLISE E INTERPRETAÇÃO DE DADOS ÁREAS DE APLICAÇÃO ENGENHARIA, ADMINISTRAÇÃO, ECONOMIA, CIÊNCIAS SOCIAIS, MEDICINA E SAÚDE, MEIO AMBIENTE ETC ESTATÍSTICA DESCRITIVA REPRESENTAÇÃO GRÁFICA E SÍNTESE DE DADOS INFERÊNCIA ESTATÍSTICA CONCLUSÕES BASEADAS EM DADOS AMOSTRAIS SOBRE UMA POPULAÇÃO OU PROCESSO POPULAÇÃO AMOSTRA VARIÁVEIS : CONJUNTO DE ELEMENTOS COM CARACTERÍSTICAS COMUNS, QUE SE DESEJA ESTUDAR QUALQUER SUBCONJUNTO EXTRAÍDO DA POPULAÇÃO QUALITATIVAS ATRIBUTOS (cor, modelo, procedência etc) QUANTITATIVAS INTEIRAS (contagem) OU CONTÍNUAS (medição) COMO OBTER AMOSTRAS REPRESENTATIVAS ? AMOSTRAGEM ALEATÓRIA, SISTEMÁTICA, ESTRATIFICADA, EXPERIMENTAL, ... REPRESENTAÇÃO GRÁFICA - DIAGRAMAS DE BARRAS E CIRCULARES - HISTOGRAMAS - DIAGRAMAS DE DISPERSÃO - GRÁFICOS DE CONTROLE - SÉRIES TEMPORAIS ... EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.2 MEDIDAS ASSOCIADAS A VARIÁVEIS QUALITATIVAS FREQÜÊNCIAS RELATIVAS : x n pˆ ' MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS MEDIDAS DE TENDÊNCIA MÉDIA AMOSTRAL n x¯ ' j xi x1%x2%ÿ%xn n MÉDIA POPULACIONAL : MEDIANA AMOSTRAL ' i'1 n ' T n µ x˜ VALOR INTERMEDIÁRIO DA AMOSTRA EM ORDEM CRESCENTE MEDIANA POPULACIONAL : EXEMPLO : 40 50 60 80 120 x¯ ' 70 QUARTIS µ˜ x˜ ' 60 DIVIDEM A AMOSTRA EM QUATRO GRUPOS 1º QUARTIL : 25% MENORES 2º QUARTIL = MEDIANA 3º QUARTIL : 25% MAIORES EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.3 MEDIDAS DE DISPERSÃO AMPLITUDE AMOSTRAL : R ' x max & x min n VARIÂNCIA AMOSTRAL : s2 ' VARIÂNCIA POPULACIONAL : s2 ' 2 i'1 n&1 σ2 s ' s2 DESVIO PADRÃO AMOSTRAL EXEMPLO 1 : j (xi & x¯ ) 40 55 50 55 60 x¯ ' 50 Y (40&50)2%(45&50)2%(50&50)2%(55&50)2%(60&50)2 ' 62,5 4 EXEMPLO 2 : 10 30 50 70 90 x¯ ' 50 Y s ' s 2 ' 7,9 s ' 31,6 FÓRMULA DE CÁLCULO PARA VARIÂNCIA : T2 Q & n s2 ' , n &1 n n i'1 i'1 onde T ' j xi e Q ' j xi 2 PROPRIEDADE : SEJA x1 , x2 , ÿ , xn UMA AMOSTRA ALETÓRIA E y ' a @ x % b , ENTÃO 1) EPUSP - PRO y¯ ' a @ x¯ % b 2) 2 2 sy ' a 2 @ sx Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.4 Pareto Chart for Defects Defects at all Plants, June 100 400 Finish (57; 20,1%) O-Ring (74; 26,1%) 80 Count 60 200 40 100 Percent 300 Connector ( 2; 0,7%) Screw ( 9; 3,2%) 20 0 Dent (56; 19,7%) Poor Seal (34; 12,0%) 0 Defect Mis Count Percent Cum % ws c re gS sin 274 64,8 64,8 s Mis ing ps C li 59 13,9 78,7 y ak Le sk Ga et f ec De 43 10,2 88,9 ti i us Ho ve In c 19 4,5 93,4 p om a rt eP le t Ot 10 2,4 95,7 rs he Scratch (52; 18,3%) 18 4,3 100,0 Histogram of C1, with Normal Curve 140 15 130 120 Frequency Pulse2 110 100 90 80 10 5 70 60 50 0 1 44 2 49 54 59 C1 Sex Regression Plot Regression Plot Y = 1,11771 + 0,217670X W = Logten(Y ) W = 7,06962 - 0,698628X + 1,74E-02X**2 R-Sq = 93,1 % R-Sq = 95,7 % 100 3,0 EnergyConsum 50 Score2 2,5 2,0 20 10 5,00 2,00 Regression 1,00 95% PI 0,50 1,5 2 3 4 5 6 7 8 9 10 Score1 20 30 MachineSetti Xbar/R Chart for Supp2 1 1 3,0SL=602,4 602 601 X=600,2 600 110 599 -3,0SL=598,1 598 Sample Range Subgroup 0 9 8 7 6 5 4 3 2 1 0 EPUSP - PRO 10 Sales Sample Mean 603 20 100 3,0SL=7,866 R=3,720 90 -3,0SL=0,00E+0 Date/Time 1Q91 2Q91 3Q91 4Q91 1Q92 2Q92 3Q92 4Q92 Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.5 EXERCÍCIOS 1) A inspeção de 200 itens defeituosos resultou na seguinte distribuição de defeitos: Mancha, 104; Trinca, 10; Deformação, 42; Quebrado, 4; Risco, 20; Aspereza, 6 e 14 outros defeitos. Construa um gráfico de Pareto e analise os resultados. Tabela 1.1 Distribuição de freqüências dos defeitos no processo de inspeção. Tipo de Defeito Freqüência Freqüência Acumulada Freqüência Relativa Freq. Relativa Acumulada Mancha Deformação Risco Trinca Aspereza Quebrado Outros Total 100% 200 80% 150 60% 100 40% 50 20% 0 0% M D R T A Q O Figura 1.1 Gráfico de Pareto por tipo de defeito. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.6 Quebrado 2% Outros 7% Aspereza 3% Trinca 5% Risco 10% Mancha 52% Deformação 21% Figura 1.2 Diagrama Circular por tipo de defeito. Outros Quebrado Aspereza Trinca Risco Deformação Mancha 0 20 40 60 80 100 120 Figura 1.3 Diagrama de Barras por tipo de defeito. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 2) 1.7 Os dados abaixo correspondem à quantidade de defeitos por unidade, em uma amostra com 100 dispositivos. Qual o tipo de variável em questão ? Represente graficamente os dados da amostra. Calcule o número médio de defeitos por unidade. Tabela 1.2 Distribuição de defeitos por unidade. Quantidade de defeitos Freqüência 0 1 2 3 4 5 6 7 8 Freqüência Acumulada 21 29 25 14 7 3 0 1 0 Total 21 50 75 89 96 99 99 100 100 100 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 Figura 1.4 Distribuição de defeitos por unidade. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 3) 1.8 Elabore um diagrama de ramos e folhas a partir dos dados abaixo. Determine uma distribuição de freqüências e construa o histograma correspondente. 77,6 83,2 84,5 81,1 88,1 83,0 81,6 85,4 86,1 79,5 81,2 81,2 83,2 84,7 81,1 78,5 83,7 83,6 80,9 85,9 76,3 79,6 78,4 81,8 75,5 80,4 79,7 82,1 80,8 81,5 79,5 81,9 84,6 80,7 76,3 81,5 87,8 85,0 80,4 85,0 81,9 82,0 80,6 82,1 80,1 79,0 84,6 88,9 81,0 81,5 80,2 82,5 81,3 81,6 85,7 78,7 83,8 81,3 83,9 84,2 84,6 78,3 77,2 80,4 83,0 83,9 79,6 85,9 90,5 86,2 78,5 82,1 83,1 82,4 80,5 84,4 81,6 81,7 85,7 81,4 83,3 81,5 79,0 81,9 79,5 86,9 79,4 78,2 77,5 83,8 83,6 80,0 80,4 78,0 85,1 82,1 82,5 82,7 84,1 77,1 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.9 Tabela 1.3 Distribuição de freqüências ... Classe Freqüência Acumulada Freqüência 74,0 | 76,0 76,0 | 78,0 78,0 | 80,0 80,0 | 82,0 82,0 | 84,0 84,0 | 86,0 86,0 | 88,0 88,0 | 90,0 90,0 | 92,0 Total 35 100% 30 80% 25 60% 20 15 40% 10 20% 5 0% 0 73 75 77 79 81 83 85 87 89 91 93 Figura 1.5 Distribuição de freqüências ... x¯ ' 81,95 EPUSP - PRO s ' 2,86 Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 4) 1.10 Os dados abaixo referem-se aos tempos de reparo (em min) de um equipamento. Determine a distribuição de freqüências e construa o histograma correspondente. : 43 19 09 81 28 35 07 15 10 01 32 48 66 45 20 34 10 48 03 14 40 08 05 29 01 01 29 27 34 01 08 06 14 22 18 04 10 08 09 17 03 60 12 36 44 11 40 31 23 12 22 18 26 01 55 30 18 01 47 24 46 49 09 06 66 20 40 17 47 07 01 09 19 30 10 27 01 13 05 02 20 16 04 36 03 14 46 04 25 01 16 10 04 06 13 20 05 21 28 11 Tabela 1.4 Distribuição dos tempos de reparo. Classe Ponto Médio 0 | 10 10 | 20 20 | 30 30 | 40 40 | 50 50 | 60 60 | 70 70 | 80 80 | 90 5 15 25 35 45 55 65 75 85 Freqüência Acumulada Freqüência 32 56 73 82 95 96 99 99 100 32 24 17 9 13 1 3 0 1 Total 100 35 30 25 20 x¯ ' 21,0 15 s ' 17,4 10 5 0 5 15 25 35 45 55 65 75 85 95 Figura 1.6 Distribuição dos tempos de reparo. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 5) 1.11 Calcule a média, a mediana, os quartis, a amplitude e o desvio padrão da amostra de valores abaixo. A seguir, represente os dados graficamente. 112,7 113,6 114,2 114,4 114,5 115,3 115,4 115,8 116,2 116,8 116,9 117,0 117,1 117,7 118,2 123,6 110 6) 115 120 125 Os dados abaixo representam o desempenho de três grupos de 10 alunos em um teste. Construa um box plot para cada amostra e compare os resultados. Tabela 1.5 Resultados dos testes de cada grupo. Grupo Desempenhos 1 90 94 96 100 104 106 106 110 113 115 2 73 76 80 82 86 88 91 97 104 110 3 80 82 84 86 86 86 87 93 98 100 120 110 100 90 80 70 Figura 1.8 Diagrama comparativo do desempenho. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 7) 1.12 Os dados abaixo representam as notas finais de doze alunos nas disciplinas de Matemática e Física. Construa um diagrama de dispersão e verifique se há correlação linear entre as notas. : Matemática Física 51 68 72 97 55 73 95 74 20 91 74 80 74 70 88 93 67 73 99 73 33 91 80 86 80 60 40 20 0 0 Sxx ' 65.230 & 60 80 100 2 j xi yi ' 69.453 2 Sxy ' 69.453 & 40 j xi ' 65.230 j yi ' 74.883 j yi ' 927 20 Figura 1.9 Diagrama de dispersão para as notas em matemática e física. j xi ' 850 n ' 12 r ' 100 (850) @ (927) ' 3.790,5 12 (850)2 ' 5.026,7 12 Sxy Sxx @ Syy ' 0,935 Syy ' 74.883 & (927)2 ' 3.272,25 12 r 2 ' 0,874 CORRELAÇÃO FORTE EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 8) 1.13 A fim de monitorar um processo de fabricação, retiram-se sistematicamente amostras de tamanho cinco. A tabela abaixo apresenta os resultados obtidos em 20 amostras. Construa os gráficos de controle da tendência e dispersão e, a seguir, avalie a estabilidade do processo. Leituras Média D.P. R 1 39,9 40,6 39,1 40,7 40,7 40,20 0,70 1,60 2 39,2 40,0 39,7 39,9 39,4 39,64 0,34 0,80 3 40,7 40,4 40,4 40,4 40,3 40,44 0,15 0,40 4 39,6 39,2 40,0 40,3 39,6 39,74 0,42 1,10 5 38,9 39,5 39,2 40,9 39,5 39,60 0,77 2,00 6 40,7 40,1 41,1 39,5 40,0 40,28 0,63 1,60 7 39,5 40,8 39,8 39,9 40,0 40,00 0,48 1,30 8 39,4 40,2 41,1 40,3 39,3 40,06 0,74 1,80 9 39,3 40,1 40,2 39,7 40,4 39,94 0,44 1,10 10 39,5 40,0 40,2 40,2 39,9 39,96 0,29 0,70 11 40,5 40,1 40,8 39,8 39,3 40,10 0,59 1,50 12 39,7 40,6 40,1 40,4 39,6 40,08 0,43 1,00 13 39,3 39,8 39,1 40,9 39,7 39,76 0,70 1,80 14 40,7 39,1 40,0 39,6 40,5 39,98 0,65 1,60 15 41,1 39,5 40,2 41,1 39,7 40,32 0,76 1,60 16 40,4 39,6 39,9 39,4 40,0 39,86 0,38 1,00 17 39,4 39,8 40,2 40,3 39,6 39,86 0,38 0,90 18 40,0 39,7 39,2 39,9 40,7 39,90 0,54 1,50 19 40,0 39,9 40,6 39,8 39,2 39,90 0,50 1,40 20 40,5 40,0 39,5 39,9 39,4 39,86 0,44 1,10 EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.14 Xbar/S Chart for ... Sample Mean 41 UCL=40,70 40 Mean=39,97 LCL=39,24 39 Sample StDev Subgroup 0 10 20 UCL=1,069 1,0 0,5 S=0,5118 0,0 LCL=0 Xbar/R Chart for ... Sample Mean 41 UCL=40,72 40 Mean=39,97 LCL=39,23 39 Subgroup 0 Sample Range 3 10 20 UCL=2,728 2 1 0 EPUSP - PRO R=1,29 LCL=0 Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 9) 1.15 Amostras com 200 dispositivos são selecionadas diariamente, durante 25 dias consecutivos. Cada dispositivo da amostra é examinado e classificado em conforme ou desconforme. As quantidades de itens desconformes foram : dia 1 2 3 4 5 6 7 8 9 10 11 12 13 xi 6 4 10 13 8 10 2 8 4 10 6 8 6 dia 14 15 16 17 18 19 20 21 22 23 24 25 xi 6 3 9 7 9 9 6 9 7 7 0 7 Construa um gráfico de controle e avalie a estabilidade do processo. P Chart for Fração Desconforme 0,08 UCL=0,07368 0,07 Proportion 0,06 0,05 0,04 P=0,0348 0,03 0,02 0,01 0,00 LCL=0 0 5 10 15 20 25 Sample Number Figura 1.12 Gráfico para fração desconforme (n=200). EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.16 10) Os dados abaixo correspondem à quantidade de erros de digitação em uma amostra com 50 páginas (de cima para baixo, da esquerda para direita). Construa um gráfico de controle e avalie a estabilidade do processo. 0 1 0 3 1 1 2 1 0 2 0 2 0 3 0 3 2 2 1 2 1 2 3 1 0 1 0 2 1 1 1 0 1 0 3 7 0 1 2 3 3 2 1 2 4 0 1 3 1 2 C Chart for Erros de Digitação 8 1 7 Sample Count 6 UCL=5,174 5 4 3 2 C=1,5 1 0 LCL=0 0 10 20 30 40 50 Sample Number Figura 1.13 Gráfico da ocrrência de erros de digitação (n=50 páginas). EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita PRO2201 ESTATÍSTICA 1.17 EXERCÍCIOS PROPOSTOS 1) Na inspeção de um lote de placas de circuito impresso, foram detectadas as seguintes desconformidades : componente incorreto, 210; soldagem incorreta, 121; faltando componente, 103; falha de componente, 68; outros, 81. Após a implementação de ações de melhoria, a incidência de defeitos em um lote com o mesmo número de placas resultou em : componente incorreto, 63; soldagem incorreta, 100; faltando componente, 24; falha de componente, 72; outros, 58. Represente graficamente os dados e compare as situações "antes" e "depois". 2) Para investigar a distribuição das dimensões de eixos produzidos por um processo de usinagem, foi retirada uma amostra de 80 peças. Os valores abaixo representam os diâmetros, em milímetros, das peças contidas nesta amostra. Construa um histograma e calcule a média e o desvio padrão dos diâmetros. Estime a fração de eixos com diâmetro fora da especificação 25,0 ± 0,5 . 25,32 25,34 25,25 25,40 25,38 25,30 25,36 25,23 3) 25,41 25,28 25,19 25,28 25,15 25,20 25,52 25,32 25,11 25,28 25,17 25,31 25,47 25,25 25,29 25,16 25,46 25,28 25,39 25,30 25,29 25,24 25,27 25,24 25,17 25,24 25,31 25,37 25,35 25,31 25,25 25,36 25,20 25,33 25,35 25,27 25,26 25,32 25,24 25,32 25,26 25,48 25,37 25,07 25,27 25,27 25,24 25,34 25,41 25,43 25,31 25,35 25,40 25,47 25,34 25,33 25,29 25,39 25,25 25,19 25,33 25,33 25,18 25,26 25,34 25,23 25,28 25,27 25,45 25,45 25,27 25,24 Calcule a média e o desvio padrão a partir da seguinte distribuição de freqüências: xi fi 75 77 79 81 83 85 87 89 91 1 6 16 32 22 16 4 2 1 4) Um experimento para avaliar a durabilidade de um certo componente forneceu os seguintes resultados (em horas) : 48, 79, 100+, 35, 92, 86, 57, 100+, 17 e 29. Quais medidas de tendência central poderiam ser utilizadas para caracterizar a variável em questão ? Como é possível avaliar a dispersão da variável em questão. 5) Gerar 25 amostras aleatórias com 10 valores cada a partir de uma distribuição normal com média 50 e desvio padrão 2. Construa os gráficos de controle da média e desvio padrão amostrais. Idem para amplitude. EPUSP - PRO Prof.Dr. Marco Aurélio de Mesquita