Transcript
ESCOLA POLITÉCNICA Universidade de São Paulo Departamento de Engenharia de Produção
PRO2201 ESTATÍSTICA Notas de Aula
Prof. Dr. Marco Aurélio de Mesquita São Paulo, 2003
PRO2201 ESTATÍSTICA
SUMÁRIO 1
ESTATÍSTICA DESCRITIVA
2
CÁLCULO DE PROBABILIDADES
3
DISTRIBUIÇÕES DE PROBABILIDADES
4
DISTRIBUIÇÕES CONTÍNUAS
5
INTERVALOS DE CONFIANÇA
6
TESTES DE HIPÓTESES
7
ANÁLISE DE VARIÂNCIA
8
CORRELAÇÃO E REGRESSÃO LINEAR
EPUSP - PRO
Prof. Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.1
1 ESTATÍSTICA DESCRITIVA ESTATÍSTICA CIÊNCIA DOS DADOS. PROPORCIONA MÉTODOS PARA COLETA, REPRESENTAÇÃO, ANÁLISE E INTERPRETAÇÃO DE DADOS
ÁREAS DE APLICAÇÃO
ENGENHARIA, ADMINISTRAÇÃO, ECONOMIA, CIÊNCIAS SOCIAIS, MEDICINA E SAÚDE, MEIO AMBIENTE ETC
ESTATÍSTICA DESCRITIVA
REPRESENTAÇÃO GRÁFICA E SÍNTESE DE DADOS
INFERÊNCIA ESTATÍSTICA
CONCLUSÕES BASEADAS EM DADOS AMOSTRAIS SOBRE UMA POPULAÇÃO OU PROCESSO
POPULAÇÃO
AMOSTRA VARIÁVEIS :
CONJUNTO DE ELEMENTOS COM CARACTERÍSTICAS COMUNS, QUE SE DESEJA ESTUDAR
QUALQUER SUBCONJUNTO EXTRAÍDO DA POPULAÇÃO
QUALITATIVAS
ATRIBUTOS (cor, modelo, procedência etc)
QUANTITATIVAS
INTEIRAS (contagem) OU CONTÍNUAS (medição)
COMO OBTER AMOSTRAS REPRESENTATIVAS ? AMOSTRAGEM
ALEATÓRIA, SISTEMÁTICA, ESTRATIFICADA, EXPERIMENTAL, ...
REPRESENTAÇÃO GRÁFICA - DIAGRAMAS DE BARRAS E CIRCULARES - HISTOGRAMAS - DIAGRAMAS DE DISPERSÃO - GRÁFICOS DE CONTROLE - SÉRIES TEMPORAIS ...
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.2
MEDIDAS ASSOCIADAS A VARIÁVEIS QUALITATIVAS FREQÜÊNCIAS RELATIVAS :
x n
pˆ '
MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS MEDIDAS DE TENDÊNCIA MÉDIA AMOSTRAL n
x¯ '
j xi
x1%x2%ÿ%xn n
MÉDIA POPULACIONAL :
MEDIANA AMOSTRAL
'
i'1
n
'
T n
µ
x˜
VALOR INTERMEDIÁRIO DA AMOSTRA EM ORDEM CRESCENTE MEDIANA POPULACIONAL :
EXEMPLO :
40 50 60 80 120
x¯ ' 70 QUARTIS
µ˜
x˜ ' 60
DIVIDEM A AMOSTRA EM QUATRO GRUPOS
1º QUARTIL : 25% MENORES 2º QUARTIL = MEDIANA 3º QUARTIL : 25% MAIORES
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.3
MEDIDAS DE DISPERSÃO AMPLITUDE AMOSTRAL :
R ' x max & x min n
VARIÂNCIA AMOSTRAL :
s2 '
VARIÂNCIA POPULACIONAL :
s2 '
2
i'1
n&1
σ2 s ' s2
DESVIO PADRÃO AMOSTRAL
EXEMPLO 1 :
j (xi & x¯ )
40 55 50 55 60
x¯ ' 50
Y
(40&50)2%(45&50)2%(50&50)2%(55&50)2%(60&50)2 ' 62,5 4
EXEMPLO 2 :
10 30 50 70 90
x¯ ' 50
Y
s ' s 2 ' 7,9
s ' 31,6
FÓRMULA DE CÁLCULO PARA VARIÂNCIA :
T2 Q & n s2 ' , n &1
n
n
i'1
i'1
onde T ' j xi e Q ' j xi
2
PROPRIEDADE : SEJA x1 , x2 , ÿ , xn UMA AMOSTRA ALETÓRIA E y ' a @ x % b , ENTÃO 1)
EPUSP - PRO
y¯ ' a @ x¯ % b
2)
2
2
sy ' a 2 @ sx
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.4
Pareto Chart for Defects
Defects at all Plants, June 100
400
Finish
(57; 20,1%)
O-Ring
(74; 26,1%)
80
Count
60 200
40
100
Percent
300
Connector ( 2; 0,7%) Screw ( 9; 3,2%)
20
0
Dent
(56; 19,7%) Poor Seal (34; 12,0%)
0
Defect
Mis
Count Percent Cum %
ws c re gS sin
274 64,8 64,8
s Mis
ing
ps C li
59 13,9 78,7
y ak Le
sk Ga
et f ec De
43 10,2 88,9
ti
i us Ho ve
In c
19 4,5 93,4
p om
a rt eP le t
Ot
10 2,4 95,7
rs he
Scratch (52; 18,3%)
18 4,3 100,0
Histogram of C1, with Normal Curve 140
15
130 120
Frequency
Pulse2
110 100 90 80
10
5
70 60 50
0
1
44
2
49
54
59
C1
Sex
Regression Plot
Regression Plot
Y = 1,11771 + 0,217670X
W = Logten(Y ) W = 7,06962 - 0,698628X + 1,74E-02X**2 R-Sq = 93,1 %
R-Sq = 95,7 % 100 3,0
EnergyConsum
50
Score2
2,5
2,0
20 10 5,00
2,00 Regression
1,00
95% PI
0,50 1,5 2
3
4
5
6
7
8
9
10
Score1
20
30
MachineSetti
Xbar/R Chart for Supp2 1
1
3,0SL=602,4
602 601
X=600,2
600
110
599 -3,0SL=598,1
598
Sample Range
Subgroup
0
9 8 7 6 5 4 3 2 1 0
EPUSP - PRO
10
Sales
Sample Mean
603
20
100 3,0SL=7,866
R=3,720
90 -3,0SL=0,00E+0
Date/Time
1Q91 2Q91 3Q91 4Q91 1Q92 2Q92 3Q92 4Q92
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.5
EXERCÍCIOS 1)
A inspeção de 200 itens defeituosos resultou na seguinte distribuição de defeitos: Mancha, 104; Trinca, 10; Deformação, 42; Quebrado, 4; Risco, 20; Aspereza, 6 e 14 outros defeitos. Construa um gráfico de Pareto e analise os resultados.
Tabela 1.1 Distribuição de freqüências dos defeitos no processo de inspeção. Tipo de Defeito
Freqüência
Freqüência Acumulada
Freqüência Relativa
Freq. Relativa Acumulada
Mancha Deformação Risco Trinca Aspereza Quebrado Outros Total
100%
200
80%
150
60% 100 40% 50
20%
0
0% M
D
R
T
A
Q
O
Figura 1.1 Gráfico de Pareto por tipo de defeito.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.6
Quebrado 2%
Outros 7%
Aspereza 3% Trinca 5% Risco 10% Mancha 52%
Deformação 21%
Figura 1.2 Diagrama Circular por tipo de defeito.
Outros Quebrado Aspereza Trinca Risco Deformação Mancha 0
20
40
60
80
100
120
Figura 1.3 Diagrama de Barras por tipo de defeito.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 2)
1.7
Os dados abaixo correspondem à quantidade de defeitos por unidade, em uma amostra com 100 dispositivos. Qual o tipo de variável em questão ? Represente graficamente os dados da amostra. Calcule o número médio de defeitos por unidade. Tabela 1.2 Distribuição de defeitos por unidade. Quantidade de defeitos
Freqüência
0 1 2 3 4 5 6 7 8
Freqüência Acumulada
21 29 25 14 7 3 0 1 0
Total
21 50 75 89 96 99 99 100 100
100
30 25 20 15 10 5 0 0
1
2
3
4
5
6
7
8
Figura 1.4 Distribuição de defeitos por unidade.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 3)
1.8
Elabore um diagrama de ramos e folhas a partir dos dados abaixo. Determine uma distribuição de freqüências e construa o histograma correspondente.
77,6 83,2 84,5 81,1 88,1 83,0 81,6 85,4 86,1 79,5
81,2 81,2 83,2 84,7 81,1 78,5 83,7 83,6 80,9 85,9
76,3 79,6 78,4 81,8 75,5 80,4 79,7 82,1 80,8 81,5
79,5 81,9 84,6 80,7 76,3 81,5 87,8 85,0 80,4 85,0
81,9 82,0 80,6 82,1 80,1 79,0 84,6 88,9 81,0 81,5
80,2 82,5 81,3 81,6 85,7 78,7 83,8 81,3 83,9 84,2
84,6 78,3 77,2 80,4 83,0 83,9 79,6 85,9 90,5 86,2
78,5 82,1 83,1 82,4 80,5 84,4 81,6 81,7 85,7 81,4
83,3 81,5 79,0 81,9 79,5 86,9 79,4 78,2 77,5 83,8
83,6 80,0 80,4 78,0 85,1 82,1 82,5 82,7 84,1 77,1
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.9
Tabela 1.3 Distribuição de freqüências ... Classe
Freqüência Acumulada
Freqüência
74,0 | 76,0 76,0 | 78,0 78,0 | 80,0 80,0 | 82,0 82,0 | 84,0 84,0 | 86,0 86,0 | 88,0 88,0 | 90,0 90,0 | 92,0 Total
35
100%
30
80%
25 60%
20 15
40%
10 20%
5
0%
0 73
75
77
79
81
83
85
87
89
91
93
Figura 1.5 Distribuição de freqüências ...
x¯ ' 81,95
EPUSP - PRO
s ' 2,86
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 4)
1.10
Os dados abaixo referem-se aos tempos de reparo (em min) de um equipamento. Determine a distribuição de freqüências e construa o histograma correspondente. : 43 19 09 81 28 35 07 15 10 01
32 48 66 45 20 34 10 48 03 14
40 08 05 29 01 01 29 27 34 01
08 06 14 22 18 04 10 08 09 17
03 60 12 36 44 11 40 31 23 12
22 18 26 01 55 30 18 01 47 24
46 49 09 06 66 20 40 17 47 07
01 09 19 30 10 27 01 13 05 02
20 16 04 36 03 14 46 04 25 01
16 10 04 06 13 20 05 21 28 11
Tabela 1.4 Distribuição dos tempos de reparo. Classe
Ponto Médio
0 | 10 10 | 20 20 | 30 30 | 40 40 | 50 50 | 60 60 | 70 70 | 80 80 | 90
5 15 25 35 45 55 65 75 85
Freqüência Acumulada
Freqüência
32 56 73 82 95 96 99 99 100
32 24 17 9 13 1 3 0 1
Total
100
35 30 25 20
x¯ ' 21,0
15
s ' 17,4
10 5 0 5
15
25
35
45
55
65
75
85
95
Figura 1.6 Distribuição dos tempos de reparo.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 5)
1.11
Calcule a média, a mediana, os quartis, a amplitude e o desvio padrão da amostra de valores abaixo. A seguir, represente os dados graficamente. 112,7
113,6
114,2
114,4
114,5
115,3
115,4
115,8
116,2
116,8
116,9
117,0
117,1
117,7
118,2
123,6
110
6)
115
120
125
Os dados abaixo representam o desempenho de três grupos de 10 alunos em um teste. Construa um box plot para cada amostra e compare os resultados. Tabela 1.5 Resultados dos testes de cada grupo. Grupo
Desempenhos
1
90
94
96
100
104
106
106
110
113
115
2
73
76
80
82
86
88
91
97
104
110
3
80
82
84
86
86
86
87
93
98
100
120
110
100
90
80
70
Figura 1.8 Diagrama comparativo do desempenho.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 7)
1.12
Os dados abaixo representam as notas finais de doze alunos nas disciplinas de Matemática e Física. Construa um diagrama de dispersão e verifique se há correlação linear entre as notas. :
Matemática
Física
51 68 72 97 55 73 95 74 20 91 74 80
74 70 88 93 67 73 99 73 33 91 80 86
80 60 40 20 0 0
Sxx ' 65.230 &
60
80
100
2
j xi yi ' 69.453
2
Sxy ' 69.453 &
40
j xi ' 65.230
j yi ' 74.883
j yi ' 927
20
Figura 1.9 Diagrama de dispersão para as notas em matemática e física.
j xi ' 850
n ' 12
r '
100
(850) @ (927) ' 3.790,5 12 (850)2 ' 5.026,7 12
Sxy Sxx @ Syy
' 0,935
Syy ' 74.883 &
(927)2 ' 3.272,25 12
r 2 ' 0,874
CORRELAÇÃO FORTE
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
8)
1.13
A fim de monitorar um processo de fabricação, retiram-se sistematicamente amostras de tamanho cinco. A tabela abaixo apresenta os resultados obtidos em 20 amostras. Construa os gráficos de controle da tendência e dispersão e, a seguir, avalie a estabilidade do processo.
Leituras
Média
D.P.
R
1
39,9
40,6
39,1
40,7
40,7
40,20
0,70
1,60
2
39,2
40,0
39,7
39,9
39,4
39,64
0,34
0,80
3
40,7
40,4
40,4
40,4
40,3
40,44
0,15
0,40
4
39,6
39,2
40,0
40,3
39,6
39,74
0,42
1,10
5
38,9
39,5
39,2
40,9
39,5
39,60
0,77
2,00
6
40,7
40,1
41,1
39,5
40,0
40,28
0,63
1,60
7
39,5
40,8
39,8
39,9
40,0
40,00
0,48
1,30
8
39,4
40,2
41,1
40,3
39,3
40,06
0,74
1,80
9
39,3
40,1
40,2
39,7
40,4
39,94
0,44
1,10
10
39,5
40,0
40,2
40,2
39,9
39,96
0,29
0,70
11
40,5
40,1
40,8
39,8
39,3
40,10
0,59
1,50
12
39,7
40,6
40,1
40,4
39,6
40,08
0,43
1,00
13
39,3
39,8
39,1
40,9
39,7
39,76
0,70
1,80
14
40,7
39,1
40,0
39,6
40,5
39,98
0,65
1,60
15
41,1
39,5
40,2
41,1
39,7
40,32
0,76
1,60
16
40,4
39,6
39,9
39,4
40,0
39,86
0,38
1,00
17
39,4
39,8
40,2
40,3
39,6
39,86
0,38
0,90
18
40,0
39,7
39,2
39,9
40,7
39,90
0,54
1,50
19
40,0
39,9
40,6
39,8
39,2
39,90
0,50
1,40
20
40,5
40,0
39,5
39,9
39,4
39,86
0,44
1,10
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.14
Xbar/S Chart for ...
Sample Mean
41 UCL=40,70
40
Mean=39,97
LCL=39,24 39
Sample StDev
Subgroup
0
10
20
UCL=1,069
1,0
0,5
S=0,5118
0,0
LCL=0
Xbar/R Chart for ...
Sample Mean
41 UCL=40,72
40
Mean=39,97
LCL=39,23 39
Subgroup
0
Sample Range
3
10
20
UCL=2,728
2 1 0
EPUSP - PRO
R=1,29
LCL=0
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA 9)
1.15
Amostras com 200 dispositivos são selecionadas diariamente, durante 25 dias consecutivos. Cada dispositivo da amostra é examinado e classificado em conforme ou desconforme. As quantidades de itens desconformes foram : dia
1
2
3
4
5
6
7
8
9
10
11
12
13
xi
6
4
10
13
8
10
2
8
4
10
6
8
6
dia
14
15
16
17
18
19
20
21
22
23
24
25
xi
6
3
9
7
9
9
6
9
7
7
0
7
Construa um gráfico de controle e avalie a estabilidade do processo.
P Chart for Fração Desconforme 0,08 UCL=0,07368
0,07
Proportion
0,06 0,05 0,04
P=0,0348
0,03 0,02 0,01 0,00
LCL=0 0
5
10
15
20
25
Sample Number Figura 1.12 Gráfico para fração desconforme (n=200).
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.16
10) Os dados abaixo correspondem à quantidade de erros de digitação em uma amostra com 50 páginas (de cima para baixo, da esquerda para direita). Construa um gráfico de controle e avalie a estabilidade do processo. 0 1 0 3 1 1 2 1 0 2
0 2 0 3 0 3 2 2 1 2
1 2 3 1 0 1 0 2 1 1
1 0 1 0 3 7 0 1 2 3
3 2 1 2 4 0 1 3 1 2
C Chart for Erros de Digitação 8 1
7
Sample Count
6 UCL=5,174
5 4 3 2
C=1,5
1 0
LCL=0 0
10
20
30
40
50
Sample Number Figura 1.13 Gráfico da ocrrência de erros de digitação (n=50 páginas).
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita
PRO2201 ESTATÍSTICA
1.17
EXERCÍCIOS PROPOSTOS 1)
Na inspeção de um lote de placas de circuito impresso, foram detectadas as seguintes desconformidades : componente incorreto, 210; soldagem incorreta, 121; faltando componente, 103; falha de componente, 68; outros, 81. Após a implementação de ações de melhoria, a incidência de defeitos em um lote com o mesmo número de placas resultou em : componente incorreto, 63; soldagem incorreta, 100; faltando componente, 24; falha de componente, 72; outros, 58. Represente graficamente os dados e compare as situações "antes" e "depois".
2)
Para investigar a distribuição das dimensões de eixos produzidos por um processo de usinagem, foi retirada uma amostra de 80 peças. Os valores abaixo representam os diâmetros, em milímetros, das peças contidas nesta amostra. Construa um histograma e calcule a média e o desvio padrão dos diâmetros. Estime a fração de eixos com diâmetro fora da especificação 25,0 ± 0,5 . 25,32 25,34 25,25 25,40 25,38 25,30 25,36 25,23
3)
25,41 25,28 25,19 25,28 25,15 25,20 25,52 25,32
25,11 25,28 25,17 25,31 25,47 25,25 25,29 25,16
25,46 25,28 25,39 25,30 25,29 25,24 25,27 25,24
25,17 25,24 25,31 25,37 25,35 25,31 25,25 25,36
25,20 25,33 25,35 25,27 25,26 25,32 25,24 25,32
25,26 25,48 25,37 25,07 25,27 25,27 25,24 25,34
25,41 25,43 25,31 25,35 25,40 25,47 25,34 25,33
25,29 25,39 25,25 25,19 25,33 25,33 25,18 25,26
25,34 25,23 25,28 25,27 25,45 25,45 25,27 25,24
Calcule a média e o desvio padrão a partir da seguinte distribuição de freqüências: xi
fi
75 77 79 81 83 85 87 89 91
1 6 16 32 22 16 4 2 1
4)
Um experimento para avaliar a durabilidade de um certo componente forneceu os seguintes resultados (em horas) : 48, 79, 100+, 35, 92, 86, 57, 100+, 17 e 29. Quais medidas de tendência central poderiam ser utilizadas para caracterizar a variável em questão ? Como é possível avaliar a dispersão da variável em questão.
5)
Gerar 25 amostras aleatórias com 10 valores cada a partir de uma distribuição normal com média 50 e desvio padrão 2. Construa os gráficos de controle da média e desvio padrão amostrais. Idem para amplitude.
EPUSP - PRO
Prof.Dr. Marco Aurélio de Mesquita