Transcript
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ
CENTRO DE ENGENHARIAS E CIÊNCIAS EXATAS
CURSO DE ENGENHARIA QUÍMICA
DISCIPLINA: ESTATÍSTICA
TRABALHO DE REGRESSÃO
TOLEDO – PR
Novembro de 2011
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ
CENTRO DE ENGENHARIAS E CIÊNCIAS EXATAS
CURSO DE ENGENHARIA QUÍMICA
DISCIPLINA: ESTATÍSTICA
TRABALHO DE REGRESSÃO
Jorge Tonel
Vicky Cerioli
Trabalho entregue como avaliação da disciplina de Estatística do curso de Engenharia Química da Universidade Estadual do Oeste do Paraná – Campus Toledo.Profa: Márcia Simões
Trabalho entregue como avaliação da disciplina de Estatística do curso de Engenharia Química da Universidade Estadual do Oeste do Paraná – Campus Toledo.
Profa: Márcia Simões
TOLEDO – PR
Novembro de 2011
Exercício 1) Os dados abaixo se referem a meses de experiência (x), e o número de erros cometidos (y) por 12 datilógrafos, ao executarem um mesmo texto.
Mês (x)
1
2
3
4
5
6
7
8
9
10
11
12
Erros (y)
30
28
23
20
19
17
14
13
11
7
4
2
Admitindo que o modelo linear é o adequado, qual seria a equação da reta ajustada?
Fazendo a análise de regressão obtemos:
Logo, a equação da reta ajustada é: Erros (y) = 31,6 - 2,45 Meses (x)
Determine o Coeficiente de Correlação.
O coeficiente de correlação mede o grau de correlação entre duas variáveis. Neste caso, o valor determinado para o coeficiente de correlação linear entre o tempo de trabalho em meses (x) e o total de erros cometidos (y) foi de -0,994. Como r está próximo de -1 infere-se que existe uma correlação perfeita e negativa entre as variáveis onde o sinal negativo mostra que quanto maior o valor de x, menor o y.
É um bom ajuste (verifique pelo R²)? Caso contrário proponha um outro modelo.
O R² (coeficiente de determinação) mostra a porcentagem da variabilidade dos dados que pode ser explicada pelo modelo ajustado, quanto maior o seu valor melhor é o ajuste da reta aos dados. Assim, como R² = 98,7%, segundo a tabela ANOVA, pode-se concluir que é um bom ajuste, visto que, o modelo consegue explicar 98,7% da variabilidade dos dados experimentais.
Exercício 2) Os dados abaixo mostram a concentração de plâncton (CP) dependente da transparência (T) da água:
CP
50
47
70
68
52
105
110
150
120
40
T
20
25
11
8
15
6
5
4
5
25
Faça o diagrama de dispersão.
Encontre uma transformação que linearize os dados. Faça o diagrama de dispersão dos dados transformados.
Aplicando o modelo exponencial f(x) = αeβx linearizamos a equação, fazendo Ln y = lnα + βx, ou seja, Ln CP = lnα + βT. O diagrama de dispersão para os dados tranformados encontrado foi:
Aplicando o modelo potência f(x)= αxβ linearizamos a equação, fazendo log y = log α + β log x, ou seja, Log CP = log α + β log x. O diagrama de dispersão para os dados tranformados encontrado foi:
Analisando os dois modelos aplicados, concluímos que o melhor modelo que lineariza os dados é o potência, pois o gráfico de regressão apresentou um R² = 94,7%, maior que o R² apresentado pelo modelo exponencial (R² = 84,8%).
Ajuste o modelo aos dados transformados e encontre qual seria a concentração de plâncton (CP) para a transparência (T) de 22?
log CP = 2,50 - 0,634 log T
log CP = 2,50 – 0,634 log 22
log CP= 2,50 - 0,8510959
log CP = 1,6489041
CP= 44,5557
Logo, a concentração de plâncton para uma transparência de 22 é de 44,5557 unidades de concentração de plâncton.
Exercício 3) Em uma indústria química são coletados dados de referentes ao teor de cobre de uma das soluções efluentes de um dos processos da empresa. A determinação do teor do cobre é feita por meio do emprego de um espectrofotômetro de absorção atômica. Para que o espectrofotômetro de absorção atômica pudesse ser utilizado, foi necessário determinar a forma de relacionamento entre a absorbância (variável resposta) medida diretamente pelo aparelho e o teor de cobre da solução (variável preditora). Com este objetivo, os técnicos da indústria utilizaram uma serie de amostras da solução efluente para as quais a concentração era conhecida (padrões). Estes padrões de calibração foram a seguir medidos no aparelho sob as mesmas condições que seriam utilizadas subseqüentemente para medir as amostras de concentração desconhecida. Os dados obtidos são apresentados na tabela 01.
Tabela 01: Medidas de absorbância obtidas em soluções com concentração de cobre conhecida.
Teor de cobre (µg/ml) (x)
Absorbância (unidades de absorbância) (y)
2
9
3
16
4
21
5
24
6
29
7
36
8
39
A partir da Tabela 01, construa um diagrama de dispersão para os dados coletados no estudo.
Por meio do emprego da Análise de Regressão, obtenha a Curva de Calibração a partir dos dados coletados.
A equação da regressão encontrada, através da análise de regressão é:
Absorbância = 0,214 + 4,929 Teor de cobre
E a curva de calibração encontrada a partir dos dados coletados, que consiste em uma reta, é:
Avalie a adequação do modelo de regressão ajustado aos dados coletados em estudo (análise gráfica de resíduos, teste para validação da normalidade e R²). Quais são suas conclusões?
Teste para validação da normalidade:
Para analisar a normalidade dos dados testamos H0 e H1 a partir do gráfico, onde a hipótese nula (H0) representa a distribuição normal e a hipótese alternativa (H1) afirma que a distribuição não é normal. Como P-valor é menor que 0,05 H0 é rejeitado, ou seja, a distribuição é não-normal.
Análise gráfica de resíduos:
Passando uma linha imaginária em 0,0, pode-se observar que os dados estão homogeneizados, ou seja, apresentam variância constante. Portanto os mesmos são satisfatórios.
Análise de R²:
O valor de R² é 99,0% (positivo e muito próximo de 100%), o que significa que o modelo consegue explicar 99,0% da variabilidade dos dados experimentais.
d) Suponha que tenha sido obtida uma nova observação (= 19) para a absorbância. Determine uma estimativa pontual para o teor de cobre correspondente ao resultado.
Absorbância = 0,21 + 4,93*Teor de cobre
19 = 0,21 + 4,93*Teor de cobre
Teor de cobre = 3,81
Exercício 4) As tabelas abaixo fazem parte da saída de uma análise de regressão realizada pelo MINITAB.
Predictor
Constant
X
Coef
93.074
-2.1848
Stdev
6.593
0.1258
t-ratio
12.6
-9.42
P
0.000
0.000
Source
DF
SS
MS
F
P
Regression
1
1011.5
1011.5
88.7
0.000
Error
9
102.3
11.4
Total
10
1113.8
a) Escreva a equação da reta ajustada.
f(x) = β0 + β1x
f(x) = 93,074 – 2,1848x
b) Teste β1=0 contra β1 0. Use α=5%.
O valor de F, sendo este tabelado, é o que limita as regiões de rejeição e de não-rejeição. Como o valor de F da tabela acima contida no exercício pertence à região de rejeição, rejeita-se H0 com 5 % de significância, o que também é comprovado pelo P-valor, sendo este menor que 0,05, tendendo a zero. Conclui-se, portanto, que β 1 0.
c) Encontre o R².
R²=SQRegSQT R²=1011,51113,8 .100 = 90,8 %
d) O modelo é adequado? Justifique sua resposta.
O modelo pode ser considerado adequado, pois o R² calculado é próximo de 100% e quanto mais próximo maior a porcentagem da variabilidade dos dados que pode ser explicada pelo modelo ajustado.
e) Quais são as suposições do modelo estatístico?
Erros são variáveis aleatórias independentes, erros tem variância constante, erros têm distribuição normal.
Exercício 5) A tabela abaixo mostra um estudo sobre o efeito do carbono (em %) contido em fios de aço utilizados em resistências elétricas.
Carbono contido ©
Resistência (μ ohms cm a 20°C) ®
0,10
15,0
0,15
15,7
0,20
16,2
0,25
17,1
0,30
18,0
0,40
19,2
0,50
20,4
0,55
21,2
0,60
21,9
0,70
22,6
0,80
23,8
0,85
24,2
0,90
25,3
0,95
26,0
a) Construa um Diagrama d Dispersão para os dados coletados no estudo.
b) Por meio do emprego da análise de regressão obtenha um gráfico da equação ajustada (FITTED LINE PLOT).
A equação ajustada do modelo é:
Resistência (µ ohms cm a 20C) = 13,96 + 12,57 Carbono contido
c) Avalie a adequação do modelo de regressão ajustado aos dados coletados em estudo (análise gráfica de resíduos, teste para validação da normalidade e R²). Quais são suas conclusões?
Teste para validação da normalidade:
Para analisar a normalidade dos dados testamos H0 e H1 a partir do gráfico, onde a hipótese nula (H0) representa a distribuição normal e a hipótese alternativa (H1) afirma que a distribuição não é normal. Como P-valor é maior que 0,05 aceita-se H0, ou seja, a distribuição é normal.
Análise gráfica de resíduos:
Passando uma linha imaginária em 0,0, pode-se observar que os dados estão homogeneizados, ou seja, apresentam variância constante. Portanto os mesmos são satisfatórios.
Análise de R²:
Analisando o valor de R², observa-se que o modelo consegue explicar 99,5% da variabilidade dos dados experimentais, ou seja, o modelo ajustado é considerado bom.
6) Os seguintes dados foram obtidos num experimento de filtração a pressão constante de uma suspensão de CaCO3 no laboratório de Engenharia Química II- pela quarta série:
Tempo –t(s)
Volume de filtrado obtido – V(m³)
1°tomada
2°tomada
3°tomada
34
37
42
5,03
57
59
65
10,06.
94
82
96
15,09.
141
111
136
20,12.
204
153
184
25,15.
257
204
232
30,15.
325
250
274
35,21.
400
287
319
40,24.
456
336
369
45,27.
516
381
419
50,30.
602
426
478
55,33.
669
475
535
60,36.
742
523
595
65,39.
813
572
649
70,42.
886
628
718
75,45.
967
688
780
80,48.
1050
750
858
85,51.
1153
808
938
90,54.
1242
873
1014
95,57.
1349
942
1100
100,60.
1445
1008
1181
105,63.
a) Obter a média dos valores de tempo.
Tempo –t(s)
Média
1°tomada
2°tomada
3°tomada
34
37
42
37,6
57
59
65
60,3
94
82
96
90,6
141
111
136
129,3
204
153
184
180,3
257
204
232
231,0
325
250
274
283,0
400
287
319
335,3
456
336
369
387,0
516
381
419
438,6
602
426
478
502,0
669
475
535
559,6
742
523
595
620,0
813
572
649
678,0
886
628
718
744,0
967
688
780
811,6
1050
750
858
886,0
1153
808
938
966,3
1242
873
1014
1043,0
1349
942
1100
1130,3
1445
1008
1181
1211,3
b) Fazer o diagrama de dispersão t/V versus V.
c) Para este diagrama de dispersão encontrar a equação da reta que melhor represente os pontos experimentais.
Logo, a equação da reta que melhor representa os pontos experimentais é:
tV= 5,19 .108 V+600637
d) Comparar a equação da reta encontrada com a equação da filtração a constante:
Torta incompressível e ΔP = cte:
PARVPAsVtm l liq22
P
A
R
V
P
A
s
V
t
m
l
liq
2
2
Sabendo que:
Coeficiente linear encontrado= PARm
P
A
R
m
Onde:
....resistência do meio filtrante
µ....viscosidade da suspensão de CaCO3 = Kg/s.m
A....área do filtro=8,93. m²
ΔΡ...Queda da pressão no filtro = 20. N/m²
Comparando-se a equação encontrada com a equação da filtração a constante, conclui-se que:
08PAs l liq225,19 x10
08
P
A
s
l
liq
2
2
5,19 x10
PARm 600637
P
A
R
m
600637
Sendo assim, o valor de β0 (coeficiente linear) é 600637, e o coeficiente angular (β1) é 5,19 x 108.
e) Encontre o valor da resistência do meio filtrante (Rm)
Sabendo que:
Coeficiente angular encontrado =ρliq . s . l . µ2A² . ΔΡ
Onde:
ρliq .... densidade da suspensão=996,95 Kg/m³
s...relação entre massa de carbonato e massa de água na suspensão= 0,1
λ...resistência específica da torta formada
µ...viscosidade da suspensão de CaCO3 = kg/s.m
A...Área do filtro= 8,93. m²
ΔΡ...Queda da pressão no filtro= 20. N/m²
Fazendo a substituição dos valores de μ, A, ΔP e coef. Linear temos:
Rm = 6006378,93.10-3(20.103)10-3
Rm = 1,07 . 10 m²/s
f) Encontre o valor da resistência específica da torta formada (l).
Fazendo a substituição dos valores de , ρliq, A, ΔP, s e μ e coef. angular temos:
l = 28,93.10-3²5,19.108(20.103)996,95.0,1.10-3
Rm = 1,66 . 1010 m²/s
Exercício de sedimentação
7) Os seguintes dados foram obtidos num experimento de sedimentação no Laboratório de Engenharia Química - II pela 4ª série:
Ensaio 01-suspensão de CaCO3 a 60g/l
Tempo-t(s)
0 72 120 172 219 277 325 370
Altura da suspensão na proveta-Z(cm)
37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1
Ensaio 02-suspensão de CaCO3a 90g/l
Tempo-t(s)
0 73 141 230 298 359 430 488
Altura da suspensão na proveta-Z(cm)
37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1
Ensaio 03-suspensão de CaCO3a 120g/l
Tempo-t(s)
0 105 182 270 340 424 504 566
Altura da suspensão na proveta-Z(cm)
37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1
Ensaio 04-suspensão de CaCO3 a 150g/l
Tempo-t(s)
0 108 190 279 370 454 527 627
Altura da suspensão na proveta-Z(cm)
37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1
a) Para cada um dos ensaios fazer o diagrama de dispersão Z versus t.
Ensaio 1:
Ensaio 2:
Ensaio 3:
Ensaio 4:
b)Para cada diagrama de dispersão encontrar a equação da reta que melhor representa os pontos experimentais.
Ensaio 1:
Logo, a equação da reta é: Z = 37,82 – 0,6821t
Ensaio 2:
Logo, a equação da reta é: Z = 37,26 – 0,05235t
Ensaio 3:
Logo, a equação da reta é: Z = 37,77 – 0,04590t
Ensaio 4:
Logo, a equação da reta é: Z = 37,51 – 0,04213t
c) De cada equação obter o coeficiente angular. Este coeficiente é igual à velocidade de sedimentação da suspensão de CaCO3
Ensaio 1 : Coeficiente Angular: -0,06821
Ensaio 2 : Coeficiente Angular: -0,05235
Ensaio 3 : Coeficiente Angular: -0,04590
Ensaio 4 : Coeficiente Angular : -0,04213
d) Para cada velocidade obter área necessária para o projeto do decantador industrial que opera com suspensão de CaCO3 na faixa de concentração de 60 a 150 g/l com vazão de alimentação 100 kg/h através da equação:
S=QACA(1C-1CE)u
onde:
S...Área do decantador industrial
QA...Vazão de alimentação do decantador= 100 Kg/l
CA...Concentração de alimentação do decantador industrial = 60 g/l
C...Cada uma das concentrações dos ensaios 60,90, 120 e 150 g/l
CE...Concentração da suspensão concentrada no decantador = 150 g/l
u...Cada uma das velocidades de sedimentação determinadas experimentalmente
Você deve considerar como resposta do exercício anterior a maior área encontrada nos cálculos realizados!!
A maior área encontrada foi a qual se utilizou a velocidade obtida no ensaio 1 (-0,06821). O valor para esta área corresponde a 879,6 m².
S=QACA(1C-1CE)u
S=100(60)(160-1150)-0,06821
S = "- 879,6"
S= 879,6 m²