Preview only show first 10 pages with watermark. For full document please download

Trabalho Regressão

Trabalho de Estatística utilizando recursos do MINITAB.

   EMBED


Share

Transcript

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CENTRO DE ENGENHARIAS E CIÊNCIAS EXATAS CURSO DE ENGENHARIA QUÍMICA DISCIPLINA: ESTATÍSTICA TRABALHO DE REGRESSÃO TOLEDO – PR Novembro de 2011 UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CENTRO DE ENGENHARIAS E CIÊNCIAS EXATAS CURSO DE ENGENHARIA QUÍMICA DISCIPLINA: ESTATÍSTICA TRABALHO DE REGRESSÃO Jorge Tonel Vicky Cerioli Trabalho entregue como avaliação da disciplina de Estatística do curso de Engenharia Química da Universidade Estadual do Oeste do Paraná – Campus Toledo.Profa: Márcia Simões Trabalho entregue como avaliação da disciplina de Estatística do curso de Engenharia Química da Universidade Estadual do Oeste do Paraná – Campus Toledo. Profa: Márcia Simões TOLEDO – PR Novembro de 2011 Exercício 1) Os dados abaixo se referem a meses de experiência (x), e o número de erros cometidos (y) por 12 datilógrafos, ao executarem um mesmo texto. Mês (x) 1 2 3 4 5 6 7 8 9 10 11 12 Erros (y) 30 28 23 20 19 17 14 13 11 7 4 2 Admitindo que o modelo linear é o adequado, qual seria a equação da reta ajustada? Fazendo a análise de regressão obtemos: Logo, a equação da reta ajustada é: Erros (y) = 31,6 - 2,45 Meses (x) Determine o Coeficiente de Correlação. O coeficiente de correlação mede o grau de correlação entre duas variáveis. Neste caso, o valor determinado para o coeficiente de correlação linear entre o tempo de trabalho em meses (x) e o total de erros cometidos (y) foi de -0,994. Como r está próximo de -1 infere-se que existe uma correlação perfeita e negativa entre as variáveis onde o sinal negativo mostra que quanto maior o valor de x, menor o y. É um bom ajuste (verifique pelo R²)? Caso contrário proponha um outro modelo. O R² (coeficiente de determinação) mostra a porcentagem da variabilidade dos dados que pode ser explicada pelo modelo ajustado, quanto maior o seu valor melhor é o ajuste da reta aos dados. Assim, como R² = 98,7%, segundo a tabela ANOVA, pode-se concluir que é um bom ajuste, visto que, o modelo consegue explicar 98,7% da variabilidade dos dados experimentais. Exercício 2) Os dados abaixo mostram a concentração de plâncton (CP) dependente da transparência (T) da água: CP 50 47 70 68 52 105 110 150 120 40 T 20 25 11 8 15 6 5 4 5 25 Faça o diagrama de dispersão. Encontre uma transformação que linearize os dados. Faça o diagrama de dispersão dos dados transformados. Aplicando o modelo exponencial f(x) = αeβx linearizamos a equação, fazendo Ln y = lnα + βx, ou seja, Ln CP = lnα + βT. O diagrama de dispersão para os dados tranformados encontrado foi: Aplicando o modelo potência f(x)= αxβ linearizamos a equação, fazendo log y = log α + β log x, ou seja, Log CP = log α + β log x. O diagrama de dispersão para os dados tranformados encontrado foi: Analisando os dois modelos aplicados, concluímos que o melhor modelo que lineariza os dados é o potência, pois o gráfico de regressão apresentou um R² = 94,7%, maior que o R² apresentado pelo modelo exponencial (R² = 84,8%). Ajuste o modelo aos dados transformados e encontre qual seria a concentração de plâncton (CP) para a transparência (T) de 22? log CP = 2,50 - 0,634 log T log CP = 2,50 – 0,634 log 22 log CP= 2,50 - 0,8510959 log CP = 1,6489041 CP= 44,5557 Logo, a concentração de plâncton para uma transparência de 22 é de 44,5557 unidades de concentração de plâncton. Exercício 3) Em uma indústria química são coletados dados de referentes ao teor de cobre de uma das soluções efluentes de um dos processos da empresa. A determinação do teor do cobre é feita por meio do emprego de um espectrofotômetro de absorção atômica. Para que o espectrofotômetro de absorção atômica pudesse ser utilizado, foi necessário determinar a forma de relacionamento entre a absorbância (variável resposta) medida diretamente pelo aparelho e o teor de cobre da solução (variável preditora). Com este objetivo, os técnicos da indústria utilizaram uma serie de amostras da solução efluente para as quais a concentração era conhecida (padrões). Estes padrões de calibração foram a seguir medidos no aparelho sob as mesmas condições que seriam utilizadas subseqüentemente para medir as amostras de concentração desconhecida. Os dados obtidos são apresentados na tabela 01. Tabela 01: Medidas de absorbância obtidas em soluções com concentração de cobre conhecida. Teor de cobre (µg/ml) (x) Absorbância (unidades de absorbância) (y) 2 9 3 16 4 21 5 24 6 29 7 36 8 39 A partir da Tabela 01, construa um diagrama de dispersão para os dados coletados no estudo. Por meio do emprego da Análise de Regressão, obtenha a Curva de Calibração a partir dos dados coletados. A equação da regressão encontrada, através da análise de regressão é: Absorbância = 0,214 + 4,929 Teor de cobre E a curva de calibração encontrada a partir dos dados coletados, que consiste em uma reta, é: Avalie a adequação do modelo de regressão ajustado aos dados coletados em estudo (análise gráfica de resíduos, teste para validação da normalidade e R²). Quais são suas conclusões? Teste para validação da normalidade: Para analisar a normalidade dos dados testamos H0 e H1 a partir do gráfico, onde a hipótese nula (H0) representa a distribuição normal e a hipótese alternativa (H1) afirma que a distribuição não é normal. Como P-valor é menor que 0,05 H0 é rejeitado, ou seja, a distribuição é não-normal. Análise gráfica de resíduos: Passando uma linha imaginária em 0,0, pode-se observar que os dados estão homogeneizados, ou seja, apresentam variância constante. Portanto os mesmos são satisfatórios. Análise de R²: O valor de R² é 99,0% (positivo e muito próximo de 100%), o que significa que o modelo consegue explicar 99,0% da variabilidade dos dados experimentais. d) Suponha que tenha sido obtida uma nova observação (= 19) para a absorbância. Determine uma estimativa pontual para o teor de cobre correspondente ao resultado. Absorbância = 0,21 + 4,93*Teor de cobre 19 = 0,21 + 4,93*Teor de cobre Teor de cobre = 3,81 Exercício 4) As tabelas abaixo fazem parte da saída de uma análise de regressão realizada pelo MINITAB. Predictor Constant X Coef 93.074 -2.1848 Stdev 6.593 0.1258 t-ratio 12.6 -9.42 P 0.000 0.000 Source DF SS MS F P Regression 1 1011.5 1011.5 88.7 0.000 Error 9 102.3 11.4 Total 10 1113.8 a) Escreva a equação da reta ajustada. f(x) = β0 + β1x f(x) = 93,074 – 2,1848x b) Teste β1=0 contra β1 0. Use α=5%. O valor de F, sendo este tabelado, é o que limita as regiões de rejeição e de não-rejeição. Como o valor de F da tabela acima contida no exercício pertence à região de rejeição, rejeita-se H0 com 5 % de significância, o que também é comprovado pelo P-valor, sendo este menor que 0,05, tendendo a zero. Conclui-se, portanto, que β 1 0. c) Encontre o R². R²=SQRegSQT R²=1011,51113,8 .100 = 90,8 % d) O modelo é adequado? Justifique sua resposta. O modelo pode ser considerado adequado, pois o R² calculado é próximo de 100% e quanto mais próximo maior a porcentagem da variabilidade dos dados que pode ser explicada pelo modelo ajustado. e) Quais são as suposições do modelo estatístico? Erros são variáveis aleatórias independentes, erros tem variância constante, erros têm distribuição normal. Exercício 5) A tabela abaixo mostra um estudo sobre o efeito do carbono (em %) contido em fios de aço utilizados em resistências elétricas. Carbono contido © Resistência (μ ohms cm a 20°C) ® 0,10 15,0 0,15 15,7 0,20 16,2 0,25 17,1 0,30 18,0 0,40 19,2 0,50 20,4 0,55 21,2 0,60 21,9 0,70 22,6 0,80 23,8 0,85 24,2 0,90 25,3 0,95 26,0 a) Construa um Diagrama d Dispersão para os dados coletados no estudo. b) Por meio do emprego da análise de regressão obtenha um gráfico da equação ajustada (FITTED LINE PLOT). A equação ajustada do modelo é: Resistência (µ ohms cm a 20C) = 13,96 + 12,57 Carbono contido c) Avalie a adequação do modelo de regressão ajustado aos dados coletados em estudo (análise gráfica de resíduos, teste para validação da normalidade e R²). Quais são suas conclusões? Teste para validação da normalidade: Para analisar a normalidade dos dados testamos H0 e H1 a partir do gráfico, onde a hipótese nula (H0) representa a distribuição normal e a hipótese alternativa (H1) afirma que a distribuição não é normal. Como P-valor é maior que 0,05 aceita-se H0, ou seja, a distribuição é normal. Análise gráfica de resíduos: Passando uma linha imaginária em 0,0, pode-se observar que os dados estão homogeneizados, ou seja, apresentam variância constante. Portanto os mesmos são satisfatórios. Análise de R²: Analisando o valor de R², observa-se que o modelo consegue explicar 99,5% da variabilidade dos dados experimentais, ou seja, o modelo ajustado é considerado bom. 6) Os seguintes dados foram obtidos num experimento de filtração a pressão constante de uma suspensão de CaCO3 no laboratório de Engenharia Química II- pela quarta série: Tempo –t(s) Volume de filtrado obtido – V(m³) 1°tomada 2°tomada 3°tomada 34 37 42 5,03 57 59 65 10,06. 94 82 96 15,09. 141 111 136 20,12. 204 153 184 25,15. 257 204 232 30,15. 325 250 274 35,21. 400 287 319 40,24. 456 336 369 45,27. 516 381 419 50,30. 602 426 478 55,33. 669 475 535 60,36. 742 523 595 65,39. 813 572 649 70,42. 886 628 718 75,45. 967 688 780 80,48. 1050 750 858 85,51. 1153 808 938 90,54. 1242 873 1014 95,57. 1349 942 1100 100,60. 1445 1008 1181 105,63. a) Obter a média dos valores de tempo. Tempo –t(s) Média 1°tomada 2°tomada 3°tomada 34 37 42 37,6 57 59 65 60,3 94 82 96 90,6 141 111 136 129,3 204 153 184 180,3 257 204 232 231,0 325 250 274 283,0 400 287 319 335,3 456 336 369 387,0 516 381 419 438,6 602 426 478 502,0 669 475 535 559,6 742 523 595 620,0 813 572 649 678,0 886 628 718 744,0 967 688 780 811,6 1050 750 858 886,0 1153 808 938 966,3 1242 873 1014 1043,0 1349 942 1100 1130,3 1445 1008 1181 1211,3 b) Fazer o diagrama de dispersão t/V versus V. c) Para este diagrama de dispersão encontrar a equação da reta que melhor represente os pontos experimentais. Logo, a equação da reta que melhor representa os pontos experimentais é: tV= 5,19 .108 V+600637 d) Comparar a equação da reta encontrada com a equação da filtração a constante: Torta incompressível e ΔP = cte: PARVPAsVtm l liq22 P A R V P A s V t m l liq 2 2 Sabendo que: Coeficiente linear encontrado= PARm P A R m Onde: ....resistência do meio filtrante µ....viscosidade da suspensão de CaCO3 = Kg/s.m A....área do filtro=8,93. m² ΔΡ...Queda da pressão no filtro = 20. N/m² Comparando-se a equação encontrada com a equação da filtração a constante, conclui-se que: 08PAs l liq225,19 x10 08 P A s l liq 2 2 5,19 x10 PARm 600637 P A R m 600637 Sendo assim, o valor de β0 (coeficiente linear) é 600637, e o coeficiente angular (β1) é 5,19 x 108. e) Encontre o valor da resistência do meio filtrante (Rm) Sabendo que: Coeficiente angular encontrado =ρliq . s . l . µ2A² . ΔΡ Onde: ρliq .... densidade da suspensão=996,95 Kg/m³ s...relação entre massa de carbonato e massa de água na suspensão= 0,1 λ...resistência específica da torta formada µ...viscosidade da suspensão de CaCO3 = kg/s.m A...Área do filtro= 8,93. m² ΔΡ...Queda da pressão no filtro= 20. N/m² Fazendo a substituição dos valores de μ, A, ΔP e coef. Linear temos: Rm = 6006378,93.10-3(20.103)10-3 Rm = 1,07 . 10 m²/s f) Encontre o valor da resistência específica da torta formada (l). Fazendo a substituição dos valores de , ρliq, A, ΔP, s e μ e coef. angular temos: l = 28,93.10-3²5,19.108(20.103)996,95.0,1.10-3 Rm = 1,66 . 1010 m²/s Exercício de sedimentação 7) Os seguintes dados foram obtidos num experimento de sedimentação no Laboratório de Engenharia Química - II pela 4ª série: Ensaio 01-suspensão de CaCO3 a 60g/l Tempo-t(s) 0 72 120 172 219 277 325 370 Altura da suspensão na proveta-Z(cm) 37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1 Ensaio 02-suspensão de CaCO3a 90g/l Tempo-t(s) 0 73 141 230 298 359 430 488 Altura da suspensão na proveta-Z(cm) 37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1 Ensaio 03-suspensão de CaCO3a 120g/l Tempo-t(s) 0 105 182 270 340 424 504 566 Altura da suspensão na proveta-Z(cm) 37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1 Ensaio 04-suspensão de CaCO3 a 150g/l Tempo-t(s) 0 108 190 279 370 454 527 627 Altura da suspensão na proveta-Z(cm) 37,0 33,3 29,6 25,9 22,2 18,5 14,8 11,1 a) Para cada um dos ensaios fazer o diagrama de dispersão Z versus t. Ensaio 1: Ensaio 2: Ensaio 3: Ensaio 4: b)Para cada diagrama de dispersão encontrar a equação da reta que melhor representa os pontos experimentais. Ensaio 1: Logo, a equação da reta é: Z = 37,82 – 0,6821t Ensaio 2: Logo, a equação da reta é: Z = 37,26 – 0,05235t Ensaio 3: Logo, a equação da reta é: Z = 37,77 – 0,04590t Ensaio 4: Logo, a equação da reta é: Z = 37,51 – 0,04213t c) De cada equação obter o coeficiente angular. Este coeficiente é igual à velocidade de sedimentação da suspensão de CaCO3 Ensaio 1 : Coeficiente Angular: -0,06821 Ensaio 2 : Coeficiente Angular: -0,05235 Ensaio 3 : Coeficiente Angular: -0,04590 Ensaio 4 : Coeficiente Angular : -0,04213 d) Para cada velocidade obter área necessária para o projeto do decantador industrial que opera com suspensão de CaCO3 na faixa de concentração de 60 a 150 g/l com vazão de alimentação 100 kg/h através da equação: S=QACA(1C-1CE)u onde: S...Área do decantador industrial QA...Vazão de alimentação do decantador= 100 Kg/l CA...Concentração de alimentação do decantador industrial = 60 g/l C...Cada uma das concentrações dos ensaios 60,90, 120 e 150 g/l CE...Concentração da suspensão concentrada no decantador = 150 g/l u...Cada uma das velocidades de sedimentação determinadas experimentalmente Você deve considerar como resposta do exercício anterior a maior área encontrada nos cálculos realizados!! A maior área encontrada foi a qual se utilizou a velocidade obtida no ensaio 1 (-0,06821). O valor para esta área corresponde a 879,6 m². S=QACA(1C-1CE)u S=100(60)(160-1150)-0,06821 S = "- 879,6" S= 879,6 m²