Preview only show first 10 pages with watermark. For full document please download

Apostila Estatistica Descritiva

Estatistica Básica

   EMBED


Share

Transcript

APOSTILA DE ESTATÍSTICA DESCRITIVA PROF. EDGAR NASCIMENTO POTENCIAÇÃO E NOTAÇÃO CIENTÍFICA Uma notação científica é escrita da seguinte forma: Em outras palavras escrevemos o valor de uma grandeza como um número compreendido entre um (1) e dez (10), multiplicado pela potência de dez conveniente. Observe que: Se o valor for maior ou igual a dez o expoente do dez é positivo. Ex.: 110 = 1,1 × 102 10 = 1 × 102 5001 = 5,001 × 103 Se o valor for menor de que 1, o expoente do dez é negativo. Ex.: 0,11 = 1,1 × 10-1 0,00852 = 8,52 × 10-3 Se o valor for maior ou igual a um e menor do que 10, então podemos escrever o número sem potência de dez. ORDEM DE GRANDEZA Para encontramos a ordem de grandeza de um número, procedemos da seguinte forma: 1. Escreva os números abaixo em notação científica: 0,00006= 0,00000000078= 1220000000= 6850000000= 23500000000= 0,0000468= 295000000000= 0,000555= 0,00000007245= 2. Resolva as potencias abaixo: a. b. c. d. e. f. 3. Calcule as potencias abaixo: a) b) c) d) e) f) g) h) i) j) k) l) m) n) o) 4. Resolva as expressões abaixo: a. = b. = c. = d. = e. = f. = g. = h. = i. = j. = k. = l. = m. = n. = Radiciação 5. Simplifique os radicais abaixo: 2) Calcule: 6. O valor da expressão é: a)1 b)2 c)3 d)4 e)5 7. O valor de é: a)100 b)150 c)200 d)250 e)300 8. Ao resolver a expressão , encontramos qual valor: 9. Simplifique as expressões a – b ( 0 a- (a2 . b3)2 . (a3 . b2)3 = b-= c-[ ( a3 . b2 )2 ]3= d-= 10. Calcule: a- 3-1 b- (-2)-1 c- -3-1 d- -( -3 )-1 e- f- g- ( 0,25 )-3 h- ( - 0,5 )-3 i- j- k- 11. Calcular o valor das expressões: a- = b- = 12. Classificar em verdadeiro(V) ou falso(F): a- ( 53 )-2 = 5-6 b- 2-4 = 16 c- = 7-3 d- л1 + л –1 = 1 13. Simplificar as expressões: a- = b- = c- = REGRA DE TRÊS 1. Uma molécula de açúcar comum (sacarose) pesa 5,7x10-22g e uma de água, 3,0x10-23g. Num copo de água com 180g, há quantas moléculas? Em uma amostra de 11,4g de açúcar há quantas moléculas? 2. Uma molécula de cloreto de sódio pesa 9,7x10-23g. Quantas moléculas existem em 1KG de sal? 3. Uma bactéria tem massa aproximada de 0,000005 g, e seu comprimento é mais ou menos 1,8x10-4 mm. a) Escreva a massa da bactéria em notação científica. b) Quantas bactérias precisaríamos "enfileirar" para obter 18 cm de comprimento? 4. Dois carros partem juntos, a fim de dar voltas em torno de uma pista de corrida. O carro mais rápido demora 3 minutos para completar uma volta e o outro carro demora 5 minutos. Após quanto tempo os carros irão se encontrar novamente? 5. Um trem, deslocando-se a uma velocidade média de 400 Km/h, faz um determinado percurso em 3 horas. Em quanto tempo faria esse mesmo percurso, se a velocidade utilizada fosse de 480 km/h? 1) Uma equipe de operários, trabalhando 8 horas por dia, realizou determinada obra em 20 dias. Se o número de horas de serviço for reduzido para 5 horas, em que prazo essa equipe fará o mesmo trabalho? 2) Em 8 horas, 20 caminhões descarregam 160m3 de areia. Em 5 horas, quantos caminhões serão necessários para descarregar 125m3? 3) Dois pedreiros levam 9 dias para construir um muro com 2m de altura. Trabalhando 3 pedreiros e aumentando a altura para 4m, qual será o tempo necessário para completar esse muro? 4) Três torneiras enchem uma piscina em 10 horas. Quantas horas levarão 10 torneiras para encher 2 piscinas? 5) Uma equipe composta de 15 homens extrai, em 30 dias, 3,6 toneladas de carvão. Se for aumentada para 20 homens, em quantos dias conseguirão extrair 5,6 toneladas de carvão? 6) Vinte operários, trabalhando 8 horas por dia, gastam 18 dias para construir um muro de 300m. Quanto tempo levará uma turma de 16 operários, trabalhando 9 horas por dia, para construir um muro de 225m? 7) Um caminhoneiro entrega uma carga em um mês, viajando 8 horas por dia, a uma velocidade média de 50 km/h. Quantas horas por dia ele deveria viajar para entregar essa carga em 20 dias, a uma velocidade média de 60 km/h? 8) Um atleta percorre um 20 km em 2h, mantendo o mesmo ritmo, em quanto tempo ele percorrerá 30 km? 9) Quatro trabalhadores constroem uma casa em 8 dias. Em quanto tempo, dois trabalhadores constroem uma casa? 10) Determine o número de tacos de 6cm de largura por 24cm de comprimento necessários para assoalhar uma sala de 3,6m de largura por 4,2cm de comprimento. 11) Uma caixa d'água comporta 360 litros e tem uma torneira que a enche em 15 horas e outra que a esvazia em 20 horas. Abrindo-se as duas torneiras simultaneamente, qual o número de horas necessárias para encher a caixa? 12) Um pátio retangular tem 1,8dam de comprimento e 75dm de largura. Para pavimentar o pátio foram escolhidos ladrilhos quadrados de 25cm de lado. Determine o número de ladrilhos gastos. 13) Determine o número de voltas que uma roda de 50dm de raio precisa dar, para percorrer uma distância de 628km. 14) Uma lavoura de grãos com 100km2 de área plantada fornece uma produção de 5 toneladas por hectare. Sabendo-se as máquinas usadas colheram 2000 toneladas por dia. Qual o tempo gasto para se fazer a colheita desta lavoura? 15) Um trem, com velocidade de 48km/h, gasta 1 hora e 20 minutos para percorrer certa distância. Para fazer o mesmo percurso a 60km/h o trem gastaria 16) Uma turma de operários faz uma obra, cujo coeficiente de dificuldade é 0,2 em 8 dias. Em quantos dias a mesma turma faria outro trabalho, com coeficiente de dificuldade 0,25? 17) Para fazer um determinado serviço, 15 homens gastam 40 dias; para fazer o mesmo serviço em 30 dias quantos novos operários têm de ser contratados 18) Numa viagem de automóvel, uma pessoa gastou 9 horas andando à velocidade de 80km/h. Na volta, quanto tempo irá gastar, se andar com velocidade de 100km/h? 19) As dimensões de um tanque retangular são 1,5m, 2,0m e 3,0m. Com uma torneira de vazão10litros por minuto, qual o menor tempo gasto para enchê-lo? 20) Se a massa de 1000cm3 de certo líquido é 3,75kg, qual a massa de 1,35m3 do mesmo líquido? 21) Trabalhando 10 horas por dia, certa máquina faz um trabalho em 240 dias. Se a mesma máquina funcionar 8 horas por dia, em quanto dias fará o mesmo trabalho? 22) Um edifício projeta uma sombra de 12m no mesmo instante em que um objeto de 2m de altura projeta uma sobra de 80cm. Calcule a altura do edifício 23) Uma torneira enche um tanque de 100 litros em 1 hora, enquanto uma segunda gasta 2 horas. As duas juntas encherão o tanque em quanto tempo? 24) Para vender todos os ingressos de um cinema Aline gasta 15 minutos e Junior 30 minutos. Trabalhando juntos, qual o tempo gasto para venderem os ingressos? 25) Para escrever um texto, usando 54 letras por linha, foram necessárias 15 linhas. Quantas linhas serão necessárias para 30 letras em cada linha? 26) Para fazer uma cerca, são necessários 80 postes distantes entre si de 2,5m. Quantos postes serão necessários, se a distância entre eles for de 2m? 27) Uma vara de 5 m, colocada em posição vertical, projeta no chão uma sombra de 3,5m. Calcule a altura de um prédio que, na mesma hora e o mesmo local, projeta uma sombra de 12,6m. 28) Com 72kg de lã, faz-se uma peça de fazenda de 63m de comprimento. Quantos kg de lã seriam necessários para fazer 84m da mesma fazenda? 29) Numa cidade, há 22410 estrangeiros. A razão entre o número de habitantes é de 18 para 100. Quantos habitantes há na cidade? Objeto da Estatística Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Definições Básicas da Estatística 1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos: Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Fenômenos de multidão: quando as características observadas para a massa não se verificam para o particular. 2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. 3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. 4) AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. 5) PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. 6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra. 7) ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. 8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Variável Qualitativa: Quando seus valores são expressos por atributos Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de variável e se dividem em: Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18, abr = 30, mai = 35 , jun = 36. Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar à temperatura atual do seu corpo. Planejamento para Coleta e Análise de Dados O processo deve incluir: 1. planejamento cuidadoso da coleta de dados; 2. análise de dados para tirar conclusões estatísticas e 3. transição para a resposta ao problema técnico original. Os passos-chave são: 1. Coletar informações anteriores suficientes para traduzir o problema de engenharia em problema específico que possa ser avaliado por métodos estatísticos; 2. Planejar a coleta de dados: A. Determinar o tipo de dados necessários – quantitativos (mais custo, mais útil) e qualitativos; B. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis ao presente problema; C. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações sobre as conseqüências econômicas de uma decisão errada. d. Se o problema exigir a estimação de um parâmetro, definir a precisão necessária para a estimativa; e. Determinar se o erro de medição é grande o suficiente para influenciar o tamanho calculado da amostra ou o método da análise de dados; f. Definir as suposições necessárias para calcular o tamanho da amostra exigido; g. Calcular o tamanho da amostra necessário considerando a precisão desejada do resultado, erro amostral, variabilidade dos dados, erros de medição e outros fatores; h. Definir quaisquer requisitos para preservar a ordem das medições quando o tempo for um parâmetro chave; i.Determinar quaisquer requisitos para coletar dados em grupos definidos – diferentes condições a serem avaliadas; j. Definir o método de análise de dados e quaisquer hipóteses necessárias; k.Definir os requisitos para quaisquer programas de computador que venham a ser necessários. Coletar dados: a. Usar métodos para assegurar que a amostra é selecionada de forma aleatória; b. Registrar os dados e também as condições presentes no momento de cada observação; c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente para se fazer previsões válidas para o futuro. 4. Analisar os dados: a. Selecionar os dados; b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar atitudes corretivas (novas observações); c. Aplicar técnicas estatísticas para avaliar o problema original; d. Determinar se dados e análises adicionais são necessários; e. Realizar "análises de sensibilidade" variando estimativas amostrais importantes e outros fatores na análise e observando o efeito sobre as conclusões finais. 5. Rever as conclusões da análise de dados para determinar se o problema técnico original foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos. 6. Apresentar os resultados: a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do problema original, e não na forma dos índices estatísticos usados na análise; b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos simples no corpo do relatório e colocar as análises complexas em um apêndice. 7. Determinar se as conclusões do problema específico são aplicáveis a outros problemas ou se os dados e cálculos poderiam ser úteis para outros problemas. DISTRIBUIÇÃO DE FREQÜENCIAS É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores. Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: Tem-se um rol após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuição de freqüência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para uma tabela de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Tabela 1 "Dado"Freqüên" "s "cia " "41 "3 " "42 "2 " "43 "1 " "44 "1 " "45 "1 " "46 "2 " "50 "2 " "51 "1 " "52 "1 " "54 "1 " "57 "1 " "58 "2 " "60 "2 " "Tota"20 " "l " " Distribuição de freqüência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Tabela 2 "Classes "Freqüên" " "cias " "41 "7 " ""-------" " "45 " " "45 "3 " ""-------" " "49 " " "49 "4 " ""-------" " "53 " " "53 "1 " ""-------" " "57 " " "57 "5 " ""-------" " "61 " " "Total "20 " 2.1 Elementos de uma Distribuição de Freqüência com classes CLASSE: são os intervalos da variável simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 "------- 53 é a 3ª classe, onde i=3. Para a construção de uma tabela a partir de um dado bruto calcularemos o k através da Regra de Sturges" k=1+3,3logn ou k=(n (para n<100). LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe (Ls). Ex: em 49 "--- 53 Li3= 49 e Ls3= 53. O símbolo "--- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 não pertence à classe 3 e sim a classe 4 representada por 53 "--- 57. AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na tabela anterior a= 53 - 49 = 4. Obs: Na distribuição de freqüência c/ classe o c será igual em todas as classes. Para a construção de uma tabela a partir de um dado bruto temos: a=Ls-Li/K AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o valor máximo e o valor mínimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60 - 41 = 19. PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 "------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja, x3=(Li+Ls)/2. Os dados brutos a seguir apresentam um conjunto de tempos para determinada operação. "5,1 "5,3 "5,3 "5,6 "5,8 "5,9 "6 "6,1 "6,2 "6,2 " "6,3 "6,3 "6,3 "6,4 "6,4 "6,4 "6,5 "6,5 "6,6 "6,7 " "6,7 "6,8 "6,8 "6,9 "6,9 "7 "7,1 "7,1 "7,2 "7,2 " "7,3 "7,4 "7,5 "7,5 "7,6 "7,6 "7,6 "7,7 "7,7 "7,8 " "7,8 "7,9 "7,9 "8 "8 "8,1 "8,2 "8,3 "8,3 "8,4 " "8,5 "8,5 "8,6 "8,7 "8,8 "8,8 "8,9 "9 "9,1 "9,2 " "9,4 "9,4 "9,5 "9,5 "9,6 "9,8 "9,9 "10 "10,2 "10,2 " "10,4 "10,6 "10,8 "10,9 "11,2 "11,5 "11,8 "12,3 "12,7 "14,9 " Regras para a elaboração de uma distribuição de freqüências com classes 1º Organize os dados brutos em um ROL. 2º Calcule a amplitude total At. No nosso exemplo: At =14,9 – 5,1 = 9,8 3º Calcule o número de classes (K), que será calculado usando K = . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é igual a 8,94, aproximadamente, 8. No nosso exemplo: n = 80 dados, então , k=(n = 8,9 . 4º Conhecido o número de classes define-se a amplitude de cada classe: No exemplo, a será igual a: 5º Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com freqüência = 0 (zero). 6º Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23.   "Intervalo de "Freqüência "Freqüência "Freqüência "Freqüência " "Classe "Absoluta "Acumulada "Relativa "Acumulada " " "(fi) "(Fi) "(fr) "(Fr) " "05,10 "---" "13 "13 "16,25 "16,25 " "06,33 " " " " " "06,34 "---" "21 "34 "26,25 "42,50 " "07,57 " " " " " "07,58 "---" "22 "56 "27,50 "70,00 " "08,81 " " " " " "08,82 "---" "15 "71 "18,75 "88,75 " "10,05 " " " " " "10,06 "---" "4 "75 "5,00 "93,75 " "11,29 " " " " " "11,30 "---" "3 "78 "3,75 "97,50 " "12,53 " " " " " "12,54 "---" "1 "79 "1,25 "98,75 " "13,77 " " " " " "13,78 "---" "1 "80 "1,25 "100 " "15,01 " " " " " "Total "80 "- "100 "- " Obs: Agrupar os dados em classes é uma importante ferramenta para resumir grandes massas de dados brutos, no entanto acarreta perda de alguns detalhes. Freqüências simples ou absolutas (fi): são os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados da distribuição. Freqüências relativas (fr): são os valores das razões entre as freqüências absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %). Freqüência simples acumulada de uma classe (Fi): é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqüência relativa acumulada de uma classe (Fr): é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. MEDIDAS DE CENTRALIDADE Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de apenas aquelas que são mais significativas. As mais importante medidas de tendência central são: a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda. Medidas de Centralidade 3.1 Média Aritmética= Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero.  A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida. É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. ...onde xi são os valores da variável e n o número de valores. .Dados não-agrupados: Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a média aritmética simples. Exemplo: Os dados a seguir apresentam leituras de concentração de um processo químico feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentração média de: .= (10+14+13+15+16+18+12) / 7 = 14 Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:.. di = Xi - No exemplo anterior temos sete desvios:.d1 = 10 - 14 = - 4 ,.d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 ,.d4 = 15 - 14 = 1 ,.d5 = 16 - 14 = 2 ,..d6 = 18 - 14 = 4 e.d7 = 12 - 14 = - 2. Propriedades da média 1ª propriedade: A soma algébrica dos desvios em relação à média é nula. No exemplo anterior: d1+d2+d3+d4+d5+d6+d7 = 0 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos: Y = 12+16+15+17+18+20+14 / 7 = 16 ou Y = .+ 2 = 14 +2 = 16 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = 30+42+39+45+48+54+36 / 7 = 42 ou Y = x 3 = 14 x 3 = 42 . Dados agrupados: Sem intervalos de classe Consideremos a distribuição relativa de um canal de comunicação que está sendo monitorado pelo registro do nº de erros em um conjunto de caracteres (string) 1.000 bits. Dados para 34 desses conjuntos são vistos a seguir. "Nº de "Freqüência" "erros "= fi " "0 "2 " "1 "6 " "2 "10 " "3 "12 " "4 "4 " "total "34 " Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: "..x"..f"..xi." "i. "i. "fi . " "0 "2 "0 " "1 "6 "6 " "2 "10 "20 " "3 "12 "36 " "4 "4 "16 " "tot"34 "78 " "al " " " onde 78 / 34 = 2,3 erros Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: .onde Xi é o ponto médio da classe. Exemplo: Calcular o número de molas fora de conformidade, em cada batelada de produção, com um tamanho igual a 40 conforme a tabela abaixo. "Nº de "Freqüência"ponto médio"..xi." "molas "= fi "= xi "fi. " "50 "4 "52 "208 " ""---- " " " " "54 " " " " "54 "9 "56 "504 " ""---- " " " " "58 " " " " "58 "11 "60 "660 " ""---- " " " " "62 " " " " "62 "8 "64 "512 " ""---- " " " " "66 " " " " "66 "5 "68 "340 " ""---- " " " " "70 " " " " "70 "3 "72 "216 " ""---- " " " " "74 " " " " "Total "40 " "2.440" Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 molas MODA É o valor que ocorre com maior freqüência em uma série de valores. Mo é o símbolo da moda. Desse modo, a força modal de remoção para um conector é a força mais comum, isto é, a força de remoção medida em um teste de laboratório para um conector. . A Moda quando os dados não estão agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. .A Moda quando os dados estão agrupados a) Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Qual a temperatura mais comum medida no mês abaixo: "Temperatu"Freqüên" "ras "cia " "0º C "3 " "1º C "9 " "2º C "12 " "3º C "6 " Resp: 2º C é a temperatura modal, pois é a de maior freqüência. . b) Com intervalos de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. "Mo = ( Li+ " "Ls) / 2 " onde Li = limite inferior da classe modal e Ls= limite superior da classe modal. Exemplo: Calcule a resistência modal dos 33 resistores conforme a tabela abaixo. "Resistência (em"Freqüên" "ohms) "cia " "54 "---- 58 "9 " "58 "---- 62 "11 " "62 "---- 66 "8 " "66 "---- 70 "5 " Resp: a classe modal é 58"--- 62, pois é a de maior freqüência. Li=58 e Ls=62 Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real da moda). Método mais elaborado pela fórmula de CZUBER: Mo = Li + ((fmo - fant) / ( 2fmo – (fant + fpost))) x c Li= limite inferior da classe modal fmo = freqüência da classe modal fant =freqüência da classe anterior à da classe modal fpost =freqüência da classe posterior à da classe modal c = amplitude da classe modal Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de posição que possui a maior estabilidade. MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Símbolo da mediana: Md .A mediana em dados não-agrupados Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. Método prático para o cálculo da Mediana Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula: "O elemento mediano " "será:..EMd = n + 1 / 2 " Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana. A mediana será o 5º elemento, ou seja, Md = 2 Se a série dada tiver número par de termos: "O elemento mediano " "será:..EMd = n / 2 " Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a fórmula ficará: :..EMd = 10 / 2 = 5 Será na realidade (5º termo + 6º termo) / 2 A mediana será = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º termos da série. Notas: Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. . A mediana em dados agrupados a) Sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Exemplo conforme tabela abaixo: "Variáve"Freqüênci"Freqüência " "l xi "a fi "acumulada " "0 "2 "2 " "1 "6 "8 " "2 "9 "17 " "3 "13 "30 " "4 "5 "35 " "Total "35 "- " Quando o somatório das freqüencias for ímpar o valor mediano será o termo de ordem dado pela fórmula :. " " Como o somatório das freqüencias = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3.. Quando o somatório das freqüências for par o valor mediano será o termo de ordem dado pela fórmula:. " " Exemplo - Calcule Mediana da tabela abaixo: "Variáve"Freqüênci"Freqüência " "l xi "a fi "acumulada " "12 "1 "1 " "14 "2 "3 " "15 "1 "4 " "16 "2 "6 " "17 "1 "7 " "20 "1 "8 " "Total "8 "- " Aplicando a fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1º) Determinamos as freqüências acumuladas; 2º) Calculamos ; 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à . Tal classe será a classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula:..Li + [(EMd - Fant) x c] / fMd Li = é o limite inferior da classe mediana. Fant = é a freqüência acumulada da classe anterior à classe mediana. fMd= é a freqüência simples da classe mediana. c = é a amplitude do intervalo da classe mediana. Exemplo: "classe"Freqüência"Freqüência " "s "= fi "acumulada " "50 "4 "4 " ""---- " " " "54 " " " "54 "9 "13 " ""---- " " " "58 " " " "58 "11 "24 " ""---- " " " "62 " " " "62 "8 "32 " ""---- " " " "66 " " " "66 "5 "37 " ""---- " " " "70 " " " "70 "3 "40 " ""---- " " " "74 " " " "Total "40 "- " = 40 / 2 =.20.. logo.a classe mediana será 58 "---- 62 Li = 58....... Fant = 13........... fMd = 11........... c = 4 Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição. Emprego da Mediana Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. Quando há valores extremos que afetam de maneira acentuada a média aritmética. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE Veremos agora como medir a variabilidade presente num conjunto de dados. Um aspecto importante no estudo descritivo de um conjunto de dados é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. DESVIO PADRÃO ( S ) É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S. Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão.  O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.  A fórmula acima é empregada quando tratamos de uma população de dados não- agrupados. Exemplo: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 , 5 " Xi" " " " " " [pic" " " " "] " " " "- 4 "- 0,2"- 3,8 "14,44 " "- 3 "- 0,2"- 2,8 "7,84 " "- 2 "- 0,2"- 1,8 "3,24 " " 3 "- 0,2" 3,2 "10,24 " " 5 "- 0,2" 5,2 "27,04 " "Tota"- "- "62,8 " "l " " " " Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 é o desvio padrão = 3,54 Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio padrão ficará: ou Exemplo: Calcule o desvio padrão populacional da tabela abaixo: " Xi" f"Xi ." " " " . f i" " "i "f i "[pi" " " " " " " "c] " " " " " " " " " " " " "0 "2 "0 "2,1"-2,1 "4,41 "8,82 " "1 "6 "6 "2,1"-1,1 "1,21 "7,26 " "2 "12 "24 "2,1"-0,1 "0,01 "0,12 " "3 "7 "21 "2,1"0,9 "0,81 "5,67 " "4 "3 "12 "2,1"1,9 "3,61 "10,83 " " Tot"30 "63 "- "- "- "32,70 " "al " " " " " " " Sabemos que ( fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 é o desvio padrão = 1,044 Se considerarmos os dados como sendo de uma amostra o desvio padrão seria a raiz quadrada de 32,7 / (30 -1) = 1,062 Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior.   VARIÂNCIA ( S2 ) Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. SÉRIES ESTATÍSTICAS TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar: Um traço horizontal ( - ) quando o valor é zero; Três pontos ( ... ) quando não temos os dados; Zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; Um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 "PERÍODO " " " "UNIDADES VENDIDAS *" "JAN/2002 "2 0 " "FEV/2002 "1 0 " "TOTAL "3 0 " * Em mil unidades .b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 "FILIAIS " " " "UNIDADES VENDIDAS *" "São Paulo "1 3 " "Rio de Janeiro "1 7 " "TOTAL "3 0 " * Em mil unidades c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 "MARCA " " " "UNIDADES VENDIDAS *" "FIAT "1 8 " "GM "1 2 " "TOTAL "3 0 " * Em mil unidades Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 "FILIAIS "Janeiro/2002 "Fevereiro/2002" "São Paulo "1 0 "3 " "Rio de Janeiro "1 2 "5 " "TOTAL "2 2 "8 " * Em mil unidades Obs: as séries heterógradas serão estudas no capítulo 2 (distribuição de freqüências). ----------------------- S2 =