Preview only show first 10 pages with watermark. For full document please download

Aulas Particulares De 3º Grau - Estatísitca Descritiva 01 A 04

Aulas de Estatística Descritiva

   EMBED


Share

Transcript

AULAS PARTICULARES DE 3º GRAU ESTATÍSTICA DESCRITIVA AULA 01: ESTATÍSTICA BÁSICA – CONCEITOS INICIAIS 1. Conceitos Iniciais a) Variável é o conjunto de resultados possíveis de um fenômeno. b) População Estatística ou Universo Estatístico é o conjunto de entes portadores de, pelo menos, uma característica comum. c) Amostra é um subconjunto finito de uma população. d) Tabela é um quadro que resume um conjunto de observações. e) Série Estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos, em função da época, do local ou da espécie. f) Dados Absolutos são aqueles resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida. g) Dados Relativos são o resultado de comparações por quociente (razão) que se estabelecem entre dados absolutos, e têm por finalidade realçar ou facilitar as comparações entre as quantidades. Os dados relativos são traduzidos por meio de porcentagens, índices, coeficientes e taxas. Exemplos de Índices: Exemplos de Coeficientes: 2. Gráfico Estatístico É uma outra forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo; os gráficos são mais rápidos à compreensão que as séries. 2.1. Diagramas São gráficos geométricos de, no máximo duas dimensões, e para a sua construção utilizamos o sistema cartesiano. O cartograma é a representação sobre uma carta geográfica. 2.2. Pictograma Constitui um dos processos gráficos que melhor se identifica com o público, pela forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. AULA 02: MEDIDAS DE POSIÇÃO 1. Distribuição de Frequência É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores). Dados brutos relação de elementos que não foram numericamente organizados. Rol é a tabela obtida após a ordenação dos dados (em ordem crescente ou decrescente). Distribuição de freqüências sem intervalos de classe é a simples condensação dos dados conforme as repetições de seus valores. Para um rol de tamanho razoável esta distribuição é inconveniente, uma vez que exige muito espaço. Distribuição de freqüências com intervalos de classe os dados são agrupados em vários intervalos de classe. Acompanhe os exemplos a seguir. "Ordem "41 " "41 "----- "7 " "45 " " "45 "----- "3 " "49 " " "49 "----- "4 " "53 " " "53 "----- "1 " "57 " " "57 "----- "5 " "61 " " "Total "20 " Os elementos de uma distribuição de frequência com intervalos de classe são: a) Classes são os intervalos de variação da variável e é simbolizada por i e o número de classes simbolizada por k. b) Limites de uma classe são os extremos de cada classe. c) Amplitude de classe é a diferença entre o limite superior e o limite inferior da classe. d) Amplitude total da distribuição é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. e) Amplitude total da amostra (Rol) é a diferença entre o maior valor e o menor valor da amostra. Sempre AT > AA f) Ponto médio da classe é o ponto que divide a classe em duas partes iguais.] Para a determinação do número de classes de uma distribuição podemos usar a Regra de Sturges: , Onde i é o número de classe e n é o número total de dados. Uma vez decidido o número de classes, devemos determinar a amplitude do intervalo de classe através da relação: Exemplo Resolvido: As notas obtidas por 30 alunos de uma turma foram 5,0; 3,0; 4,0; 4,0; 6,0; 7,0; 8,0; 6,0; 4,0; 6,0; 3,0; 5,0; 2,0; 2,0; 9,0; 4,0; 5,0; 8,0; 7,0; 5,0; 4,0; 3,0; 3,0; 6,0; 5,0; 4,0; 8,0; 4,0; 3,0; 2,0. a) Complete a tabela abaixo: "i "Notas "xi"fi " "1 "0 "---- 2" " " "2 "2 "---- 4" " " "3 "4 "---- 6" " " "4 "6 "---- 8" " " "5 "8 "---- " " " " "10 " " " "Total " " " " b) Responda: 1. Qual a amplitude amostral? 2. Qual a amplitude da distribuição? 3. Qual o número de classes? 4. Qual o ponto médio da 4ª classe? 5. Qual a amplitude da 3ª classe? 2. Tipos de Frequências a) Frequências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe. Assim: b) Frequências relativas (fri) são os valores das razões entre as freqüências simples e a frequência total. Ou seja: c) Frequência acumulada (Fi) é o total de freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Assim: d) Frequência acumulada relativa é a frequência acumulada da classe, dividida pela frequência total da distribuição. Assim: Exemplo Resolvido: Seja a tabela a seguir que mostra as estaturas de 40 alunos de uma turma. "i "Estaturas "fi "xi "fri"Fi "Fri " " "(cm) " " " " " " "1 "150 "---- "4 " " " " " " "154 " " " " " " "2 "154 "---- "9 " " " " " " "158 " " " " " " "3 "158 "---- "11 " " " " " " "162 " " " " " " "4 "162 "---- "8 " " " " " " "166 " " " " " " "5 "166 "---- "5 " " " " " " "170 " " " " " " "6 "170 "---- "3 " " " " " " "174 " " " " " " "Total "40 " " " " " Após completar a tabela acima, responda: a) Quantos alunos têm estaturas entre 154 cm, inclusive, e 158 cm? b) Qual a porcentagem de alunos cujas estaturas são inferiores a 158 cm? c) Quantos alunos têm estatura abaixo de 162 cm? d) Quantos alunos têm estaturas não inferiores a 158 cm? 3. Medidas de Posição As medidas de posições mais importantes são as medidas de tendência central (ou promédias) e são assim denominadas porque verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais. As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outras medidas de tendência central menos usadas são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. Outras medidas de posição são as separatrizes, que englobam: mediana, quartis, decis e percentis. 3.1. Média Aritmética Para dados não agrupados: Para dados agrupados: Exemplo Resolvido: Encontre a estatura média de bebês conforme a tabela. "Estaturas "fi "xi "Xi.fi " "(cm) " " " " "50 "----- 54"4 " " " "54 "----- 58"9 " " " "58 "----- 62"11 " " " "62 "----- 66"8 " " " "66 "----- 70"5 " " " "70 "----- 74"3 " " " "Total " " " " 3.1.1. Processo Abreviado para se Calcular a Média Aritmética 1º) Abrimos uma coluna para os valores xi. 2º) Escolhemos um dos pontos médios (o de maior frequência) para valor de x0. 3º) Abrimos uma coluna para os valores de yi e escrevemos 0 (zero) na linha correspondente à classe onde se encontra o valor de x0; a sequência -1, -2, -3, ... logo acima do zero e a sequência 1, 2, 3, ... logo abaixo. 4º) Abrimos uma coluna para os valores do produto e, em seguida, somamos algebricamente esses produtos. 5º) Aplicamos a fórmula: Exemplo Resolvido: Dada a distribuição a seguir, calcule a média pelo processo abreviado. "i "Custos (R$)"fi "xi "yi "" "1 "450 "--- "80 " " " " " "550 " " " " " "2 "550 "--- "100 " " " " " "650 " " " " " "3 "650 "--- "110 " " " " " "750 " " " " " "4 "750 "--- "160 " " " " " "850 " " " " " "5 "850 "--- "130 " " " " " "950 " " " " " "6 "950 "--- "60 " " " " " "1050 " " " " " "[pic" " " " " " "] " " " " " " 3.2. Moda É o valor que ocorre com maior frequência em uma série de valores. Para dados não agrupados é o valor que mais se repete. Para dados agrupados: Onde: Li = Limite inferior da classe modal (que ocorre com maior frequência) = Diferença entre a frequência da classe modal e a da anterior. = Diferença entre a frequência da classe modal e a da posterior. h = Amplitude da classe modal. Exemplo Resolvido: A tabela abaixo mostra o tempo de vigência de anestesia. "Tempo (min) "Nº de " " "Pacientes " "28 "----- 33 "3 " "33 "----- 38 "13 " "38 "----- 43 "11 " "43 "----- 48 "10 " "48 "----- 53 "7 " "53 "----- 58 "1 " "Total " " a) Qual a moda? b) Qual a média aritmética? 3.3. Mediana Para dados não agrupados: (i) Número ímpar de termos é o termo central do rol, ou seja: (ii) Número par de termos é o termo de ordem dado pela fórmula: Para dados agrupados: Onde: Li = Limite inferior da classe mediana Fant = Frequência acumulada da classe anterior à classe da mediana fMd = Frequência simples da classe mediana h = Amplitude do intervalo da classe mediana Exemplo Resolvido: Seja a tabela a seguir que mostra as estaturas de 40 alunos de uma turma. "i "Estaturas "fi "xi "Fi " " "(cm) " " " " "1 "150 "---- 154"4 " " " "2 "154 "---- 158"9 " " " "3 "158 "---- 162"11 " " " "4 "162 "---- 166"8 " " " "5 "166 "---- 170"5 " " " "6 "170 "---- 174"3 " " " "Total "40 " " " Determine: a) a média aritmética b) a moda c) a mediana 4. Posição Relativa da Média, Mediana e Moda Numa distribuição em forma de sino, temos: 5. Separatrizes Separatrizes são números pelos quais procuram dividir o rol em partes que possuem alguma característica em comum. As principais separatrizes são: 1ª) Mediana Divide o rol em duas partes, cada qual com 50% dos elementos. 2ª) Quartis Divide o rol em 4 partes, cada qual com 25% dos elementos; ao todo tem-se 3 quartis. 3º) Decis Divide o rol em 10 partes, cada qual com 10% dos elementos; ao todo tem-se 9 decis. 4º) Centis ou Percentis Divide o rol em 100 partes, cada qual com 1% dos elementos; ao todo existem 99 centis Só há interesse o cálculo de separatrizes com dados agrupados e a fórmula geral é: Onde: sep = separatriz (mediana, quartil, decil, centil) Linf = limite inferior da classe Facant = frequência acumulada da classe anterior h = amplitude da classe pos = posição da separatriz e é dada por: "MEDIANA"QUARTIL "DECIL i "CENTIL i " " "i " " " " " " " " Exemplo Resolvido: Dada a distribuição abaixo, calcule: a) 1º Quartil b) 3º Decil c) 78º Centil "i "Tempo de "fi "Fac " " "Anestesia "(Nº de " " " "(min) "Paciente" " " " "s) " " "1 "25 "--- 30"3 " " "2 "30"--- 35 "13 " " "3 "35 "--- 40"11 " " "4 "40 "--- 45"10 " " "5 "50"--- 55 "8 " " "6 "55"--- 60 "1 " " "[pic" " " " "] " " " " AULA 03: MEDIDAS DE DISPERSÃO 1. Introdução Quando se tem um experimento estatístico se faz necessário avaliar o grau de concentração que os dados obtidos possuem em torno da média. Para isso tem-se as Medidas de Dispersão. As medidas de dispersão estudadas são; 1ª) Amplitude Total a) Dados não-agrupados: b) Dados agrupados sem intervalos: c) Dados agrupados com intervalos: 2ª) Desvio Quartil (ou Amplitude Semiquartílica) É baseado nos quartis e sua expressão é dada por: 3ª) Desvio Médio Absoluto É a média aritmética dos valores brutos dos desvios tomados em relação à média (o que é mais comum) ou em relação à mediana. Assim, termos: ou Exemplo Resolvido: Calcular o desvio médio do conjunto de números pela média e pela mediana. 4ª) Variância s² A variância baseia-se nos desvios em torno da média aritmética, ou seja, a variância de uma série é a média aritmética dos quadrados dos desvios calculados em relação à média dos valores que compõem a série. Assim: , que é a variância da população. E no caso de uma amostra pequena (menor que 30), temos a chamada variância da amostra: 5ª) Desvio Padrão s É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. E sua expressão é a raiz quadrada da variância. Assim: Se os dados observados forem uma pequena amostra (menor que 30), então: 3. Método Abreviado para se Calcular o Desvio Padrão 1º) Abrimos uma coluna para os valores xi. 2º) Escolhemos um dos pontos médios (o de maior frequência) para valor de x0. 3º) Abrimos uma coluna para os valores de yi e escrevemos 0 (zero) na linha correspondente à classe onde se encontra o valor de x0; a sequência -1, -2, -3, ... logo acima do zero e a sequência 1, 2, 3, ... logo abaixo. 4º) Abrimos uma coluna para os valores do produto e, em seguida, somamos algebricamente esses produtos. 5º) Abrimos uma coluna para os valores do produto e, em seguida, somamos esses produtos. 6º) Aplicamos a fórmula: ou , caso não queira utilizar a variável auxiliar yi. Exemplo Resolvido: Dada a série , determine: a) a amplitude total. b) o desvio médio em relação à média. c) o desvio médio em relação à mediana. 7. Dada a distribuição abaixo, encontre: a) a média, a mediana e a moda b) os desvios médios em relação á média c) a variância e o desvio padrão d) o 3º quartil, o 5º decil e o 25º percentil "i "Estaturas "fi " " "(cm) "Nº de " " " "Alunos " "1 "150 "--- "30 " " "154 " " "2 "154"--- "90 " " "158 " " "3 "158 "--- "110 " " "162 " " "4 "162 "--- "70 " " "166 " " "5 "166"--- "80 " " "170 " " "6 "170"--- "20 " " "174 " " "[pic" " " "] " " " Exemplo Resolvido: Dada a distribuição abaixo, encontre o desvio padrão pelo processo breve: "i "Estaturas "fi " " "(cm) "Nº de " " " "Alunos " "1 "150 "--- "30 " " "154 " " "2 "154"--- "90 " " "158 " " "3 "158 "--- "110 " " "162 " " "4 "162 "--- "70 " " "166 " " "5 "166"--- "80 " " "170 " " "6 "170"--- "20 " " "174 " " "[pic" " " "] " " " Exemplo Resolvido: Calcule a variância da seguinte amostra de dados {6, 8, 10, 10} . Exemplo Resolvido: Encontre o desvio padrão da seguinte amostra de dados {4, 5, 6, 8, 8, 10, 10, 12}. AULA 04: EXERCÍCIOS PROPOSTOS Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes.As questões de 1 a 3 referem-se a esses ensaios. 1. (ESAF) Assinale a opção que dá o valor médio amostral de X. (A) 140,10 (B) 115,50 (C) 120,00 (D) 140,00 (E) 138,00 2. (ESAF) Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. (A) 138,00 (B) 140,00 (C) 136,67 (D) 139,01 (E) 140,66 3. (ESAF) Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145. (A) 62,5% (B) 70,0% (C) 50,0% (D) 45,0% (E) 53,4% 4. (ESAF) O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequência seguinte: Assinale a opção que corresponde à estimativa do número de indivíduos da população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. (A) 700 (B) 638 (C) 826 (D) 995 (E) 900 5. (FUVEST) Num determinado país a população feminina representa 51% da população total. Sabendo-se que a idade média (média aritmética das idades) da população feminina é de 38 anos e a da masculina é de 36 anos. Qual a idade média da população? (A) 37,02 anos (B) 37,00 anos (C) 37,20 anos (D) 36,60 anos (E) 37,05 anos 6. (UFU) O Departamento de Comércio Exterior do Banco Central possui 30 funcionários com a seguinte distribuição salarial em reais. Quantos funcionários que recebem R$3.600,00 devem ser demitidos para que a mediana desta distribuição de salários seja de R$2.800,00? (A) 8 (B) 11 (C) 9 (D) 10 (E) 7 7. (ESAF) No conjunto de dados A = {3, 5, 7, 9, 11}, o valor do desvio médio é: (A) 2,1 (B) 2,4 (C) 2,6 (D) 2,8 (E) 3,1 8. (ESAF) Entre os funcionários de um órgão do governo, foi retirada uma amostra de dez indivíduos. Os números que representam as ausências ao trabalho registradas para cada um deles, no último ano, são: 0, 0, 0, 2, 2, 2, 4, 4, 6 e 10. Sendo assim, o valor do desvio padrão desta amostra é: (A) (B) (C) (D) 9. (ESAF) Uma empresa que possui 5 máquinas copiadoras registrou em cada uma delas no último mês (em 1000 unidades): 20, 23, 25, 27 e 30 cópias, respectivamente. O valor da variância desta população é: (A) 5 (B) 11,6 (C) 14,5 (D) 25 10. (ESAF) Dada a sequência de valores 4, 4, 2, 7 e 3 assinale a opção que dá o valor da variância. Use o denominador 4 em seus cálculos. (A) 5,5 (B) 4,5 (C) 3,5 (D) 6,0 (E) 16,0 11. (ESAF) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (xi) de ações, tomada numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23 Os valores seguintes foram calculados para a amostra: Assinale a opção que corresponde à mediana e à variância amostral, respectivamente, com aproximação de uma casa decimal. (A) 9,0 e 13,6 (B) 9,5 e 14,0 (C) 8,0 e 15,0 (D) 8,0 e 13,6 (E) 9,0 e 14,0 12. (ESAF) A média e a variância do conjunto dos salários pagos por uma empresa eram, em unidades monetárias, 285.000 e , respectivamente. O valor da variância do conjunto dos salários após o corte de três zeros na moeda é: (A) (B) (C) (D) 13. (ESAF) Do estudo do tempo de permanência no emprego de dois grupos de trabalhadores (A e B), obtiveram-se os seguintes resultados para as médias e e desvios-padrão e . Grupo A: Grupo B: É correto afirmar que: (A) a dispersão relativa no grupo A é maior que no grupo B (B) a média do grupo B é da média do grupo A (C) a dispersão absoluta do grupo A é o dobro da dispersão absoluta do grupo B (D) a dispersão relativa do grupo A é da dispersão relativa do grupo B (E) a média entre os dois grupos é de 180 meses 14. (ESAF) O quadro abaixo apresenta renda mensal per capita das localidades A e B: "Localida"Média "Desvio " "de " "Padrão " "A "50 "10 " "B "75 "15 " Assinale a opção correta: (A) O intervalo semi-interquartílico é dado por (10, 15). (B) A renda da localidade A é mais homogênea que a renda da localidade B. (C) O coeficiente de variação é . (D) A renda da localidade B é mais homogênea que a da localidade A. (E) Os coeficientes de variação de renda nas localidades A e B são iguais. 15. (ESAF) Seja x uma variável aleatória com média aritmética e desvio padrão s = 3. Considere as variáveis e . A única afirmação errada é: (A) As variáveis y e z têm a mesma média aritmética. (B) O desvio padrão de y é 6. (C) as variáveis y e z têm o mesmo desvio padrão. (D) A média de y é 21. (E) As variáveis x e z têm o mesmo coeficiente de variação. 16. (ESAF) Um certo atributo W, medido em unidades apropriadas, tem média amostral 5 e desvio padrão unitário. Assinale a opção que corresponde ao coeficiente de variação, para a mesma amostra, do atributo . (A) 16,7% (B) 20,0% (C) 55,5% (D) 50,8% (E) 70,2% 17. (ESAF) O atributo tem média amostral 20 e variância amostral 2,56. Assinale a opção que corresponde ao coeficiente de variação amostral de x. (A) 12,9% (B) 50,1% (C) 7,7% (D) 31,1% (E) 10,0% 18. (ESAF) Num estudo sobre a distribuição do preço de venda de um produto obteve-se, a partir de uma amostra aleatória de 25 revendedores, a tabela de freqüências seguinte: "Calasse de "mi "fi " "Preços " " " "[5, 9) "7 "3 " "[9, 13) "11 "5 " "[13, 17) "15 "7 " "[17, 21) "19 "6 " "[21, 25) "23 "3 " "[25, 29) "27 "1 " As quantidades mi e fi representam o ponto médio e a frequência de preços i. Sabendo-se que: . Assinale a opção que melhor se aproxima o desvio padrão amostral: (A) (B) 6 (C) (D) 28,91 (E) 8 19. (ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (x) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de x e a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes com os extremos de classes. "Classes "P(%) " "70 ---- 90 "5 " "90 ---- 110 "15 " "110 ---- 130 "40 " "130 ---- 150 "70 " "150 ---- 170 "85 " "170 ---- 190 "95 " "190 ---- 210 "100 " Considere a transformação . Para o atributo z encontrou-se , onde fi é a frequência simples da classe i e zi o ponto médio da classe transformada. Assinale a opção que dá a variância amostral do atributo x. (A) 720,00 (B) 840,20 (C) 900,10 (D) 1200,15 (E) 560,30 20. (ESAF) O atributo do tipo contínuo x, observado como um inteiro, numa mostra de tamanho 100 obtido de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: "Classes "Frequênc" " "ia " "29,5 ---- "4 " "39,5 " " "39,5 ---- "8 " "49,5 " " "49,5 ---- "14 " "59,5 " " "59,5 ---- "20 " "69,5 " " "69,5 ---- "26 " "79,5 " " "79,5 ---- "18 " "89,5 " " "89,5 ---- "10 " "99,5 " " Assinale a opção que corresponde ao desvio absoluto médio do atributo x. (A) 16,0 (B) 17,0 (C) 16,5 (D) 18,1 (E) 13,0 Considere os dados da tabela abaixo: " "Frequências das Notas na " "Classes "Prova de Estatística " "de Notas " " " "Turma 1 "Turma 2 "Turma 3 " "0 "---- 2"20 "10 "5 " "2 "---- 4"40 "15 "10 " "4 "---- 6"30 "50 "70 " "6 "---- 8"6 "15 "10 " "8 "---- "4 "10 "5 " "10 " " " " "Total "100 "100 "100 " 21. (ESAF) Assinale a afirmação correta: (A) Moda (turma 2) < Moda (turma 3) (B) Média (turma 1) > Média (turma 2) (C) Média (turma 2) < Média (turma 3) (D) Mediana (turma 1) < Mediana (turma 2) (E) Mediana (turma 2) > Mediana (turma 3) 22. (ESAF) A distribuição das notas é simétrica em relação à média aritmética: (A) Nas três turmas (B) Nas turmas 1 e 2 (C) Nas turmas 1 e 3 (D) Somente na turma 1 (E) Nas turmas 2 e 3 GABARITO: 01 02 03 04 05 06 07 08 09 10 11 (E) (C) (A) (C) * * (B) (C) (B) (C) (A) 12 13 14 15 16 17 18 19 20 21 22 (D) (D) (E) (E) (A) (C) (A) (B) (E) (D) (E)