Transcript
ESTATÍSTICA INTRODUÇÃO A ESTATÍSTICA. A palavra estatística lembra recenseamento. Os censos existem há milhares de anos e constituem um esforço imenso e caro feito pelos governos, com o objetivo de conhecer seus habitantes, sua condição socioeconômica, sua cultura, religião, etc. Portanto, associar estatística a censo é perfeitamente correto do ponto de vista histórico, sendo interessante salientar que as palavras, estatística e estado têm a mesma origem latina: status. O primeiro levantamento estatístico de que se tem conhecimento se deve a Heródoto e se refere a um estudo da riqueza da população do Egito, cuja finalidade era averiguar quais eram os recursos humanos e econômicos disponíveis para a construção das pirâmides, isso no ano de 3050 a. C. No ano de 2238 a. C., o Imperador Chinês Yao ordenou a realização de uma Estatística com fins industriais e comerciais. No ano de 1400 a. C., o famoso faraó egípcio Ramsés II ordenou um levantamento das terras do Egito. Existem ainda, outros casos de Estatísticas no período antigo4 da civilização. Em períodos mais recentes, podemos sintetizar as preocupações com a Estatística em quatro fases:
Como se vê, a Estatística possui sua história na História do homem. Nessa última fase, com a Estatística consolidada, as tabelas tornaram-se mais complexas, surgiram às representações gráficas e o cálculo de probabilidades. Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos
1 Prof. Rodrigues
coletivos e se tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes desse todo. Para tanto, seu ponto de partida são os dados, os quais são expressões numéricas de observações que se fazem de elementos com, pelo menos, uma característica comum.
DEFINIÇÃO A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões (CRESPO, 1995, p. 13). “Está interessada nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises.” (SPIEGEL, 1975, p. 1, grifo nosso).
1.1. MÉTODO Segundo Hegemberg (1976), Método é “um caminho pelo qual se chega a um determinado resultado...”. De acordo com Buhge (1980), Método é “um procedimento regular, explícito e passível de ser repetido para conseguirmos alguma coisa, seja material ou conceitual”. Para Crespo (2004), “Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja”.
1.1.1. Método Experimental O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso exista. (Crespo, 2004, p. 12) Desse modo, a pesquisa experimental consiste em determinar um objeto de estudo, selecionar as variáveis que seriam capazes de influenciá-lo, definir as formas de controle e de observação dos efeitos que a variável produz no objeto.
1.1.2. Método Estatístico Em diversas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar as causas que naquele momento não interessa. Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato irá influenciar seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim deveria existir, no memento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades etc., mas isso tudo é impossível. Nesses casos, recorremos a outro método, embora mais difícil e menos preciso denominado método estatísticos. 2 Prof. Rodrigues
“O método estatístico, diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.” (Crespo, 2004, p. 12). Esse método se fundamenta nos conjuntos de procedimentos apoiados na teoria da amostragem. E, como tal, é indispensável no estudo de certos aspectos da realidade social, onde quer que se pretendam medir o grau de correlação entre dois ou mais fenômenos. Portanto, mediante a utilização de testes estatísticos, torna-se possível determinar, em termos numéricos, a probabilidade de acerto de determinada conclusão, bem como a margem de erro de um valor obtido. Portanto, o método estatístico passa a caracterizar-se por razoável grau de precisão, o que o torna bastante aceito por parte dos pesquisadores com preocupação de ordem quantitativa.
2. FASES DO MÉTODO ESTATÍSTICO Podemos distinguir o método estatístico através das seguintes fases: Coleta de dados – Após cuidadoso planejamento das características mensuráveis do fenômeno que se quer pesquisar dar-se inicio a coleta de dados numéricos necessários a sua descrição. A coleta pode ser direta ou indireta. Direta, quando feita sobre elementos informativos de registro obrigatório, como registros casamentos, óbitos, importações e exportações de mercadorias. Elemento pertinente ao dossiê dos alunos numa escola, ou, ainda, quando os dados são coletados pelo pesquisador através de questionário, como é o caso do senso demográfico. A coleta direta se classifica em: Contínua (registro), quando é feito continuamente, como, registro de nascimento, certidão de óbitos, frequência de alunos às aulas, etc. Periódica, quando feita em intervalos constantes de tempo, como os censos de 10 em 10 anos e as avaliações mensais dos alunos. Ocasional, quando feita extemporaneamente, a fim de atender uma emergência como no caso de uma epidemia, que assola ou dizimam rebanhos inteiros. Indireta, quando é inferida de elementos conhecidos, como pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
3. A NATUREZA ESTATÍSTICA A natureza estatística pode ser dividida em duas, Variáveis qualitativas e Variáveis quantitativas. 3.1. VARIÁVEIS QUALITATIVAS – são aquelas cujas características não possuem valores quantitativos, mas, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais.
1. Variáveis nominais: representam atributos ou qualidades, mas não tem uma relação de ordem entre eles. a) Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio, grupo sanguíneo, raça.
3 Prof. Rodrigues
2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: a) Escolaridade (1º, 2º, 3º graus); b) Estágio da doença (inicial, intermediário, terminal); c) Mês de observação (janeiro, fevereiro,..., dezembro); d) Classe social. 3.2. VARIÁVEIS QANTITATIVAS – Consistem nas características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. 1. Variáveis discretas: São aquelas com características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são resultados de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia, número de aluno. 2. Variáveis contínuas: São aquelas com características mensuráveis que assumem todos os valores fracionários em uma escala contínua (na reta real), para as quais os valores fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade.
EXERCÍCIO RESOLVIDO: Classifique as seguintes variáveis (Qualitativa ou Quantitativa / Nominal, Ordinal, Discreta ou Contínua): a) Número de ações vendidas diariamente na bolsa de valores; R. Quantitativa Discreta b) Religião dos moradores de um bairro; R. Qualitativa Nominal c) Tempo de espera de um cliente em uma fila de caixa de uma agência bancária; R. Quantitativa Contínua d) Grau de instrução dos pais de alunos de uma escola pública; R. Qualitativa Ordinal e) Comprimentos de 1000 parafusos produzidos em uma fábrica; R. Quantitativa Contínua f) Salários anuais de professores de um colégio. R. Quantitativa Discreta
4. USOS DA ESTATÍSTICA As aplicações da estatística se desenvolvem de tal forma que, hoje praticamente todo o campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com o auxilio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação de tamanho da população. Visando reduzir as taxas de casos fatais, os legisladores têm melhores justificativas para as leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de segurança, etc.
4 Prof. Rodrigues
5. CONCEITOS IMPORTANTES EM ESTATÍSTICA 5.1. POPULAÇÃO – Conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. Ex. pessoas, domicilio bancos, Universidades, etc. 5.2. AMOSTRA – É um subconjunto da população, ou seja, é o conjunto de elementos extraídos de um conjunto maior que é a população. Obs.: Para tornar clara a definição das unidades que fazem parte da população em um levantamento de dados é importante identificar 3 elementos: uma característica em comum, a localização temporal e geográfica. 5.3. CENSO – Coleção de dados relativos a todos os elementos da população. 5.4. PARÂMETRO – Medida numérica que descreve uma característica da população.
6. RAMOS DA ESTATÍSTICA 6.1. TEORIA DA PROBABILIDADE – que proporciona uma base racional para lidar com a situações influenciadas por fatores que envolvem o acaso. 6.2. ESTATISTIA INDUTIVA (ou Inferencial) – A Estatística Indutiva utiliza informações incompletas para tomar decisões e tirar conclusões satisfatórias. A base das técnicas de estatística indutiva está no cálculo de probabilidades. As duas técnicas desse tipo de estatística são: estimativa e teste de hipóteses. 6.3. ESTATISTIA DEDUTIVA (ou Descritiva) – É a parte da Estatística que procura descrever e avaliar certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior, e se divide em: Definição do problema; Planejamento; Coleta de dados; Críticas dos dados; Apresentação dos dados em forma de: Tabelas e Gráficos; Descrição ou análise dos dados.
Vale ressaltar que: ‒ COLETA DE DADOS: Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações disponíveis; delineamento da amostra, etc. depois disso tudo, o próximo passo é a COLETA DE DADOS, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudados. A coleta dos dados é direta quando os dados são obtidos diretamente da fonte originária, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. E é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta.
Prof. Rodrigues
5
‒ CRÍTICA DOS DADOS: Objetivando a eliminação de erros capazes de provocar futuros enganos de apresentação e análise, procede-se a uma revisão crítica dos dados, suprimindo os valores estranhos do levantamento. ‒ APRESENTAÇÃO DOS DADOS: Após a crítica dos dados, convém organizá-lo de maneira prática e racional, para melhor entendimento do fenômeno que se está estudando. ‒ DESCRIÇÃO OU ANÁLISE DOS DADOS: “Os dados são o resultado final dos processos de observação e experimentação” (Vairinhos, 1996: p. 21). Na interpretação de dados deveremos produzir um resumo verbal ou numérico ou usar métodos gráficos para descrever as suas principais características. É feita por meio de medidas que representem os dados de forma sumária. São escolhidas de acordo com os objetivos do pesquisador. A seguir, veremos algumas dessas medidas.
7. TÉCNCAS DE AMOSTRAGEM As regras de Amostragem podem ser classificadas em duas categorias gerais: 7.1. PROBABILÍSTICAS – São amostragens em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade de ser sorteado para a amostra. 7.2. NÃO-PROBABILÍSTICAS OU INTENCINADAS – São amostragem em que há uma escolha deliberada dos elementos da amostra.
8. TIPOS DAMOSTRAGEM 8.1. ALEATÓRIA SIMPLES – Conhecida também como amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, desde o início até completo processo de coleta.
9. PROCEDIMENTO 1. Devemos enumerar todos os elementos da população. 2. Devemos efetuar sucessivos sorteios com reposição até completar o tamanho da amostra (n).
Faça você
EXERCÍCIO: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, 9 (nove) números que formarão a amostra.
OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas.
6 Prof. Rodrigues
10. AMOSTRAGEM SISTEMÁTICA Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada, como fichas em um fichário, lista telefônica etc. Requer uma lista dos itens da população, e, assim, padece das mesmas restrições já mencionadas na aleatória ao acaso. Se os itens da lista não se apresentarem numa ordem determinada à amostragem Sistemática pode dar uma amostra realmente aleatória.
11. PROCEDIMENTO Sejam os seguintes elementos: N: tamanho da população; n: tamanho da amostra. O intervalo da amostragem é calculado através da razão utilizando a tabela de números aleatórios, um número
x
N n
, em que α é o inicio mais próximo. Sorteia-se,
entre 1 e α, formando-se a amostra dos elementos
correspondentes ao conjunto de números: x; x ; x 2 ;...; x (n 1) .
Exemplo 01: Seja N = 500, n = 50. Temos,
500 10 . 50
Sorteia-se um número de 1 a 10. Seja 3, (x = 3) o número sorteado. Logo, os elementos numerados por 3; 23; 33; ... , serão os componentes da amostra.
Exemplo 02: Tem-se N = 1200 e n = 600. Vem,
1200 15 . 80
Então, significa que será sorteado, um número de 0 a 15. Seja 11, (x = 11) o número sorteado. Segue que, os números sorteados por 11; 26; 41; 56; 71;... , serão os componentes da amostra.
12. AMOSTRA ESTRATIFICADA No caso de possuir uma população com certa característica heterogênea, na qual podemos distinguir subpopulações mais ou menos homogêneas, denominadas de estratos, podem usar a amostragem estratificada. Estratificar uma população em L subpopulação denominada estratos, tais que:
n1 n2 ... nL n Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada subpopulação. Se as diversas subamostras tiverem tamanhos proporcionais ao respectivo número de elementos nos estratos, teremos a estratificação proporcional.
EXEMPLO: Uma pesquisa de mercado foi especialmente direcionada a consumidores, de determinada marca de
7
Prof. Rodrigues
cerveja. Cada pessoa recebia uma unidade da marca concorrente e da marca de cerveja avaliada e deveria assinalar um valor, numa escala de 1 a 5 (1 significava “não compraria esta marca” e 5 “passarei a comprar somente esta marca”). As respostas são dadas em seguida. EXEMPLO 02: O desempenho dos participantes de uma pesquisa sobre rendimento escolar foi classificado em três categorias: inferior (I), médio (M) e superior (S). As categorias de 27 participantes, alunos da 2a série do ensino fundamental, estão apresentados a seguir:
UNIDADE II – NORMAS PARA CONSTRUÇÃO DE TABELAS
13. TABELAS ESTATÍSTICAS Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas. Definição – Tabela é uma maneira de apresentar de forma resumida um conjunto de dados. 14. CONSTRUÇÃO DE UMA TABELA – Elementos constituintes.
Título => Corpo => Rodapé. 14.1. Título de uma Tabela – Deve conter as informações de maneira clara e completa, respondendo às perguntas: O que?, Quando? E Onde?, Localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração.
Informações Gerais (Preliminares):
As tabelas devem ser delimitadas, no alto e embaixo, por traços horizontais. Esses traços podem ser mais fortes do que os traços feitos no interior da tabela; as tabelas não devem ser delimitadas, à direita e à esquerda, por traços verticais; O cabeçalho deve ser delimitado por traços horizontais; Podem ser feitos traços verticais no interior da tabela, separando as colunas; As tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo quando não se lê o texto em que estão apresentadas; As tabelas devem ser numeradas com numeração progressiva por seções. Então a Tabela 2.3 seria a terceira tabela da segunda seção;
Prof. Rodrigues
8
A finalidade principal das tabelas é apresentar dados numéricos. Então, não devem ser feitas tabelas que exibam mais casas sem números do que casas com números; A tabela deve ser colocada no texto em posição tal que não exija, para leitura, rotação da página; Quando dois ou mais tipos de informação tiverem sido agrupados em um só conjunto, esse conjunto entra na tabela sob a denominação “outros”. 14.2. Corpo da Tabela – É conjunto de linha e colunas que contém informações sobre a variável em estudo. Cabeçalho da coluna – parte superior das colunas na tabela que especifica o conteúdo das colunas. Coluna indicadora – parte da tabela que especifica o conteúdo das linhas. Célula – espaço destinado a inserção de um só dado numérico ou não. Total – deve ser sempre DESTACADO de alguma forma. Laterais da tabela – não deve ser fechadas. Caso as fechem, passa a ser chamada de “QUADRO”. Número – preferencialmente utilizar separador de 1000 (por ex. 1.854.985 ao invés de 1854985).
Obs. As linhas contidas no corpo da tabela, não devem aparecer.
Exemplo de uma tabela.
AQUI DEVE CONSTAR O TÍTULO DA TABELA
NESTE ESPAÇO DEVE CONSTAR O CORPO DA TABELA
NESTE, DEVE CONSTAR O RODAPÉ.
Há ainda a considerar os elementos complementares da tabela, que são: fonte, notas e as chamadas, localizadas, de preferência, no rodapé. Fonte – identifica o responsável (pessoa física ou jurídica), pelos dados numéricos; Notas – é o texto que irá esclarecer o conteúdo, que poderá ser de caráter geral ou específico de uma tabela; Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.
9 Prof. Rodrigues
15. SINAIS CONVENCIONAIS – A substituição de uma informação da tabela poderá ser feita pelos sinais abaixo: (–) dado numérico igual a zero; (...) quando não temos os dados; (?) quando temos dúvidas na informação; (0) quando o valor for muito pequeno. EXEMPLO: Tabela 1 – Produção de Café no Brasil de 1991 a 1995
Alunos 1991 1992 1993 1994 1995
Faça você
Produção (1.000 t) 2.535 2.666 2.122 3.750 2.007 Fonte: IBGE
EXERCICIOS 1. Construa uma tabela contendo os seguintes dados:
Título: Tabela 1. População residente no Brasil, segundo o sexo, de acordo com o censo demográfico de 2000. Cabeçalho das colunas [Células]: Sexo; População; residente; Percentual. Corpo da tabela [Células]: Homens; 83.576.015; 49,2: Mulheres; 86.223.155; 50,8. Total [Células]: Total; 169.799.170; 100,0. Rodapé: Fonte: IBGE (2003).
2. Construa a tabela contendo as seguintes informações:
Título: Tabela 2. Porcentagem de eletrodomésticos mais comuns nas casas dos brasileiros, Brasil - 2000 .
Cabeçalho das colunas [Células]: Eletrodoméstico; Percentual de domicílios. Corpo da tabela [Células]: Geladeira ou freezer; 83,2%: Televisão; 87,0%: Rádio; 87,4%. Rodapé: Fonte: IBGE (2003).
16. SÉRIES ESTATÍSTICAS Introdução Uma vez que os dados foram coletados, muitas vezes o conjunto de valores é extenso e desorganizado, e seu exame requer atenção, pois há o risco de se perder a visão global do fenômeno analisado. Para que isto não ocorra faz-se necessário reunir os valores em tabelas convenientes, facilitando sua compreensão. Definição – Uma Série Estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de classificação: QUANTITATIVA, num sentido mais amplo, SÉRIE é um sequência de números que se refere a certa variável. 10 Prof. Rodrigues
Caso estes números expressem dados estatísticos a série é chamada de Série Estatística. Num sentido mais restrito, diz-se que uma Série Estatística é uma sucessão de dados estatísticos referidos a caracteres quantitativos.
Para diferenciar uma Série Estatística de outra, deve-se levar em consideração três fatores: A ÉPOCA (fator temporal ou cronológico) a que se refere o fenômeno analisado; O LOCAL (fator espacial ou geográfico) onde o fenômeno acontece; O FENÔMENO (espécie do fator ou fator específico) que é descrito.
16.1. Tipos de Séries Estatísticas São quatros tipos de Séries Estatísticas conforme a variação de um dos fatores: 16.1.1. Série Temporal – Esta série é chamada também de cronológica, histórica, evolutiva ou marcha, identifica-se pelo caráter variável do fator cronológico. Assim deve-se ter: VARIÁVEL: a época FIXO: o local e o fenômeno Exemplos de séries temporais: Temperaturas máximas e mínimas diárias em uma cidade, vendas mensais de uma empresa, valores mensais do IPC-A, valores de fechamento diários do IBOVESPA, resultado de um eletroencefalograma, gráfico de controle de um processo produtivo. 16.1.2. Série Geográfica – Também denominadas, Séries territoriais, espaciais ou de localização, a Série Geográfica, apresenta como elemento ou caráter variável o fator local. Assim temos: VARIÁEL: o loca FIXO: a época e o fenômeno 16.1.3. Série Específica – Esta Série recebe também outras denominações como: Série categórica ou Série por categoria. Nesta o caráter variável é o fenômeno. Temos: VARIÁVEL: o fenômeno FIXO: a época e o local
Antes de falarmos da distribuição de frequência, convém abordarmos sobre alguns elementos matemáticos importantes.
17. Proporção, Porcentagem e Razão. Introdução Do ponto de vista estatístico, estas podem ser consideradas como medidas muito simples que permitem estabelecer comparações entre diversos grupos.
11 Prof. Rodrigues
Proporção – Considere um número de empregados que foi distribuído em quatro repartições de certa empresa de acordo com sua função. Estas repartições são mutuamente exclusivas (cada pessoa somente poderá ser alocada em uma única repartição) e exaustivas (todas as pessoas deverão ser alocadas). Em termos simbólicos podemos escrever: N1 = número de pessoas alocadas na repartição 1 N2 = número de pessoas alocadas na repartição 2 N3 = número de pessoas alocadas na repartição 3 N4 = número de pessoas alocadas na repartição 4 N = N1 + N2 + N3 + N4 = número total de empregados. Neste caso, a proporção de empregados pertencentes à primeira repartição é determinada mediante o cálculo do quociente
N1 N
, para as demais repartições segue o mesmo procedimento:
N2 N
,
N3 N
e
N4 N
.
Note que o valor de uma proporção não pode exceder a unidade, e que a soma de todas as proporções será sempre igual à unidade. Assim, N1 N 2 N3 N 4 N 1 . N N N N N
EXEMPLO: Tabela 17.1. Número de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos. EMPREGADO CONSULTOR: TEMPO INTEGRAL MEIO EXPEDIENTE CARTEIRA ASSINADA
ÓRGÃO PÚBLICO 1
ÓRGÃO PÚBLICO 2
580 680 430 1.369 4.810 10.811 TOTAL 5.820 12.860 Fonte: Departamento de Recursos Humanos destes Órgãos Públicos
Não é simples raciocinar em termos absolutos e dizer qual dos dois órgãos públicos conta com maior número de empregados consultores em suas duas modalidades de expedientes porque o número total de empregados difere muito entre si. Por outro lado, a comparação direta pode ser estabelecida rapidamente, se os dados forem expressos em proporções. A proporção de consultores com tempo integral no órgão público 1 é:
N1 580 0,099 0,1 N 5.820 E no órgão público 2, seguindo o mesmo raciocínio temos: N1 5680 0,0528 0,053 N 12.860
Note que, apesar dos números absolutos de consultores serem próximos (580 e 680). Entretanto, o órgão público 2, apresenta proporção inferior de consultores em tempo integral. Analogamente, podemos fazer os cálculos para ambos os órgãos públicos: ÓRGÃO PÚBLICO 1 Consultores com Meio Expediente:
N2 430 0,0738 0,074 N 5.820
12 Prof. Rodrigues
N3
4.810
Carteira assinada: N 5.820 0,8264 0,826 ÓRGÃO PÚBLICO 2 Consultores com Meio Expediente:
N3
N 2 1.369 0,1064 0,106 N 12.860
10.811
Carteira assinada: N 12.860 0,8406 0,841
Assim, temos a tabela seguinte com as proporções obtidas após os cálculos.
Tabela 17.2. Proporção de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos. EMPREGADO CONSULTOR: TEMPO INTEGRAL MEIO EXPEDIENTE CARTEIRA ASSINADA
ÓRGÃO PÚBLICO 1
ÓRGÃO PÚBLICO 2
0,100 0,053 0,074 0,106 0,826 0,841 TOTAL 1 1 Fonte: Departamento de Recursos Humanos destes Órgãos Públicos
17.1. Porcentagem As porcentagens são obtidas a partir do cálculo das proporções, simplesmente multiplicando-se o quociente obtido por 100. A palavra porcentagem significa, por cem. Uma vez que a soma das proporções é igual a 1, a soma das porcentagens é igual a 100, a menos que as categorias não sejam mutuamente exclusivas e exaustivas.
EXEMPLO: Usando os dados do exemplo anterior e multiplicando as proporções por 100 obteremos a seguinte tabela: Tabela 17.3. Percentual de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos. EMPREGADO
ÓRGÃO PÚBLICO 1
ABSOLUTO
RELATIVO (%)
ÓRGÃO PÚBLICO 2
ABSOLUTO
RELATIVO (%)
CONSULTOR: TEMPO INTEGRAL MEIO EXPEDIENTE CARTEIRA ASSINADA
TOTAL
580 10,0 680 5,3 430 7,4 1.369 10,6 4.810 82,6 10.811 84,1 5.820 100 12.860 100 Fonte: Departamento de Recursos Humanos destes Órgãos Públicos
As percentagens, em Estatísticas, têm como principal finalidade estabelecer comparações relativas. Como outro exemplo, as vendas de duas empresas em dois anos consecutivos, foram dispostas na seguinte tabela:
13 Prof. Rodrigues
Tabela 17.4. Faturamento anual das Empresas Alfa e Beta, em 1994 e 1995 dados em números absoluto e relativo (%). EMPRESA
FATURAMENTO (por 1.000 reais)
ALFA BETA
TOTAL
CRESCIMENTO CRESCIMENTO 1994 1995 ABSOLUTO RELATIVO (%) 2.000 3.000 1.000 50 20.000 25.000 5.000 25 5.820 100 12.860 100 Fonte: Departamento de Finanças das Empresas Alfa e Beta
Observa-se, que em valores absoluto a empresa Beta teve um crescimento no faturamento maior que a empresa Alfa. No entanto, na realidade, comparando estes valores em termos percentuais, vemos que a empresa Alfa foi a que apresentou um desempenho superior (crescimento de 50% na empresa Alfa e 25% na empresa Beta).
17.2. Razão A razão entre dois números A e B, com B ≠ 0, é o quociente (divisão)
A B
, ou A : B, ou ainda A/B. Na expressão
acima, A é chamado de antecedente e B consequente.
Exemplos: Exemplo 01. De cada 10 alunos, 2 gosta de matemática. Razão =
2 10
(logo, 2 é o antecedente e 10 o consequente)
Exemplo 02. Um dia de sol, para cada dois de chuva. Razão =
1 2
(logo, 1 é o antecedente e 2 o consequente)
Exemplo 03. Em cada 10 terrenos vendidos, 1 é d o corretor. Razão =
1 10
(logo, 1 é o antecedente e 10 o consequente)
Exemplo 04. Os times A e B jogaram 6 vezes e o time A ganhou todas. Razão =
6 6
(logo, 6 é o antecedente e 6 o consequente)
Exemplo 05. Uma liga de metal é feita de 2 partes de ferro e 3 partes de zinco. Razão =
2 5
(ferro)
Razão =
3 5
(zinco)
Obs. Nos exemplos anteriores, todas as razões têm o antecedente menor que o consequente. Isso porque consideramos a razão tomada da parte para o todo, mas nada impede que seja da forma inversa.
Exemplos: Exemplo 01. João acertou 10 dos 15 problemas que resolveu. Razão =
10 15
(da parte para o todo)
Razão =
15 10
(do todo para a parte)
14 Prof. Rodrigues
Faça você
EXERCÍCIOS E1. Estabeleça a razão em cada caso: a) De cada 30 carros vistoriados, 7 não estão em perfeitas condições. b) De cada 40 camisetas fabricadas, 1 sai com defeito. c) Trabalho 4 horas e descanso 1.
E2. O censo de uma cidade mostrou que 1300 pessoas tinham idade acima de 40 anos, 26 000 estavam entre 20 e 40 anos de idade e 30 000 eram menores de 20 anos. Estabeleça a razão entre: a) Os habitantes com mais de 40 anos e os de 20 a 40 anos; b) Os habitantes com mais de 40 anos e todos os habitantes da cidade; c) Os menores de 20 anos e todos os habitantes da cidade.
UNIDADE IV - DISTRIBUIÇÃO DE FREQUÊNCIA Podemos dizer que Distribuição de Frequências é uma forma de apresentação dos dados “resumida” de maneira, que para um determinado item, indica-se o número de observações efetuadas. E se divide em: 18. Distribuição de Frequência – A distribuição de frequências visa representar um grande conjunto de informações, sem perder as suas principais características. Após a coleta de dados, é necessário sumarizar, sintetizar, representar, expor o fenômeno com a finalidade de se obter as suas características quantitativas, visando à descrição numérica do fenômeno.
19. REPRESENTAÇÃO DA AMOSTRA Podemos observar que a estatística tem objetivo encontrar leis de comportamento para todo o conjunto, por meio da sintetização dos dados numéricos, sob a forma de tablas, gráficos e medidas.
Na distribuição de frequência devem-se considerar os seguintes fatores:
19.1. Frequência: é a quantidade de vezes que um mesmo valor de um dado é repetido;
Prof. Rodrigues
15
19.2. Dados Brutos: são os dados originais que ainda não foram numericamente organizados após a coleta; 19.3. Rol: é a ordenação dos valores obtidos em ordem crescente ou descrente de grandeza numérica ou qualitativa. Classe – são intervalos de variação da variável. E varia de i = 1, 2, 3,..., K. Onde é o número total de casse da distribuição. E se obtém a partir de n que representa o tamanho da população. Determinamos K, como:
5, se n 25 k n , se n 25
K 1 3,32 log(n) [fórmula de Sturges] 19.4. Limites de uma classe (L) – Denomina-se Limite de uma classe, os extremos de cada classe. O menor número é Limite Inferior da classe (Linf), e o maior número o limite superior da classe (Lsup)
19.5. Amplitude total - É a diferença entre os valores extremos de um conjunto, definido em uma ordem de grandeza. A diferença entre o maior e o menor valor de um conjunto define a amplitude total ou o comprimento do conjunto numérico. É determinada pela expressão matemática abaixo: AT L inf L sup
19.6. Ponto médio de uma classe (xi) – é o ponto que divide o intervalo de classe em duas partes iguais. Xi
Linf Lsup 2
19.7. Número ou Intervalo de Classe - O intervalo de classe, na medida do possível, deverá ser regular, isto é, igual em todas as classes o que facilitará os cálculos posteriores. O intervalo de cada classe é a razão da progressão aritmética, sendo definido por: A NC T K
Onde, K representa o número de Classe AT representa a Amplitude Total, e NC o número de intervalo que se quer saber. EXEMPLO: Calcule o a amplitude total, o ponto médio e o número ou intervalo de classe no caso abaixo, seguida construa a tabela de valores.
Estatura dos alunos da turma A em cm. 160 158 161 160 160 166 161 160 161 163 158 165 164 161 164 160 163 162 164 162 16 Prof. Rodrigues
Realizando o ROL 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166
Organizando os dados na tabela e distribuindo em frequência
Tabela 19.1. Estatística Frequência Cm 158 2 160 5 161 4 162 2 163 2 164 3 165 1 166 1 ∑ Cálculo da Amplitude Total: AT = 166 – 158 = 8 Cálculo da Classe de frequência: n = 20 então K = 4,472 Cálculo do comprimento de intervalo: C =
5
AT 8 1,6 2 K 5
Cálculo do ponto médio da frequência: L L sup xi inf 2
xi
158 162 = 160 2
Seguindo o raciocínio temos então, a seguinte tabela, Tabela 19.2 i 1 2 3 4 5
Intervalos de classe 158|---160 160|---162 162|---164 164|---166 166|---168
xi 159 161 163 165 167
20. TTIPOS DE FREQUÊNCIAS 20.1. Frequência Simples ou absoluta (fi) – a frequência simples de uma classe ou de um número individual é o número de observações a essa classe ou a esse valor. São os valores que realmente presentam o número de dados da classe. Expressando matematicamente temos: ∑fi = n Prof. Rodrigues
17
Tabela 20.1. Cálculo de (fi) Intervalos de classe 158|---160 160|---162 162|---164 164|---166 166|---168
I 1 2 3 4 5
xi
fi
159 161 163 165 167
2 9 4 4 1
20.2. Frequência Acumulada (Fi) – é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Temos: Fk = f1 + f2 + f3 + ... + fk ou Fk = ∑ fi (i = 1, 2, 3, ..., k) Assim, no exemplo temos as seguintes frequências acumuladas: Tabela 20.2. Cálculo de (Fi)
i 1 2 3 4 5 Total
Intervalos de classe 158|---160 160|---162 162|---164 164|---166 166|---168
xi
fi
Fi
159 161 163 165 167
2 9 4 4 1 ∑ = 20
2 11 15 ... ...
Para a primeira e segunda classe, temos: F1 = 2 F2 = 2 + 9 = 11 F3 = 11 + 4 = 15 Exercício: Complete o restante da tabela acima. Frequência relativa (fri) – São os valores das razões entre as frequências simples e a frequência total. fri
fi
f
i
18 Prof. Rodrigues
Dessa forma, no exemplo temos para a primeira e segunda classe os seguintes cálculos de frequências relativas:
Tabela 20.3. Cálculo (fri) i 1 2 3 4 5 Total
Intervalos de classe 158|---160 160|---162 162|---164 164|---166 166|---168
xi
fi
fri
Fi
159 161 163 165 167
2 9 4 4 1 ∑ = 20
0,1 0,45 ... ... ...
2 11 15 ... ...
Para a primeira, segunda e terceira classe, temos: fr1
2 0,1 20
fr2
9 0,45 20
Exercício: Complete o restante da tabela acima. Frequência relativa acumulada (Fri) – a Frequência relativa acumulada de uma classe, é a frequência acumulada da classe, dividida pela frequência total da distribuição: Fri
Fi
f
i
Tabela. 20.4. Cálculo do (Fri) Intervalos de classe 158|---160 160|---162 162|---164 164|---166 166|---168
i 1 2 3 4 5 Total
xi
fi
fri
Fi
Fri
159 161 163 165 167
2 9 4 4 1 ∑ = 20
0,1 0,45
2 11 15
0,1 0,55
Para primeira e segunda classe temos: Fr1
Fr 2
F1
f
Fr1 1
F2
f
2 0,1 20
Fr2 2
11 0,55 20
Exercício: Complete o restante da tabela acima.
19 Prof. Rodrigues
Faça você
Exercícios: 1. Dado a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, determine: a. O rol dos dados; b. A distribuição de frequência sem intervalos de classe; c. Frequências relativas; d. Frequências acumuladas; e. Frequência acumulada relativa; f. Amplitude amostral; g. A porcentagem de elementos maiores que 6;
2. Em certa época, os salários mensais dos funcionários de uma rede hoteleira variavam de 1500 a 3250 u.m. Quais seriam os limites de classe se quiséssemos agrupá-los em 6 classes?
3. Os pontos médios de uma distribuição de leituras de temperatura são 16, 25, 34, 43, 52, 61. Determinar os limites de classe e o intervalo de classe.
4. Os seguintes dados referem-se ao número de acidentes diários num grande estacionamento, durante o período de 50 dias:
6 5 3 4 5
9 4 8 7 1
2 4 8 5 2
7 4 4 3 3
0 4 4 3 3
8 2 4 1 0
2 5 7 3 5
5 6 7 8 6
4 3 6 0 6
2 7 5 6 3
Construa a distribuição de frequência simples absoluta e relativa utilizando: a) Dados não agrupados em classes; b) Dados agrupados em classes de amplitude 2.
5. Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em 20 lojas pesquisadas.
Preços ($) 50 51 52 53 54 Total
Número de lojas 2 5 6 6 1 20
20 Prof. Rodrigues
a) Quantas lojas apresentaram um preço de $52,00? b) Construa uma tabela de frequências simples relativas. c) Construa uma distribuição de frequência acumulada relativa "abaixo de" e "acima de". d) Quantas lojas apresentaram um preço de até $51,00 (inclusive)? e) Qual a porcentagem de lojas com preço maior que $52,00? f) Qual a porcentagem de lojas com preço maior do que $51,00 e menor do que $54,00?
6. Com referência a tabela 1 abaixo: a) Quais os limites (inferior e superior) da primeira classe? b) A amplitude dos intervalos de classe é a mesma para todas as classes? c) Qual é o ponto médio da terceira classe? d) Suponha um aluguel mensal de $239,50. Identificar os limites superior e inferior da classe na qual esta observação seria registrada. e) Construir a distribuição de frequência simples relativa. f) Construir a distribuição de frequência acumulada relativa "abaixo de".
Tabela 1. Distribuição de frequência de Diárias para 200 apartamentos Diárias ($) 150 |--- 180 180 |--- 210 210 |--- 240 240 |--- 270 270 |--- 300 300 |--- 330 330 |--- 360 360 |--- 390 390 |--- 420 420 |--- 450 Total
Número de apartamentos 3 8 10 13 33 40 35 30 16 12 200
7. Consideremos os dados da Tabela 2 a seguir. Tabela 2. Preço médio da gasolina comum para áreas selecionadas dos Estados Unidos, março de 1975, em centavos de dólar. Área Atlanta Baltimore Boston Buffalo Chicago Cincinnati Cleveland Dallas Detroit Houston Kansas City
Preço por galão 53.4 55.1 53.9 53.4 54.8 53.3 53.9 49.1 53.7 47.9 49.6
Área Los Angeles Milwaukee Minneapolis New York Philadelphia Pittsburgh St. Louis San Diego San Francisco Seattle Washington
Preço por galão 53.5 50.1 50.3 55.2 52.9 53.4 52.3 55.3 56.8 52.7 55.2 21
Prof. Rodrigues
Vamos supor que quiséssemos organizar aqueles preços em uma distribuição de frequências com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequências fixando o limite inferior da primeira classe em 47.0.
8. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe. 162 164 170 160 166
163 165 157 158 169
148 159 176 163 152
166 175 157 165 170
169 155 157 164 172
154 163 165 178 165
170 171 158 150 162
166 172 158 168 164
a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequências simples absoluta e relativa das alturas dos alunos admitindo que o limite inferior da 1a classe seja 148 cm. d) Determinar os pontos médios das classes.
9. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinados municípios do Estado: 144
152
159
160
160
151
157
146
154
145
141
150
142
146
142
141
141
150
143
158
Construir a tabela de frequências simples e acumuladas (“abaixo de” e “acima de”) tanto absolutas quanto relativas.
10. Complete a distribuição abaixo, determinando as frequências simples:
i 1 2 3 4 5
Xi 2 3 4 5 6
fi ... ... ... ... ... ∑ = 34
Fi 2 9 21 29 34
11. Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 2 5 2 5
5 6 4 2 6
2 3 3 5 2
6 3 1 2 4
4 5 3 5 6
3 1 5 1 1
6 3 4 3 5
2 6 4 6 2
6 3 2 5 4
5 4 6 1 3
Forme uma distribuição de frequência sem intervalo de classe.
Prof. Rodrigues
22
12. Considere as notas de um teste de inteligência aplicado a 100 alunos: 64 73 78 86 76 82 68 71 95 94
78 95 86 84 80 90 96 73 94 75
66 82 78 86 92 83 86 63 88 67
82 89 101 76 102 81 70 105 62 95
74 73 85 76 73 85 72 74 91 108
103 92 98 83 87 72 74 98 83 98
78 85 75 103 70 81 84 78 98 71
86 80 73 86 85 96 99 78 93 92
103 81 90 84 79 81 81 83 83 72
87 90 86 85 93 85 89 96 76 73
Forme uma distribuição de frequência.
13. A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 12 15
12 14 14 13
11 13 10 16
13 14 13 17
14 11 15 14
13 12 11 14
14. Complete a tabela abaixo: i 1 2 3 4 5 Total
CLASSE 0|--- 8 8|--- 16 16|--- 24 24|--- 32 32|--- 40
fi 4 10 14 9 3 ∑ = 40
fri ... ... ... ... ... ∑ = 1,00
Fi ... ... ... ... ...
Fri ... ... ... ... ...
15. Dada a distribuição de frequência: Xi
3
4
5
6
7
8
fi
2
5
12
10
8
3
Determine: a. ∑fi; b. as frequências relativas; c. as frequências acumuladas; d. as frequências relativas acumuladas.
21. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Uma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de frequência e pelo polígono de frequência acumulada.
23 Prof. Rodrigues
21.1. Histograma O histograma é representado por um conjunto de retângulos justaposto, cujas bases se localizam sobre o eixo horizontal, de tal que seus pontos médios coincidam com os pontos médios dos intervalos de classe. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser proporcionais às frequências das classes, sendo a amplitude dos intervalos igual. Exemplo de histograma de uma distribuição qualquer.
21.2. Polígono de Frequência Definição: O polígono de Frequência é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios de classe. Para realmente obtermos um polígono (de linha fechada) devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Exemplo de um Polígono de Frequência de uma distribuição qualquer
Nota: No caso de termo variável essencialmente positiva, cuja distribuição se inicie num valor zero, devemos considerar um intervalo anterior localizado no semieixo negativo. Porém, consideraremos apenas a parte positiva do seguimento que liga o ponto médio desse intervalo com a frequência do intervalo 0 |--- ....
Exemplo:
Prof. Rodrigues
24
21.3. Polígono de Frequência Acumulada Definição: O Polígono de Frequência Acumulada é traçado marcando-se as frequências sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classes. Exemplo de um Polígono de Frequência de uma distribuição qualquer
Uma distribuição de frequência sem intervalo de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um seguimento de reta vertical e de comprimento proporcional à respectiva frequência. Assim, para a distribuição da Tabela abaixo:
Faça você
Exercícios: 1. Considerando a substituições de frequência seguintes, confeccione para cada uma: a. o histograma; I.
i 1 2 3 4 5
b. o polígono de frequência; Peso (kg) 40|--- 44 44|--- 48 48|--- 52 52|--- 56 56|--- 60
fi 2 5 9 6 4 ∑ = 26 III.
Prof. Rodrigues
II.
i 1 2 3 4 5 6 7
c. o polígono de frequência cumulada. i 1 2 3 4 5
Salário (R$) 500|--- 700 700|--- 900 900|--- 1.100 1.100|--- 1.300 1.300|--- 1.500 1.500|--- 1.700 1.700|--- 1.900
Estaturas (cm) 150|--- 156 156|--- 162 162|--- 168 168|--- 174 174|--- 180
fi 8 20 7 5 2 1 1 ∑ = 44
fi 1 5 8 13 3 ∑ = 30
25
UNIDADE V – MEDIDAS DE POSIÇÃO 22. Média Aritmética – é o quociente da divisão das somas dos valores da variável pelo número deles. Existem dois tipos de médias: 23. Média Populacional, representada pela letra grega mi (
) e Média Amostral, representada por X
,eo
símbolo ∑ é o sigma (letra maiúscula grega).
Média populacional:
x N
Média amostral:
X X n
Em que, N representa o número de entradas em uma população. n representa o número de entradas de uma amostra. ∑ representa à somatória ou soma dos valores.
Exemplo 01: (Encontrando a média amostral) Os preços (em reais) para uma amostra de voos de ida e volta partindo de Palmas-TO para Santos-SP são listados a seguir, pesquisados em empresas aéreas diferentes. Qual a média dos preço dos voos.
Exemplo 02: Sabendo que as notas bimestrais de aluno do 1º ano do ensino médio de uma escola da rede pública estadual durante o ano de 2012 foram. 7,3; 7,8; 8,9; 9,3. Qual é a média amostral das notas deste aluno? Solução
X
7,3 7,8 8,9 9,3 8,325 8,3 4
Logo a média foi Prof. Rodrigues
X 8,3 26
Faça você
Exercícios 1. As idades dos funcionários administrativos de uma escola estão listadas a seguir. Qual é a média delas? 34 27 50 45 41 37 24 57 40 38 62 44 39 40 a) Encontre a soma das entradas dos dados. b) Divida a soma pelo número de entradas do contexto c) Interprete os resultados no contexto dos dados.
2. Suponha que o tempo de vida útil de 10 aparelhos de telefone são: 10 29 26 28 15 23 17 25 0 20. Qual a média de vida útil destes aparelhos?
24. Dados agrupados 24.1. Sem intervalo de classe Consideremos a distribuição relativa 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Tabela 24.1. Números De meninos 0 1 2 3 4
fi 2 6 10 12 4 ∑ = 34
Nesse caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que no leva a calcular a média aritmética ponderada.
24.2. Média Aritmética Ponderada Aplicação: O peso das notas de uma escola é 10 para todos os bimestres. Nos quatro bimestres um aluno obteve as seguintes notas: 1º Bim
2º Bim
3º Bim
4º Bim
2,0
3,0
2,0
3,0
8,0
7,0
8,0
6,0
Queremos saber qual foi a média aritmética ponderada do aluno. Para isso dividimos a soma do produto das notas em cada bimestre pelo peso 10. Solução: Mp
2,0 8,0 3,0 7,0 2,0 8,0 3,0 6,0 6,4 10
Logo a Média = 6,4
Prof. Rodrigues
27
Segue outros exemplos Tabela 24.2 Números De meninos 0 1 2 3 4
fi
xifi
2 6 10 12 4 ∑ = 34
0 6 20 ∑ = 78
Solução Temos então, ∑xifi = 78 e ∑fi = 34 Logo, a media ponderada:
X
78 2,29 X 2,3 . Isto é: X 2,3 meninos. 34
Exercício. Complete a tabela acima usando xifi Importante. Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de família tem 2 menino e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos.
Faça você
Exercícios. 1. Complete o esquema para o cálculo da média aritmética da distribuição. xi
1
2
3
4
5
6
fi
2
4
6
8
3
1
Calcule também o valor de, X
X f f
i i
, temos:
i
Tabela 24.3 Números De meninos 1 2 3 4 5 6
Prof. Rodrigues
fi
xifi
2 4 6 8 3 1 ∑=
2 ... ... ... ... ... ∑=
28
2. Complete o esquema para o cálculo da média aritmética da distribuição: CLASSE
30|--- 50|--- 70|--- 90|--- 110|--- 130
fi
2
8
12
10
5
Temos:
i 1 2 3 4 5 6 7
CLASSE 450|--- 550 550|--- 650 650|--- 750 750|--- 850 850|--- 950 950|--- 1.050 1.050|--- 1150
fi 8 10 11 16 13 5 1 ∑ = 64
Como: h = ..... Vem:
X ...
... * ... ... ... ... X 84,3 ...
3. Calcule a média aritmética, pelo processo breve, da distribuição: Custos R$
450|--- 550|--- 650|--- 750|--- 850|--- 950|--- 1.050|--- 1.150
fi
8
10
11
16
13
5
1
4. Complete o esquema para o cálculo da moda da distribuição de frequência: i 1 2 3 4 5 X0 = ...
CLASSE 0|--- 8 8|--- 16 16|--- 24 24|--- 32 32|--- 40
Xi 40 ... ... ... ...
fi ... ... 12 ... ... ∑ = ...
Yi ... ... ... ... 2
Yifi ... ... ... ... ... ... ... ∑ = ...
A classe modal é a de ordem ... Logo:
l = ....
e L = ...
Temos pois: Mo
... ... ... ... isto é: 2 2
Mo = R$ 800
29
24.3. Com intervalo de classe
Nesse caso convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: X
X f f
i i
onde xi é o ponto médio dessa classe.
i
Como exemplo considere a seguinte distribuição:
Tabela 24.4 ESTATURAS (cm) 150|---154 154|---158 158|---162 162|---166 166|---170 170|---174 ∑=
i 1 2 3 4 5 6 Solução: Calculemos o ponto médio: X i X1
fi 4 9 11 8 5 3 ∑ = 40
LInf LSup 2
154 150 304 152 2 2
Seguindo o raciocínio anterior completamos a coluno xi na tabela abaixo: Tabela 24.5 ESTATURAS (cm) 150|---154 154|---158 158|---162 162|---166 166|---170 170|---174
i 1 2 3 4 5 6
fi
xi
xifi
4 9 11 8 5 3 ∑ = 40
152 156 160 164 168 172
608 1.404 1.760 1.312 840 516 ∑ = 6.440
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os pontos xifi. Calculemos xifi:
X1 f1 4 152 608 e X 2 f 2 9 156 1.404 Seguindo o mesmo raciocínio para completar a coluna xifi. Como neste caso temos:
X f
i i 6.440 e
temos então: X
X f f
i i i
f
i 40
6.440 161 X 161 cm 40
30 Prof. Rodrigues
Exercícios Faça você
1. Complete o esquema para o cálculo da média aritmética da distribuição de frequência. Custo (R$)
450|--- 550|--- 650|--- 750|--- 850|--- 950|--- 1.050|---
fi
8
10
11
16
13
xi 500 ... ... ... ... ... ... ∑=
fi 8 10 11 16 13 5 1
5
1.150
1
Temos: Tabela 24.6 i 1 2 3 4 5 6 7
xifi 4.000 ... ... ... ... ... ... ∑=
Calcule também o valor de X
Moda (Mo): Para dados agrupados e não agrupados em classes. É o valor que ocorre com maior frequência dentro de um conjunto ou série de dados, seu valor é denominado valor modal. Baseado nesse contexto: Bimodal = para duas modas Multimodal = para mais de duas modas. Amodal = quando não existe um valor predominante.
24.4. Para dados não agrupados Ex. 01: Temos a série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15. Solução Moda = 10. É portanto, Unimodal ou modal
Ex. 02: Temos a série de dados: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. Solução Temos duas modas. 4 e 7. É, portanto, Bimodal
Ex. 03: Temos a série de dados: 3, 5, 8, 10, 12, 13. Solução Não há moda, portanto Amodal.
31 Prof. Rodrigues
24.5. Para dados agrupados Sem intervalo de classe. Ex. 01: Consideramos distribuição de frequência. Tabela 24.7 Números de alunos 0 1 2 3 4
fi 2 6 10 12 4 ∑ = 34
Solução: Nesta distribuição, a frequência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3. (unimodal)
24.5. Dados agrupados com intervalo de classe A classe que apresenta maior frequência é denominada de classe modal. O método mais simples para calcular a moda consiste em calcular o ponto médio da classe modal. A esse valor chamamos de moda bruta. Temos:
Mo
l L 2
Em que;
l =
limite inferior da classe modal;
L = limite superior da classe modal. 1º Ex. 02: Temos a distribuição de frequência abaixo: Tabela 24.8 ESTATURAS (cm) 150|---154 154|---158 158|---162 162|---166 166|---170 170|---174
i 1 2 3 4 5 6
fi 4 9 11 8 5 3 ∑ = 40
Solução: Temos; Classe modal i = 3
l
= 158
e
L
= 162
logo,
Mo
l L vem, 2
32
Mo
158 162 320 160 Mo 160 2 2
Logo, Mo 160 cm
2º Ex. 03: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela: Tabela 24.9 Veículos negociados (xi) 1 2 3 4
Número de vendedores (fi) 1 3 5 1 ∑ = 10
Solução: Nesta distribuição, a frequência máxima (5) corresponde o valor 3 da variável. Logo: Mo = 3. (unimodal)
Determinar a Moda de uma classe usando a Fórmula de Czuber. Mo l
D1 h D1 D2
Em que,
l =
limite inferior da classe modal;
h L l = Amplitude da classe modal;
D1 f f (anterior ) D2 f f ( posterior )
Sendo:
L = Limite superior da classe modal
l = Limite inferior da classe modal f = frequência simples da classe f (anterior ) = frequência simples da classe anterior à classe modal. f ( posterior ) = frequência simples da classe posterior à classe modal.
33
Ex. 04: A tabela abaixo representa os pontos obtidos por um grupo de 58 alunos matriculados em um determinada disciplina.: Tabela 24.10 ESCORES 35|--- 45 45|--- 65 55|--- 65 65|--- 75 75|--- 85 85|--- 95
ALUNOS (fi) 5 12 18 14 6 3 ∑ = 10
Solução: 1º identifica-se a classe modal (aquela que possuir maior frequência) – CLASSE MODAL (Mo). 2º Utiliza-se a fórmula de Czuber. Então: CLASSE (Mo) = 55|---65 (tem maior frequência, 18,) h L65 55 10 D1 18 12 6 D2 18 14 4
Mo 55
6 60 10 Mo 55 Mo 55 6 61 Mo 61 64 10
Logo, Mo 61
Interpretação: O ponto com maior frequência entre o grupo de 58 alunos foi de 61 pontos.
25. MEDIANA (Md) É definida com o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Ou seja, é o valor numérico que separa o um conjunto de valores em dois conjuntos de mesmo valor ou quantidade de elementos numéricos.
25.1 Para dados não agrupados. Ex. 01: Dada uma série de valores como exemplo. Temos: 5, 13, 10, 2, 18, 15, 6, 16, 9 Solução: 2, 5, 6, 9, 10, 13, 15, 16, 18 Md = 10 (um termo central) Obs. Se a série tiver um número par de termos, a mediana (Md) é obtida calculando o ponto médio entre os dois valores centrais da classe.
34
Ex. 02: Dada uma série de valores como exemplo. Temos: 2, 6, 7, 10, 12, 13, 18, 21 Md
10 12 22 11 Md 11 2 2
Portanto, Md = 11.
Propriedades: P1:
n 1 ,se n for impar. 2
P2:
n n e 1 , se n for par. 2 2
Recorrendo ao exemplo anterior temo: Para n = 9, temos
9 1 10 5 , significa que a mediana é o 5º termo da série, ou seja. 2 2
Md = 10. Para n = 8, temos
8 8 8 2 10 4 e 1 5 , significa que a mediana é média aritmética do 4º e 5º termos 2 2 2 2
da série, isto é. Md =
10 12 22 11 . 2 2
Portanto, Md = 11.
25.2. Para dados Agrupados Neste caso, o processo é semelhante ao anterior Md =
n , através da frequência absoluta acumulada (Fi). 2
Ex. 01: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agencia de automóveis obtendo a seguinte tabela:
Tabela 24.11 Veículos negociados (xi) 1 2 3 4
Número de vendedores (fi) 1 3 5 1 ∑ = 10
Fi 1 4 9 10
Solução: n = 10 (número de termos) POS(Md) =
10 5 Md = 3 2
35
Dados agrupados em distribuição de frequência por classe. Procedimentos: 1º calcula-se a posição da mediana: POS(Md) = n/2 2º pela Fi identifica-se a classe que contém o valor da mediana – CLASSE(Md) 3º utiliza-se a fórmula: Md li m
POS (Mo) Fi ant. hm Fi
Onde: li m = Limite inferior da classe mediana.
n = Tamanho da amostra ou número de elementos. Fi ant = Frequência acumulada anterior à classe mediana.
hm = Amplitude da classe mediana. Fi = Frequência absoluta simples da classe mediana.
Ex.02: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculado em uma determinada disciplina:
Tabela 24.12 Veículos negociados (xi) 1 2 3 4
Número de vendedores (fi) 1 3 5 1 ∑ = 10
Fi 1 4 9 10
Solução: 1º. POS(Md) = 58/2 = 29 2º. CLASSE(MD) = 55|--- 65 29 17
3º. Md 55 18
10 55 6,67 Md 61,67
Interpretação: 50% dos alunos obtive pontuação máxima de 61,67 pontos, ou então, metade dos alunos obteve pontuação maior que 61,67 dos pontos.
36
Faça você
Exercícios:
2.
26. MÉDIA GEOMÉTRICA (MG) Definição.
A média geométrica de um conjunto de N números x1, x2,x3,..., xn, é a raiz de ordem N do produto desse números e, em pode ser determinada através da fórmula seguinte: M G N x1 x2 x3 xn
26.1. Dados agrupados em classe Em dados não agrupados, pode se determinar a Mg pela fórmula: M G N x1 x2 x3 xn
37
26.2. Dados agrupados em classe n
n
n
n
N 1 3 n 2 Sem intervalo de classe, pode ser determinada: M G x1 x 2 x3 x n
Em que,
Xi : valor observado. ni : n° de observações da classe. i = 1, 2, 3, ..., n
Com intervalo de classe, pode ser determinada: M G
N
x1
n1
x2
n2
x3
n3
xn
nn
Em que,
xi : ponto médio.
ni : n° de observações da classe. i = 1, 2, 3, ..., n
Exemplos. Ex. 01: A média geométrica entre 1, 2 e 4: Solução: 3 3 N = 3 MG 1 2 4 8 2 M G 2
Ex. 02: A média geométrica entre os números 2 e 8, é simplesmente a raiz quadrada do produto desses números, isto é, 16 = 4 . Ex 03: Outro problema seria o cálculo de um número x sabendo que sua média geométrica entre ele e 8 resulta em 12. Solução: Essa questão pode ser facilmente resolvida representando a situação por uma equação: Elevando ao quadrado ambos os lados, ficamos com:
2 8 x 12
2 8 x 2 122 8 x 144 x 18
Concluímos então que x = 18
Faça você
Exercícios: 1. Qual é a média geométrica dos números 2, 4, 8, 16 e 32? 2. Calcular a média geométrica dos números 6 e 24. 3. Calcular a média geométrica dos números 6, 4 e 9. 4. Calcular a média geométrica ou proporcional dos seguintes conjuntos de números: (4, 16 e 27) e (2, 4, 27). 5. Calcular a diferença entre a média aritmética e média geométrica dos números 3 e 27. 6. Sendo a média geométrica de dois números igual a 12; determine o segundo sabendo que o primeiro é igual a 36. 7. Calcular a média geométrica dos números 4/7 e 9/28. 38
8. Calcular dois números sabendo que a média aritmética entre eles é 25 e a média geométrica é 15. 9. Encontre dois números sabendo que a média aritmética entre eles é 5 e a geométrica é 4. 10. Numa família há 3 moças e 2 rapazes. A idade das moças são 10, 15 e 20 anos, e a idades dos rapazes são 16 e 25 anos. Calcular a razão entre a média aritmética das idades das moças e a média geométrica das idades dos rapazes.
27. SEPARATRIZES 27.1. Quartis Denominamos quartis os valores de uma série que dividem em quatros partes iguais. Há três quartis: Q1 = 1º quartil, valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. Q2 = 2º quartil, coincide com a mediana (Q2=Md) Q3 = 3º quartis, quartil, valor situado de tal modo que as três quartas partes (75 %) dos termos são menores que ele e uma quarta parte 25 % é maior. Temos:
Q1 l
fi F (ant ) h f
3 fi 4 F (ant ) h e Q3 l f
Onde:
l = limite inferior da classe do quartil considerado.
f = frequência simples absoluta do quartil considerado. F (ant ) = frequência acumulada anterior à classe do quartil considerado.
h = intervalo de classe do quartil considerado.
Exemplo. Dada a tabela abaixo, determine o 1º e 3º quartil: Tabela 26.1 ESTATURAS cm 150|--- 154 154|--- 158 158|--- 162 162|--- 166 166|--- 170 170|--- 174
(fi) 4 6 11 8 5 3 ∑ = 10
Fi 4 13 Q1 24 32 Q3 37 40
Primeiro quartil: fi 40 10 = 4 4
39
Q1 154
10 44 154 24 154 2,66 156,66 9
6
Q1 156,7 cm.
Terceiro quartil: 3 fi 3 40 = 4 30 4
Q3 162
30 244 152 24 162 3 165 8
8
Q3 165 cm.
Faça você
Exercício 1. Calcule o 10º, o 1º, o23º, o 15º, e o 90º percentis da distribuição da tabela abaixo: NOTAS 160|--- 168 168|--- 176 176|--- 184 184|--- 192 192|--- 100
fi 5 12 18 27 8 ∑= 70
2. Num acampamento infantil, foram obtidas as seguintes estruturas:
Estruturas
120|--- 128
128|--- 136
136|--- 144
144|--- 152
152|--- 160
6
12
16
13
7
Frequências
Calcule: a. o primeiro quartil – Q1; b. o terceiro quartil – Q3.
27.2. Decis Os decis se dividem em 10 partis iguais, é de onde vem o nome decis. Di = decil, em que i = 1, 2, 3, ..., 9. Logo, D1 = 10%, D2 = 20% D3 = 30% e assim por diante. Como calcular o decil: 1º Passo: Calcula-se a posição da medida através da fórmula: POS ( Di )
n i ; 10
2º Passo: Pela Fi identifica-se a classe que contém o valor do decil (CLASSE(Di); 3º Passo: Utiliza-se a fórmula: Di li
POS( D1) Fi ant h fi
40
Em que, l i = Limite inferior à classe do decil;
n = tamanho da amostra ou número de elementos; Fi = Frequência acumulada anterior à classe do decil; H = Amplitude da classe do decil; fi = Frequência simples absoluta da classe do decil. Exemplo: A tabela abaixo representa os pontos obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o sexto decil. Pontos 35|--- 45 45|--- 55 55|--- 65 65|--- 75 75|--- 85 85|--- 95
Alunos (fi) 5 12 18 14 6 3 ∑ = 58
Fi 5 17 35 49 55 58
Portanto, temos: 58
1º. POS( D6 ) 10 6 34,8 POS( D6 ) 35 2º. (CLASSE(D6) = 55|--- 65 3º. D6 l 55
34,8 17 10 55 9,89 D6 64,89 18
Interpretação: 60% dos alunos obtiveram ponto inferior a 64,89 ou então, 40% dos alunos obtiveram ponto mínimo de 64,89 pontos.
Faca você
Exercícios 1. Num acampamento infantil, foram obtidas as seguintes estruturas:
Estruturas
120|--- 128
128|--- 136
136|--- 144
144|--- 152
152|--- 160
6
12
16
13
7
Frequências
Calcule: a. o primeiro quartil – D1; b. o terceiro quartil – D4.
41
27.3. Percentis Definição – Denomina-se percentis os noventa e nove valores que separam uma série de 100 partes iguais. Notamos: P1, P2 , P3, , P33, , P99
É notável que: P50 = Md, P25 = Q1 e P75 = Q3. Procedimentos Para calcular o percentil n
i ; 1º. Calcula-se a posição da media: POS( Pi ) 100
2º. Pela Frequência acumulada Simples (Fi), identifica-se a classe que contém o valor do percentil (CLASSE(Pi)); 3º. E, por fim, utiliza-se a fórmula: Pi li
POS( P1) Fi ant h fi
Em que, l i = Limite inferior à classe do percentil;
n = tamanho da amostra ou número de elementos; Fi = Frequência acumulada anterior à classe do percentil; h = Amplitude da classe do percentil; fi = Frequência simples absoluta da classe do percentil. Exemplo: A tabela abaixo representa os pontos obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o percentil de ordem 23. Pontos 35|--- 45 45|--- 55 55|--- 65 65|--- 75 75|--- 85 85|--- 95
Alunos (fi) 5 12 18 14 6 3 ∑ = 58
Fi 5 17 35 49 55 58
Portanto, temos: 1º. POS( P23)
58 23 13,34 POS( P23) 13,34 10
2º. CLASSE(P23) = 45|--- 55 3º. P23 45
13,34 5 10 45 6,95 P23 51,95 12
Interpretação: 23% dos alunos com os menores pontos obtiveram pontuação inferior a 51,95 pontos, ou então, 77% dos alunos obtiveram pontos maior que 51,95 pontos.
42
Faça você
Exercícios: 1. Complete os esquemas para os cálculos do primeiro e do terceiro quartis da distribuição de frequência:
CUSTOS (R$)
450|--- 550|--- 650|--- 750|--- 850|--- 950|--- 1.050|--- 1.150 8
fi
10
11
16
13
5
1
2. Complete o esquema para o cálculo do vigésimo percentil da distribuição: CUSTOS (R$)
450|--- 550|--- 650|--- 750|--- 850|--- 950|--- 1.050|--- 1.150 8
fi
10
11
16
13
5
1
3. Considere o conjunto de dados: a. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
c. 25,6; 48,7; 50,3; 49,5; 48,9
b. 20, 9, 7, 2, 12, 7, 20, 15, 7
d. 15, 18, 2013, 10, 16, 14
I. a média
II. a mediana
III. a moda
4. Os salários-hora de cinco funcionários de uma empresa são: R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine: a. a média dos salários-hora b. o salário-hora mediano
5. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a. a nota média;
c. a nota modal.
b. a nota mediana;
6. Considere a distribuição a baixo: 2
3
4
5
Nº DE ALUNO 1
3
6
10 13
NOTAS
6
7
8
9
10
8
5
3
1
Calcule: a. a nota média;
b. a nota mediana;
c. a nota modal.
43
7. Determine a média aritmética de:
8. Calcule a média aritmética das distribuições de frequência abaixo:
a.
b. NOTAS 0|--- 2 2|--- 4 4|--- 6 6|--- 8 8|--- 10
NOTAS 150|--- 158 158|--- 166 166|--- 174 174|--- 182 182|--- 190
fi 5 8 14 10 7 ∑= 44
fi 5 12 18 27 8 ∑= 70
9. Calcule a mediana e a moda de cada uma das distribuições do exercício 8. 10. Calcule o primeiro e terceiro quartil das distribuições do exercício 8. 11. Calcule o 10º, o 1º, o23º, o 15º, e o 90º percentis da distribuição b do exercício 8.
UNIDADE VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE
28. Dispersão ou Variabilidade As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno e uma medida de posição, a média. Consideraremos quatro medidas de dispersão: 1. Desvio Médio; 2. Variância; 3. Desvio Padrão; 4. Coeficiente de Variação.
28.1. Desvio Médio O desvio médio analisa a média dos desvios em torno da média. 1º Caso: Dados não agrupados. Sejam os elementos X1, X 2 , X 3, , X n de uma amostra, portanto n valores da variável X, com média igual à X . O desvio médio da variável aleatória de X é determinado pela fórmula: DM
Xi X n
Em que, n = número de elementos ou indivíduos do conjunto. Xi = valores 44
Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determine o desviomédio deste conjunto de dados. Solução: Primeiro devemos calcular a média aritmética X dos dados: X
3 7 8 10 11 39 7,8 X 7,8 5 5
Segundo aplicando a fórmula: DM DM
Logo
Xi X n
, para X = 7,8
3 7,8 7 7,8 8 7,8 10 7,8 11 7,8 5
11,2 2,24 DM 2,24 5
DM 2,24 .
Interpretação: Em média, o tempo de serviço deste grupo de funcionários se desvia em 2,24 anos em torno dos 7,8 anos de tempo médio de serviço.
2º Caso: Dados agrupados em uma distribuição de frequência por valores simples. Quando os dados estiverem agrupados numa distribuição de frequência, usaremos o desvio-médio dos valores, X1, X 2 , X 3, , X n , ponderados pelas respectivas frequências absolutas: F1, F2 , F3, , Fn , dividido pelo total da
amostra, como no cálculo da média aritmética. Desse modo temos: DM
X i X Fi n
Exemplo: Num determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. Veículos negociados (Xi) 1 2 3 4 Total
Números de vendedores (fi) 1 3 5 1 ∑ = 10
X i - média
X i - média *F i
1,60 0,60 0,40 1,40 ∑ = 4,00
5 17 35 49 ∑ = 6,80
O cálculo do desvio-médio será: Solução: Mp
11 2 3 3 5 4 1 26 2,6 Mp 2,6 10 10
Logo, neste caso, X Mp 2,6 e DM
6,8 0,68 DM 0,68 10
Portanto, X 2,6 e DM 0,68 Interpretação: Em média, a quantidade de veículos negociados de cada vendedor possuiu uma distância de 0,68 em torno dos 2,6 veículos comercializados em média por veículos.
45
3º Caso: Dados agrupados numa distribuição de frequência de classe. Quando os dados estiverem agrupados numa distribuição de frequência, usaremos o desvio-médio dos pontos médios X1, X 2 , X 3, , X n , ponderados pelas respectivas frequências absolutas: F1, F2 , F3, , Fn , dividido pelo total da amostra, como no cálculo da média aritmética. Desse modo, o cálculo do desvio-médio será semelhante ao cálculo do mesmo no 2º Caso, temos: DM
X i X Fi n
Exemplo: A tabela abaixo representa os pontos obtidos por um grupo de 58 alunos matriculados em determinada disciplina.
Pontos
Alunos (fi)
35|--- 45 45|--- 55 55|--- 65 65|--- 75 75|--- 85 85|--- 95 Total
5 12 18 14 6 3 ∑ = 58
Xi
X i - média
X i - média *F i
40 50 60 70 80 90 -
22 12 2 8 18 28 -
111 147 40 109 107 83 ∑ = 597
O Cálculo do desvio-médio será: Solução: Cálculo da Média: X Mp
5 40 12 50 18 60 14 70 6 80 3 90 3610 62,24 X 62,24 58 58
Cálculo do desvio-médio: DM
597 10,29 DM 10,29 58
Portanto, X 62,24 e DM 10,29
Interpretação: Média, a nota de cada aluno deste grupo teve um distanciamento de 10,29 pontos em torno do desempenho médio deste grupo de alunos, que na disciplina obtiveram média de 62,24 pontos.
28.2. Variância e Desvio padrão ^
A variância mede a dispersão dos valores em torno da média, sendo denotada por Var, s2 ou 2 . Ela é dada pela soma dos quadrados dos desvios em relação à média aritmética dividido por (n – 1) graus de liberdade (g.l.). 1º. Caso: Para dados agrupados: n
n
( Xi ) 1 2 i 1 N N 2
X2 i
X i
N
2
( X i X )2 1 2 i 1 S ou n 1 n 1
X2 i
X i
n
2
46
Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desviopadrão deste conjunto de dados. Solução: Cálculo da média: X
3 7 8 10 11 39 7,8 X 7,8 5 5
Segundo aplicando a fórmula: DM S2
Xi X
, para X = 7,8
n
3 7,82 7 7,82 8 7,82 10 7,82 11 7,82 5 1
38,8 9,7 S 2 9,7 4
Logo S 2 2,24 anos2. Interpretação: Encontramos então uma variância para o tempo de serviço de 9,7 anos2. Para eliminarmos o quando da unidade de medida, extraímos a raiz quadrada do resultado da variância, que chegamos a uma terceira medida de dispersão chamada de DESVIO-PADRÃO.
Temos: 2 Desvio-padrão Populacional: e Desvio-padrão Amostral: S
S2 ,
logo, S 9,7 3,11 . Portanto, o desvio-padrão é S = 3,11.
2º. Caso: Se os valores X1, X2, ..., Xn estiverem associados a distribuição de frequência simples f1, f2, ..., fn, a variância é denotada por:
2
X i 2 fi N
1 N
X i2 fi
X i fi N
2
2 ou S
2 X i X fi
n 1
1 n 1
X2 i
X i
n
2
Exemplo: Num determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo.
Veículos negociados (Xi)
Números de vendedores (fi)
Xi - média2
1 2 3 4 Total
1 3 5 1
5,56 0,36 0,16 1,96 ∑ = 5,04
∑ = 10
Xi - média2 *F i 2,56 1,08 0,80 1,96 ∑ = 6,40
O cálculo do desvio-médio será:
47
Solução (usando a 1ª fórmula): 2 Logo, neste caso, X Mp 2,6 e S
6,4 0,71 S 2 0,71 veículos2 9
S 0,71 veículos2 0,84 veículos.
Solução (usando a 2ª fórmula):
S2
Veículos negociados (Xi)
Números de vendedores (fi)
1 2 3 4 Total
1 3 5 1
X i 2 *F i
X i * fi 1 6 15 4 ∑ = 26
∑ = 10
1 12 45 16 ∑ = 74
1 (26)2 0,71 S 2 0,71 veículos2 S 0,71 veículos2 0,84 veículos. 74 9 10
Interpretação: Portanto, o desvio-padrão do exemplo foi de 0,84 veículos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno da média encontraremos a concentração da maioria dos veículos negociados por vendedor.
3º Caso: dados agrupados em uma distribuição de frequência por classe. Quando os dados estiverem agrupados numa distribuição de frequência, usaremos a variância dos valores X1, X 2 , X 3, , X n , ponderados pelas respectivas frequências absolutas: F1, F2 , F3, , Fn . Desse modo, o cálculo
da variância passar a ser semelhante ao cálculo da mesma no 2º Caso. Temos:
2
X i 2 fi N
1 N
X i2 fi
X i fi N
2
2 ou S
2 X i X fi
n 1
1 n 1
2 X i
X i
n
2
Exemplo: A tabela abaixo representa os pontos obtidos por um grupo de 58 alunos matriculados em determinada disciplina. Determine o cálculo do desvio padrão Pontos 35|--- 45 45|--- 55 55|--- 65 65|--- 75 75|--- 85 85|--- 95 Total
Alunos (fi) 5 12 18 14 6 3 ∑ = 58
Xi
X i - média
X i - média *F i
40 50 60 70 80 90 -
495 150 5 60 315 771 -
2.473 1.798 90 483 1.893 2.312 ∑ = 9.409
Solução (usando a 1ª fórmula): 2 Logo, neste caso, X Mp 62,24 e S
9.409 165,1 S 2 165,1 (pontos)2 57
S 165,1 pontos 2 12,85 pontos.
48
Solução (usando a 2ª fórmula): Pontos
Alunos (fi)
Xi
X i * fi
X i 2 *F i
35|--- 45
5
40
495
2.473
45|--- 55
12
50
150
1.798
55|--- 65
18
60
5
90
65|--- 75
14
70
60
483
75|--- 85
6
80
315
1.893
85|--- 95
3
90
771
2.312
-
-
∑ = 9.409
Total S2
∑ = 58
1 (3.610)2 165,1 S 2 165,1 pontos 2 234.100 51 58
S 165,1 pontos 2 12,85 pontos.
Interpretação: Portanto, o desvio-padrão do exemplo foi de 12,85 pontos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno do ponto médio encontraremos a concentração da maioria dos alunos dentro deste intervalo de pontuação.
28.3. Coeficiente de Variação Comparar a variabilidade de duas séries estatísticas distintas, quando as médias ou suas unidades de escala são diversas, torna-se impossível pela simples verificação do desvio padrão. É necessário mencionar uma dispersão relativa, isto é, uma medida de variabilidade relativa, tomando o desvio padrão em percentagens dos valores médios. Dessa forma o coeficiente de variação é definido por: CV (%)
S 100 ou CV 100 X
Classificação da distribuição quanto a dispersão: Dispersão Baixa (DB): CV 15% Dispersão Média (DM): 15% CV 30% Dispersão Alta (DA): CV 30%
Exemplo: Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio-padrão de R$ 1.500,00 e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então: 1.500 Sexo Masculino: CV (%) 4.000 100 37,5% 1.200 Sexo Feminino: CV (%) 3.000 100 40% Interpretação: Logo, podemos concluir que o salário das mulheres apresenta maior dispersão relativa que a dos homens. Para obtermos o resultado de C.V basta multiplicarmos por 100.
49
Faça você
Exercícios 1. Calcule a amplitude total dos conjuntos de dados: a. 1, 3, 5, 9
b. 20, 14, 15, 21, 22, 20
2. Calcule os desvios padrões dos conjuntos de dados do exercício 1. 3. Calcule a amplitude total das distribuições: a. 2
3
4
5
Nº DE ALUNO 1
3
6
10 13
NOTAS
6
7
8
9
10
8
5
3
1
b. CLASSES
1,5|---
1,6|--4
fi
1,7|---
8
1,8|---
12
1,9|---
15
12
2,0|--8
2,1|---
2,2
4
4. Calcule os desvios padrões das distribuições do exercício 3. 5. Calcule o desvio padrão da distribuição: CLASSES fi
2|---
6|---
5
12
10|---
14|---
18|---
21
15
7
22
6. Um grupo de 100 estudantes tem estatura média de 163,8 cm com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 7. Uma distribuição apresenta as seguintes características: S = 1,5 e CV = 2,9%. Determine a média da distribuição.
Gabarito
62