Preview only show first 10 pages with watermark. For full document please download

Apostila De Estatística - Completa - Pdf (conteúdo)

Apostila explicando o estatística básica, suas aplicações, gráficos dentre outros conteúdos.

   EMBED


Share

Transcript

Introdução à Estatística Breve Histórico ..................................................................................................................... 2 O que é Estatística? ............................................................................................................... 2 Em que consiste a estatística ................................................................................................ 3 Onde é usada a estatística?................................................................................................... 3 Uma ferramenta Multidisciplinar .......................................................................................... 3 Um conhecimento onde a demanda cresce dia após dia. .................................................... 3 Algumas definições básicas ................................................................................................... 3 Natureza dos dados............................................................................................................... 4 Descrição, Exploração e Comparação de dados.................................................................... 5 Tabelas e Gráficos ................................................................................................................. 5 Tabelas ............ ..................................................................................................................... 6 Tabelas de Frequencias Relativas(Fr) .................................................................................... 6 Tabelas de Frequencias Acumuladas(Fac) ............................................................................ 6 Limites de Classes.................................................................................................................. 7 Limites de Classes Inferiores ................................................................................................. 7 Limites de Classes Superiores ............................................................................................... 7 Marcas de Classe ................................................................................................................... 7 Fronteiras de Classe .............................................................................................................. 7 Fronteiras de Classe Superiores ............................................................................................ 7 Fronteiras de Classes Inferiores ............................................................................................ 7 Amplitude das Classes ........................................................................................................... 8 Tipos de Gráficos ................................................................................................................... 8 Gráfico de Barras e Colunas .................................................................................................. 8 Gráfico de Colunas ................................................................................................................ 9 Gráfico de Barras ................................................................................................................... 9 Gráfico de Linha, Curva ou Segmento ................................................................................... 9 Gráfico de Setores(ou “Gráfico de Pizza”) ............................................................................ 9 Pictograma ...... ..................................................................................................................... 10 Cartograma...... ..................................................................................................................... 10 Medidas de Tendência Central ............................................................................................. 12 Média Aritmética................................................................................................................... 12 Mediana. ......... ..................................................................................................................... 13 Moda ............... ..................................................................................................................... 13 Ponto Médio.... ..................................................................................................................... 14 Medidas de variação ............................................................................................................. 14 Amplitude ........ ..................................................................................................................... 14 Desvio-Padrão . ..................................................................................................................... 14 Variância .......... ..................................................................................................................... 14 Bibliografia ...... ..................................................................................................................... 15 1 Breve Histórico A matemática que é considerada “a ciência que une a clareza do raciocínio à síntese da linguagem”, originou de um convívio social, das trocas, da contagem, com caráter prático, utilitário e empírico, e a estatística teve sua origem semelhante. Desde a antiguidade, povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas de riquezas individuais e sociais; distribuíam equitativamente terras ao povo, cobravam impostos, etc. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir às primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século XVIII o estudo de tais fatos foi adquirindo aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) como Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais complexas, surgiram às representações gráficas e o cálculo das probabilidades, e a estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo de observações de partes desse todo (amostras). Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus processos e técnicas, tem contribuído para a organização dos negócios e recursos do mundo moderno. O que é Estatística? É um conjunto de técnicas e métodos de pesquisa que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações. O objetivo principal da estatística é de proporcionar métodos inferenciais, que permitam conclusões que transcedam os dados obtidos inicialmente. Assim a análise e a interpretação dos dados tornam possível o diagnóstico de uma empresa, o conhecimento de seus problemas (condições de funcionamento, produtividade), e a formulação de soluções apropriadas e um planejamento objetivo de ação. 2 Em que consiste a Estatística? *Planejamentos *Coleta de dados *Organização de informações *Análise das informações coletadas *Interpretação e divulgação de forma clara e objetiva. Onde é usada a Estatística? Exemplos: *índices da inflação *índices de emprego e desemprego O Instituto Brasileiro de Geografia e Estatística - IBGE, ao qual a Escola Nacional de Estatísticas está vinculada, é o órgão responsável pela produção das estatísticas oficiais que subsidiam estudos e planejamentos governamentais no país. Na prática, a Estatística pode ser empregada como ferramenta fundamental em várias outras ciências. Uma ferramenta multidisciplinar Os conceitos estatísticos têm exercido profunda influência na maioria dos campos do conhecimento humano. Métodos estatísticos vêm sendo utilizados no aprimoramento de produtos agrícolas, no desenvolvimento de equipamentos espaciais, no controle do tráfego, na previsão de surtos epidêmicos Um conhecimento cuja demanda cresce dia após dia O crescente uso da Estatística vem ao encontro da necessidade de realizar análises e avaliações objetivas, fundamentadas em conhecimentos científicos. As organizações modernas estão se tornando cada vez mais dependentes de dados estatísticos para obter Informações essenciais sobre seus processos de trabalho e principalmente sobre a conjuntura econômica e social. As informações estatísticas são concisas, específicas e eficazes, fornecendo assim subsídios imprescindíveis para as tomadas racionais de decisão. Neste sentido, a Estatística fornece ferramentas importantes para que as empresas e instituições possam definir melhor suas metas, avaliar sua performance, identificar seus pontos fracos e atuar na melhoria contínua de seus processos. Fonte:ENCE,Escola Nacional de Ciências Estatísticas Algumas definições Básicas  Método Científico: É o conjunto de meios dispostos convenientemente dispostos a chegar a um fim que se deseja.  Método Experimental: Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.  Método Estatístico: O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas as causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 3  Estatística: É uma medida numérica que descreve uma característica de uma amostra.  Estatística como Disciplina: É uma coleção de métodos para planejar experimentos, obter dados, organizá-los e deles extrair conclusões. A estatística pode ser classificada em:  Estatística Descritiva: É a coleta, a organização e a descrição dos dados.  Estatística Indutiva ou Inferencial: É a análise e a interpretação dos dados.  População: É uma coleção completa de todos os elementos (valores, pessoas, medidas, etc.) e serem estudados. A população é todo o conjunto de dados.  Amostra: É uma subcoleção de elementos extraídos de uma população.É um subconjunto da população,que terá a condição de representar o conjunto inteiro.Razões para utilizar amostras:a)Quando a população é muito grande;b)Quando se deseja o resultado da pesquisa em curto espaço de tempo;c)Quando se deseja gastar menos.  OBS importante: quando usamos a POPULAÇÃO, temos parâmetros. Quando utilizamos uma AMOSTRA,temos estatística.  Parâmetro: É uma medida numérica que descreve uma característica de uma população.  Censo: É uma coleção de dados relativos a todos os elementos de uma população. É o levantamento total da população .Neste caso,procura-se analisar individualmente cada elemento da população. Natureza de Dados Cada fenômeno corresponde a um número de resultado possível, por exemplo. - Para o fenômeno sexo são dois resultados possíveis: sexo masculino e feminino - Para o fenômeno “número de filhos” há um número de resultados possível expresso através de números naturais. - Para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem ser um número infinito de valores numéricos, dentro de um determinado intervalo. Portanto os dados ou variáveis é convencionalmente o conjunto de resultados possíveis de um fenômeno. Sua natureza é feita a partir de dados que foram colhidos de uma amostra e que podem se classificar em:  Dados Quantitativos: Consistem em números que representam contagem ou medidas (como o próprio nome já nos diz, indicam quantidades)  Dados Discretos: Resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores.  Dados Contínuos: Resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal maneira que não haja interrupções.  Dados Qualitativos (ou dados categóricos, ou atributivos): Indicam qualidade e que podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica, como por exemplo, tipo de sexo, cor da pele, cor do cabelo, dentre outras. 4 Características como sexo, estatura e idade são variáveis. Descrição, Exploração e Comparação de Dados Tabelas e Gráficos As tabelas e os gráficos fornecem de forma rápida e segura informações a respeito de variáveis em estudo. Para se criar um gráfico é preciso primeiro conhecer o tipo de informação, que se deseja transmitir e cada tipo de gráfico é adequado para uma determinada situação, e os gráficos devem ser feitos de maneira adequada para que não haja erros nem na apresentação e nem na interpretação dos dados. Para tornarmos uma representação gráfica possível, deve-se obedecer a alguns requisitos fundamentais, tais como:  Simplicidade  Clareza  Veracidade 5 Tabelas As tabelas servem para organizar os dados de forma que facilite a criação de seus gráficos correspondentes e para isso é necessário que seje realizado alguns cálculos, como por exemplo, calcular a freqüência relativa e freqüência acumulada. Tabela de Frequencias Relativas (Fr) Para calcular esta freqüência é preciso dividir a freqüência de cada classe pela freqüência total. Quando calculadas corretamente a soma das freqüências relativas deve ser 1(ou 100%) ou próximo de 1(ou 100%) em conseqüência de arredondamentos, com o objetivo de utilizar dados em forma de porcentagem. Tabela de Frequencias Acumuladas (Fac) Para calcular esta freqüência eu conservo o primeiro valor da freqüência (fi) na primeira linha e depois para calcular as demais eu pego o valor obtido e somo com a freqüência (fi) abaixo, e assim consequentemente. Quando calculadas corretamente, a última freqüência acumulada (fac) deve ser igual ao total de observações do conjunto,ou seja Fac da última classe=fi. Exemplo 1: Conhecidas as notas de 50 alunos, obtenha a distribuição de frequência tendo 30 como limite inferior da primeira classe e 10 para intervalo de classe(amplitude de classe). 84 74 59 67 65 Notas dos alunos 30 ˫ 39 40 ˫ 49 50 ˫ 59 60 ˫ 69 70 ˫ 79 80 ˫ 89 68 71 80 41 94 33 81 41 78 66 52 91 50 56 48 47 65 53 94 39 73 55 65 35 69 68 57 76 45 89 61 35 85 55 98 73 85 73 64 42 77 88 60 74 54 Frequência(Fi) Frequência Relativa(Fr) Frequência Acumulada(Fac) 4 6 9 11 9 7 4÷50 = 0,08 ou 8% 6÷50 = 0,12 ou 12% 9÷50 = 0,18 ou 18% 11÷50 = 0,22 ou 22% 9÷50 = 0,18 ou 18% 7÷50 = 0,14 ou 14% 4 4+6 = 10 10+9 = 19 19+11 = 30 30+9 = 39 39+7 = 46 6 90 ˫ 99 4 4÷50 = 0,08 ou 8% Total 50 1 ou 100% 46+4 = 50 Exemplo 2: Grau de instrução de uma certa população Grau de Instrução Frequencia(Fi) Frequencia Frequencia Relativa(Fr) Acumulada(Fac) 1º Grau 5 5÷125=0,04 ou 4% 5 2º Grau 20 20÷125=0,16 ou 16% 5+20=25 Superior Incompleto 10 10÷125=0,08 ou 8% 25+10=35 Superior Completo 48 48÷125=0,384 ou 38,4% 35+48=83 Especialização 21 21÷125=0,168 ou 16,8% 83+21=104 Mestrado 13 13÷125=0,104 ou 10,4% 104+13=117 Doutorado 6 6÷125=0,048 ou 4,8% 117+6=123 Pós-Doutorado 2 2÷125=0,016 ou 1,6% 123+2=125 Total 125 1 ou 100% Limites de Classe Limites de Classe Inferiores(LCi): Quando os dados são em intervalos como por exemplo na tabela abaixo, os limites de classe inferiores são os menores valores da classe. Limites de Classe Superiores(LCs): Quando os dados são em intervalos como por exemplo na tabela abaixo, os limites de classe inferiores são os maiores valores da classe. Marcas de Classe(ou Ponto Médio das Classes) As marcas de classe são os pontos médio de cada classe.Em uma classe com intervalos deve-se somar os dados da classe e dividi-los por 2, como mostra na tabela abaixo. Fronteiras de Classe Fronteiras de Classe Superior: Quando em tabelas com variáveis em intervalos, para calcular as fronteiras de classe superior deve-se subtrair o segundo limite de classe inferior com o primeiro limite de classe superior e o resultado obtido dividi-se por 2. Ao chegar num determinado resultado deve-se acrescentar o valor obtido a cada limite de classe superior de cada classe, chegando a fronteira desejada. Exemplo: Na tabela abaixo temos as seguintes classes: 30 ˫ 39 40(segundo limite de classe inferior)-39(primeiro limite de classe superior)=1÷2=0,5 e com o valor obtido(0,5) eu o acrescento em cada 40 ˫ 49 limite de classe superior, obtendo assim as fronteiras de classe superiores. Fronteiras de Classe Inferiores: Quando em tabelas com variáveis em intervalos, para calcular as fronteiras de classe inferiores deve-se subtrair o segundo limite de classe inferior com o primeiro limite de classe superior e o resultado obtido dividi-se por 2. Ao chegar num determinado resultado deve-se subtrair o o valor obtido a cada limite de classe inferior de cada classe, chegando a fronteira desejada. Exemplo: Na tabela abaixo temos as seguintes classes: 30 ˫ 39 40(segundo limite de classe inferior)-39(primeiro limite de classe 7 40 ˫ 49 superior)=1÷2=0,5 e com o valor obtido(0,5) eu o subtraio em cada limite de classe inferior, obtendo assim as fronteiras de classe inferiores. Amplitude das Classes Amplitude de um Intervalo de Classe: Para calcular a amplitude basta subtrair o valor do limite de classe inferior da segunda classe pelo limite de classe inferior da primeira classe, obtendo assim a amplitude. Notas dos Alunos 30 ˫ 39 40 ˫ 49 50 ˫ 59 60 ˫ 69 70 ˫ 79 80 ˫ 89 90 ˫ 99 Total LCi LCs 30 40 50 60 70 80 90 39 49 59 69 79 89 99 Observe a tabela a seguir: Frequencia Frequencia Relativa (Fi) (Fr) 4 4÷50 = 0,08 ou 8% 6 6÷50 = 0,12 ou 12% 9 9÷50 = 0,18 ou 18% 11 11÷50 = 0,22 ou 22% 9 9÷50 = 0,18 ou 18% 7 7÷50 = 0,14 ou 14% 4 4÷50 = 0,08 ou 8% 50 1 ou 100% Marcas de Classe Fronteiras de Classe  30+39=69÷2 = 34,5 40-39=1÷2=0,5 40+49=89÷2 = 44,5 40-39=1÷2=0,5 50+59=109÷2 = 54,5 40-39=1÷2=0,5 60+69=129÷2 = 64,5 40-39=1÷2=0,5 70+79=149÷2 = 74,5 40-39=1÷2=0,5 80+89=169÷2 = 84,5 40-39=1÷2=0,5 90+99=189÷2 = 94,5 40-39=1÷2=0,5 Frequencia Acumulada(Fac) 4 4+6 = 10 10+9 = 19 19+11 = 30 30+9 = 39 39+7 = 46 46+4 = 50 Amplitude de Classe 40-30 = 10 50-40 = 10 60-50 = 10 70-60 = 10 80-70 = 10 90-80 = 10 A=10 FCi FCs 30-0,5=29,5 40-0,5=39,5 50-0,5=49,5 60-0,5=59,5 70-0,5=69,5 80-0,5=79,5 90-0,5=89,5 39+0,5=39,5 49+0,5=49,5 59+0,5=59,5 69+0,5=69,5 79+0,5=79,5 89+0,5=89,5 99+0,5=99,5 Tipos de Gráficos Gráfico de Barras e Colunas Representa os dados através de retângulos, com o intuito de analisar as projeções no período determinado. Sua representação pode ser verticalmente (colunas) ou horizontalmente (barras). No exemplo a seguir mostra-se o consumo de energia elétrica, no decorrer do ano de 2005 de uma família. 8 Gráfico de Colunas Gráfico de Barras Gráfico de Linha, Curva ou Segmentos São ideais para ilustrar tendências em dados que ocorrem ao longo do tempo, e utiliza-se linha poligonal para representar a série estatística. No exemplo abaixo mostra-se o número de locações (DVD) feitas no primeiro semestre de 2008, onde os dados foram expressos através de um gráfico de segmentos. Gráfico de Setores (ou “Gráfico de Pizza”) É usado para expressar as informações de uma circunferência fracionada e é muito usado na demonstração de dados percentuais. 9 O gráfico a seguir mostra a preferência dos clientes de uma locadora quanto ao gênero de filmes locado durante a semana. Pictograma O pictograma fala de maneira simples ao público, pela sua forma sugestiva e atraente. Sua representação gráfica é feita através de figuras. Cartograma Cartograma é uma representação sobre uma carta geográfica (mapa). Distinguimos duas aplicações:  Pontos: De forma proporcional aos dados, representamos através dos pontos os dados absolutos (população); 10  Hachuras (ou cores): De forma proporcional aos dados, representamos através de hachuras ou cores os dados relativos (densidade). 11  Pontos e Hachuras (ou cores): De forma proporcional aos dados, a representação é feita através de pontos e hachuras. Medidas de Tendência Central Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Média Aritmética ( x ) A média aritmética ou simplesmente média de um conjunto de valores é um valor obtido somando-se todos os elementos e dividindo-os pelo número total de elementos. Média ( x ) = x n Onde: ∑ = somatório de um conjunto de valores; X=variável designada para representar valores individuais de dados; N=número de valores de uma determinada amostra. x =representação da média aritmética Exemplo: Relacionam-se a seguir os tempos(em anos) que nos dez primeiros presidentes americanos sobreviveram à posse. Neste caso calcule a média dessa amostra. 10 29 26 28 15 23 17 25 0 20 12 Rol: 0 10 15 17 20 23 25 26 28 29 0  10  15  17  20  23  25  26  28  29 10 193 x = = 19,3 anos(média procurada) 10 x= Mediana A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão dispostos em rol(ordem crescente ou descrescente). A mediana é representada por ~ x (lê-se x til). Obs: Se o número de dados for par, então centrais. ~ x é a média entre os dois valores Exemplo1: Calcule a mediana dos tempos de sobrevivência( em anos após a posse) dos cinco primeiros presidentes americanos. 10 29 26 28 15 Rol: 10 15 26 28 29 ↓ (Mediana) Exemplo2: Os valores a seguir são os pagamentos(em dólares) feitos aos executantes de um concerto de rock. Calcule a mediana. 500 600 800 50.000 1000 500 Rol: 500 500 600 800 1000 50.000 (valores centrais) ~ x= 600  800 2 ~ x = 1400 ~ x = 700Mediana 2 Moda Moda é o conjunto de dados que ocorre com maior freqüência. Quando dois valores ocorrem com a mesma freqüência máxima, cada um deles é a moda e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. Exemplo: Determinar a moda dos seguintes conjuntos de dados. 1-) 5 5 5 3 1 5 1 4 3 5 Mo = {5} 2-) 1 2 2 2 3 4 5 6 6 6 7 9 Mo = {2} Mo = {6}  Conjunto de dados Bimodal 3-) 1 2 3 6 7 8 9 10 Neste caso não existe moda, pois não há repetição de elementos na amostra. 13 Ponto Médio O ponto médio é o valor que está a meio caminho entre o maior valor e o menor valor. Para obtê-lo, somamos os valores extremos e dividimos por dois, como a seguir: maiorvalor  menorvalor PM = 2 Exemplo: Determinar o ponto médio dos tempos de sobrevivência(após a posse) dos 10 primeiros presidentes americanos 10 29 26 28 15 23 17 25 0 20 0  29 PM = = 14,5anos 2 Medidas de Variação Amplitude A amplitude de um conjunto de dados é a diferença entre o maior valor e o menor valor dentre os valores dados. A = maior valor – menor valor Desvio-Padrão O desvio-padrão de um conjunto de valores amostrais é uma medida da variação dos valores em relação a média e possui a seguinte fórmula: DP =  ( x x )² n 1 Onde: x = valores dados na amostra x = média da amostra N = número total de elementos(tamanho total da amostra) Variância A variância é o quadrado do desvio-padrão S²=  ( x  x )² n 1 14 Livro: Introdução à Estatística Autor: Triola, Mario F. Edição: 7ª Ed. Ano: 1999 Livro: Estatística Fácil Autor: Antônio Arnot Crespo Edição: 14ª Ed. Ano: 1996 Conteúdo passado pela Professora Bruna Kitamura Sites http://www.somatematica.com.br/estat/apostila.php http://www.somatematica.com.br/estat/basica/indice.php http://matematiques.sites.uol.com.br/pereirafreitas/1.7.3cartograma.htm http://www.fcav.unesp.br/gener/Aula_Prat_1.ppt#256,1,Estatística Básica http://www.cpc.unc.edu/measure/training/materials/data-qualityportuguese/moduloII_capa.pdf http://epferreiromat.blogspot.com/ 15