Preview only show first 10 pages with watermark. For full document please download

Apostila Estatistica

Apostila de Estatística Básica

   EMBED


Share

Transcript

Faculdades Integradas Maria Imaculada Unidade Mogi Guaçu Estatística Básica Márcio Lúcio Dias Pereira Novembro/2009 Estatística Básica SUMÁRIO CAPÍTULO 1 – A NATUREZA DA ESTATÍSTICA 1.1. Métodos científicos ............................................................................................ 03 1.2. A Estatística......................................................................................................... 03 1.3. Fases do método estatístico............................................................................... 04 CAPÍTULO 2 – POPULAÇÃO E AMOSTRA 2.1. Variáveis estatísticas........................................................................................... 05 2.2. População e amostra .......................................................................................... 05 2.3. Amostragem ....................................................................................................... 06 CAPÍTULO 3 – TABELAS 3.1. Elementos de uma tabela................................................................................... 07 CAPÍTULO 4 – SÉRIES ESTATÍSTICAS 4.1. Tipos de séries estatísticas ................................................................................. 09 CAPÍTULO 5 – DISTRIBUIÇÃO DE FREQÜÊNCIAS 5.1. Tabela primitiva .................................................................................................. 11 5.2. Rol ....................................................................................................................... 12 5.3. Distribuição de freqüência ................................................................................. 12 5.4. Elementos de uma distribuição de freqüência................................................... 13 5.5. Tipos de freqüências........................................................................................... 17 CAPÍTULO 6 – GRÁFICOS ESTATÍSTICOS 6.1. Principais tipos de gráficos ................................................................................. 19 6.2. Diagramas ........................................................................................................... 21 CAPÍTULO 7 – MEDIDAS DE TENDÊNCIA CENTRAL 7.1. Média aritmética ................................................................................................ 25 7.2. Moda................................................................................................................... 26 7.3. Mediana..............................................................................................................28 CAPÍTULO 8 – MEDIDAS DE DISPERSÃO 8.1. Amplitude total...................................................................................................32 8.2. Variância ............................................................................................................. 33 8.3. Desvio padrão ..................................................................................................... 36 8.4. Coeficiente de Variação...................................................................................... 38 CAPÍTULO 9 – PROBABILIDADE 9.1. Conceito de probabilidade ................................................................................. 41 9.2. Probabilidade condicional .................................................................................. 45 9.3. Teorema da multiplicação .................................................................................. 48 9.4. Teorema da soma ............................................................................................... 50 CAPÍTULO 10 – DISTRIBUIÇÃO DE PROBABILIDADE 10.1. Variável aleatória................................................................................................ 53 10.2. Função de probabilidade .................................................................................... 53 10.3. Distribuição de probabilidade ............................................................................ 54 10.4. Binômio de Newton............................................................................................ 55 10.5. Distribuição binomial.......................................................................................... 57 2 Estatística Básica CAPÍTULO 1 A NATUREZA DA ESTATÍSTICA O domínio da Estatística e suas aplicações em várias áreas do conhecimento humano têm sido cada vez mais reconhecidos pela sua importância. A sua utilização prática no dia-a-dia de quem trabalha nas áreas da saúde, educação, comércio, indústria, serviços e sistema financeiro e outros segmentos mercadológicos, mostra a necessidade desse conhecimento. Além disso, podemos considerar a grande importância da Estatística para o meio acadêmico, onde podermos perceber que o interesse dos alunos e professores pela aprendizagem das técnicas estatísticas está relacionada a literatura especializada. Isso pode ser facilmente observado nos projetos de iniciação científica, trabalhos de pesquisa, teses e monografias. Podemos afirmar que a condução e a avaliação de uma pesquisa dependem, em grande parte do conhecimento do pesquisador sobre estatística, principalmente no que se refere às limitações das técnicas utilizadas. A Estatística trabalha com métodos científicos para coleta, organização, resumo e apresentação de dados e também para a obtenção de conclusões e a tomada de decisões razoáveis. 1.1. Métodos científicos Um método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.  Método Experimental: Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.  Método Estatístico: Admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 1.2. A Estatística É uma parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e utilização dos mesmos na tomada de decisão.  Descritiva: Representa um conjunto de métodos estatísticos que visam sumariar e descrever os atributos mais importantes referentes aos dados. Permite a coleta, a organização e a descrição dos dados. A descrição dos dados coletados é comumente apresentada em tabelas, gráficos e relatórios. 3 Estatística Básica  Inferencial: Também chamada de indutiva, representa um conjunto de métodos estatísticos que visam caracterizar ou inferir sobre uma população a partir de uma parte dela. Permite a analise e interpretação dos dados, tomando como base as amostras estatísticas. 1.3. Fases do método estatístico Podemos distinguir no método estatístico as seguintes fases:  Definir o Problema: Formular corretamente o problema sobre o qual deverá ser realizada uma pesquisa. Deve-se saber exatamente aquilo que se pretende pesquisar.  Planejamento: Determinar os procedimentos necessários para resolver o problema definido. Como levantar informações sobre o assunto objeto do estudo. Escolher e formular corretamente as perguntas. Definir o tipo de levantamento, as características mensuráveis, o cronograma de atividades, os custos envolvidos, etc.  Coleta de dados: É o registro sistemático dos dados pesquisados. Pode ser direta, quando é feita sobre elementos informativos de registro obrigatório (nascimento, prontuários, etc.) ou coletados pelo próprio pesquisador através de inquéritos ou questionários. Pode ser indireta, quando é inferida de elementos conhecidos (coleta direta) ou do conhecimento de fenômenos relacionados.  Apuração dos dados: Refere-se a fase de tabulação ou processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser feita de forma manual, eletromecânica ou eletrônica.  Apresentação dos dados: Qualquer que seja a finalidade da pesquisa efetuada, os dados devem ser apresentados sob uma forma adequada (tabelas, gráficos, etc.). Esse procedimento torna mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.  Análise dos resultados: O objetivo da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa deste todo (amostra). Assim deve ser feita uma análise através dos métodos da Estatística Indutiva ou Inferencial. 4 Estatística Básica CAPÍTULO 2 POPULAÇÃO E AMOSTRA A Estatística está baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. Portanto, entender o conceito de população e amostra se torna fundamental para a utilização de todas as técnicas estatísticas que serão apresentadas. 2.1. Variáveis estatísticas A cada fenômeno corresponde um conjunto de resultados possíveis. Como por exemplo: sexo (masculino ou feminino), idade (10, 35, 60, ...), estatura (1,75; 1,87; 1,50, ...). Assim, uma variável pode ser:  Qualitativa: Quando seus valores são expressos por atributos: país de origem (Brasil, Itália, Espanha, etc.); cor da pele (branca, preta, amarela, etc.); grau e instrução (analfabeto, fundamental, etc.).  Quantitativa: Quando seus valores são expressos em números. Recebe o nome de “quantitativa contínua”, quando pode assumir valores entre dois intervalos (altura, peso, etc.), ou seja, valores que podem ser medidos. Recebe o nome de “quantitativa discreta” quando pode assumir valores enumeráveis (número de filhos, número de alunos, etc.), ou seja, valores que podem ser contados. 2.2. População e amostra  População: Representa o conjunto de elementos que têm, em comum, pelo menos uma determinada característica. Em qualquer estudo estatístico pretendemos pesquisar uma ou mais características dos elementos de alguma população, por exemplo: alunos que possuem algum animal de estimação, casais que possuem mais de cinco filhos, etc.  Amostra: Na maioria das vezes, por alguma impossibilidade ou inviabilidade, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população que chamamos de amostra. Portanto, uma amostra representa um subconjunto finito de uma população. 5 Estatística Básica 2.3. Amostragem Existe uma técnica para recolher amostras, que garante, tanto quanto possível, o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade. Podemos então, definir, algumas técnicas para que ocorra esta amostragem:  Casual ou aleatória simples: Composta por elementos retirados ao acaso de uma população. Na prática, pode ser realizada numerando-se a população e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer.  Proporcional ou estratificada: Composta por elementos provenientes de estratos da população, que além, de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Muitas vezes a população se divide em estratos, como por exemplo: sexo masculino e sexo feminino.  Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir os sistemas de referência. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Por exemplo: Em uma linha de produção de uma indústria, podemos a cada 20 itens produzidos, retirar um para pertencer a uma amostra de produção diária, neste caso, teríamos fixado o tamanho da amostra em 20% da população. 6 Estatística Básica CAPÍTULO 3 TABELAS Um dos objetivos da Estatística é sintetizar os valores que as variáveis podem assumir. Isso pode ser feito através da apresentação dos dados na forma de tabelas. Uma tabela é um quadro que resume um conjunto de observações, fornecendo informações rápidas e seguras a respeito das variáveis em estudo. 3.1. Elementos de uma tabela A apresentação tabular (em tabelas) é feita com a disposição dos dados em linhas e colunas de acordo com normas bem rígidas, de aplicação mundial. No caso do Brasil, as regras foram definidas pela Fundação IBGE, para orientar a exposição racional e uniforme de dados estatísticos. Para manter esta estruturação e uma padronização de acordo com as normas, podemos definir que uma tabela compõe-se de elementos essenciais e complementares. Considerando a tabela apresentada ao lado, vamos reescrevê-la logo abaixo, detalhando cada um dos seus elementos. 7 Estatística Básica  Elementos essenciais: 1. Corpo: Conjunto de linhas e colunas que contém informações sobre as variáveis me estudo; 2. Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas; 3. Título: Conjunto de informações localizadas no topo da tabela, que permite responder às seguintes perguntas sobre a mesma: O que?, Quando?, Onde?; 4. Linhas: Informações dispostas horizontalmente, contendo os dados que se inscrevem nos seus cruzamentos com as colunas; 5. Coluna indicadora: Especifica os conteúdos das linhas; 6. Célula: Espaço destinado a um único dado, cuja posição é a intersecção entre uma linha com uma coluna (casa).  Elementos complementares: 7. Linha de total: Permite consultar os dados referentes às somatórias de algumas das colunas; 8. Fonte: Indicação da origem dos dados, ou seja, a entidade ou pessoa responsável pelo seu fornecimento; 9. Notas: Permite conceituar ou esclarecer o conteúdo de uma tabela ou indicar a metodologia empregada na coletas de dados. 10. Chamadas: Informações específicas sobre partes da tabela, com objetivo de esclarecer ou conceituar dos dados.  Dados das células: De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar: a) Um traço horizontal (–) quando o valor é zero; b) Três pontos (...) quando não temos os dados; c) Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor; d) Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. 8 Estatística Básica CAPÍTULO 4 SÉRIES ESTATÍSTICAS Denominados de série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Então, podemos inferir que numa série estatística observamos a existência de três fatores: o tempo, o espaço e a espécie. 4.1. Tipos de séries estatísticas  Séries históricas, cronológicas, temporais ou marchas Descrevem os valores da variável em determinado instante, discriminados de acordo com intervalos de tempo variáveis. Veja um exemplo na tabela abaixo:  Séries geográficas, espaciais, territoriais ou de localização Descrevem os valores da variável em determinado local, discriminados de acordo com as regiões. Veja um exemplo na tabela abaixo: 9 Estatística Básica  Séries específicas ou categóricas Descrevem os valores da variável em determinado tempo e local, discriminados, de acordo com especificações ou categorias. Veja um exemplo na tabela abaixo:  Séries conjugadas Muitas vezes temos a necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Veja um exemplo na tabela abaixo: 10 Estatística Básica CAPÍTULO 5 DISTRIBUIÇÃO DE FREQÜÊNCIAS Nos capítulos anteriores, vimos que uma das tarefas do estatístico é a coleta de dados. Assim, depois de apurar e reunir os dados, devemos condensá-los e apresentá-los. Essa apresentação pode ser feita em uma de modo a dar uma visão global daquilo que será analisado. Cada tabela tem um objetivo diferente, servindo para mostrar os dados estatísticos associados a um fato constituindo uma série estatística, apresentando elementos básicos tais como: tempo, espaço e espécie. A série chamada distribuição de freqüência apresenta dados numéricos em ambas as colunas que compõem estas tabelas. Para conhecer um fato é preciso representar e tratar os dados, realizando cálculos de muitas medidas existentes na Estatística, somente possíveis para as distribuições de freqüências. Elas são, por isso, as séries mais importantes e merecem ser estudadas com bastante atenção. Essa série é a mais complexa e utilizada das séries estatísticas. Nela, todos os fatores (tempo, espaço, espécie) são fixos. Os dados colhidos são medidas de alguma variável e são distribuídas de acordo com a freqüência, ou seja, o total de vezes que o dado acontece. Daí o nome distribuição de freqüência. 5.1. Tabela primitiva Pode ser definida como uma tabela cujos elementos não foram organizados numericamente. As tabelas primitivas não dão ao leitor uma visão rápida e global do fenômeno (veja Figura 5.1). Os dados ficam difíceis de serem averiguados, mesmo sendo conhecidos os valores das variáveis, portanto, a maneira mais fácil de organizar estes dados é através de certa ordenação (crescente ou decrescente). Figura 5.1 11 Estatística Básica 5.2. Rol A tabela obtida após uma ordenação específica dos dados recebe o nome de rol (veja a tabela ao lado). Dessa forma, podemos identificar com relativa facilidade alguns comportamentos das variáveis no grupo como um todo. Ainda que os dados estejam organizados numericamente, as tabelas com grande número de dados são cansativas e dificultam a análise das informações tabuladas, quando desejamos informações mais específicas sobre os fenômenos, como, por exemplo, a participação percentual da variável em um intervalo. 5.3. Distribuição de freqüência Nessa forma de apresentação das variáveis, os dados colhidos são distribuídos de acordo com a freqüência (total de vezes que o dado aparece). Nessas distribuições, os dados são dispostos ordenadamente em colunas, para facilitar o exame e possibilitar o cálculo de medidas estatísticas. Há dois tipos de distribuição de freqüências que podemos considerar.  Dados agrupados sem intervalos de classes Nessa distribuição, todos os valores obtidos são considerados e ordenados em uma única coluna. Na outra coluna, anotamos o número de vezes que cada valor ocorreu, ou seja, a freqüência. Esse tipo de distribuição é chamado de distribuição de dados agrupados sem intervalos de classes (veja a tabela ao lado). Distribuições com essa não contribuem muito para a análise dos dados e nem facilitam o cálculo de medidas que permitem a descrição numérica da série, principalmente quando possui um número muito grande de valores diferentes. 12 Estatística Básica  Dados agrupados com intervalos de classes Nessa forma de distribuição de freqüências, se faz o agrupamento dos valores das variáveis em vários intervalos. Este tipo de organização de dados é chamado de distribuição de freqüência de dados agrupados com intervalos de classes (veja a tabela ao lado). Chamamos de classes, os intervalos de variação de uma determinada variável observada. O que se pretende com esse tipo de tabela é realçar o que há de essencial nos dados e, também tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade especifica analisar o conjunto de valores, e não os casos isolados. 5.4. Elementos de uma distribuição de freqüência Para facilitar o entendimento, vamos considerar a tabela de distribuição de freqüência apresentada na tabela mostrada abaixo:  Classe Classe de freqüência ou, simplesmente, classes são intervalos de variação de uma variável. As classes são representadas simbolicamente por i , sendo i  1, 2, 3, ..., k (onde k é o número total de classes da distribuição). Considerando como exemplo a tabela mostrada logo acima, podemos afirmar que: a) O intervalo 410 | 540 , define a primeira classe ( i  1 ); b) O intervalo 540 | 670 , define a segunda classe ( i  2 ); c) Como a distribuição mostrada na tabela é formada de seis classes, podemos afirmar que nesse caso, k  6 . 13 Estatística Básica  Um roteiro para construir uma tabela com distribuição de freqüências com intervalos de classes Para ilustrar como pode ser definida uma tabela de distribuição de freqüências com intervalos de classe, utilizaremos como exemplo os dados da tabela apresentada na tabela mostrada logo abaixo: Ao construirmos a distribuição de freqüências por intervalos de classes, a partir dos dados mostrados na Figura 5.4.2, podemos dizer que os principais estágios da construção desta distribuição são os seguintes: a) Determinar o intervalo total dos dados Podemos definir que a amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). AT  Lmax  lmin Considerando a tabela apresentada logo acima e, como estamos querendo montar a tabela distribuição de freqüências por intervalos de classes, devemos determinar o intervalo total dos dados dessa tabela, portanto: ─ Maior salário: 1180 ─ Menor salário: 412 AT  Lmax  lmin  AT  1180  412  AT  768 b) Definir o número de classes a ser adotado De um modo geral recomendamos que as tabelas tenham no mínimo 4 classes e no máximo 15. Para determinação do número de classes de uma distribuição podemos utilizar algumas regras. 14 Estatística Básica ─ Regra prática: Calcular a raiz quadrada do total de observações da tabela ( n ). Para a tabela exemplo, teríamos a seguintes valores: n  40 (total de observações da tabela). k  n  k  40  k  6,324 Neste caso, podemos arredondar para 6, portanto, k  6 . Isso significa que este é um número adequado para a quantidade de classes que esta tabela poderia ter. ─ Regra de Sturges: Fornece o número de classes ( k ) em função do número de valores da variável ( n ) que representa o número de observações da tabela. Para a tabela exemplo, teríamos a seguintes valores: n  40 (total de observações da tabela). k  1  3, 222  log(n)  k  1  3,222  log(40) k  1  3, 222 1,602  k  6,162 Neste caso, podemos arredondar para 6, portanto, k  6 . Isso significa que este é um número adequado para a quantidade de classes que esta tabela poderia ter. c) Definir a amplitude das classes Calculamos a amplitude de classes (h) dividindo a amplitude total (AT) pelo número de classes ( k ). Para os dados da tabela da Figura 4.4.2 e considerando os cálculos obtidos anteriormente, teríamos para a amplitude das classes, o seguinte valor: h AT 768 h  h  128 k 6 Quando o resultado não é exato, podemos arredondá-lo para maior para tornar mais prática a formação das classes. Neste caso, portanto, será adotada a amplitude das classes para h  130 . d) Estabelecer os intervalos preliminares Para obtermos o primeiro intervalo de classe (1ª classe), somamos ao limite mínimo inferior da tabela ( lmin ) o valor obtido no cálculo da amplitude das classes (h), para obtermos o limite superior da primeira classe. 15 Estatística Básica Para obtermos o segundo intervalo de classe (2ª classe), consideramos o limite superior da primeira classe como sendo o limite inferior da segunda classe, então, somamos a este o valor obtido no cálculo da amplitude das classes (h), para obtermos o limite superior da segunda classe. Assim, sucessivamente iremos estruturando todos os intervalos de classes da tabela. Uma observação importante, é que para definir o valor do limite mínimo da tabela, podemos adotar um valor arredondado para facilitar os cálculos dos intervalos de classe. Por exemplo, para os dados constantes da tabela apresentada na Figura 5.4.2, poderíamos estabelecer para os intervalos preliminares de cada uma das classes, os seguintes valores: ─ 1ª classe: Limite inferior da tabela: 412 (arredondado para 410 ) Limite superior da classe: 410  h  410  130  540 Intervalo de classe: 410 ─ 2ª classe: 540 Limite inferior da classe: 540 Limite superior da classe: 540  h  540  130  670 Intervalo de classe: 540 ─ 3ª classe: 670 Limite inferior da classe: 670 Limite superior da classe: 670  h  670  130  800 Intervalo de classe: 670 ─ 4ª classe: 800 Limite inferior da classe: 800 Limite superior da classe: 800  h  800  130  930 Intervalo de classe: 800 ─ 5ª classe: 930 Limite inferior da classe: 930 Limite superior da classe: 930  h  930  130  1060 Intervalo de classe: 930 ─ 6ª classe: 1060 Limite inferior da classe: 1060 Limite superior da classe: 1060  h  1060  130  1190 Intervalo de classe: 1060 1190 16 Estatística Básica Observações: ─ Para cada resultado obtido para uma variável observada, deverá haver uma classe na qual este valor deverá ser encaixado; ─ Cada resultado obtido para a variável observada deverá pertencer a uma, e somente uma única classe. 5.5. Tipos de freqüências Para explicar cada um dos tipos de freqüências que serão apresentados, utilizaremos como exemplo, as informações constantes da tabela mostrada abaixo.  Ponto médio da classe ( xi ) O ponto médio de uma classe divide o intervalo da classe em duas partes iguais. Para obtermos o ponto médio de uma classe, podemos calcular a média aritmética entre o intervalo dessa classe. Veja estas informações na tabela exemplo. xi  li  Li 2 Onde: xi : Ponto médio do intervalo de classe li : Limite inferior da classe Li : Limite superior da classe 17 Estatística Básica  Freqüência simples ou absoluta ( fi ) São os valores que realmente representam o número de dados (observações) de cada classe. A soma das freqüências simples é igual ao número total dos dados observados ( n ). Veja estas informações na tabela exemplo.  f n i  Freqüência simples relativa ( fri ) São os valores das razões entre as freqüências simples de cada classe ( fi ) e a soma destas freqüências (  f ). Veja estas informações na tabela exemplo. i fri  fi f i O propósito das freqüências relativas é o de facilitar as comparações. A soma das freqüências simples (  f ) é igual a 1 ou 100%, ou seja: i  fr  1 i ou  fr  100% i  Freqüência acumulada ( Fi ) É total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Veja estas informações na tabela exemplo. Fk  f1  f 2    f k  Freqüência acumulada relativa ( Fri ) São os valores das razões entre as freqüências acumuladas de cada classe ( Fi ) e a soma destas freqüências (  f ).Veja estas informações na tabela exemplo. i Fri  Fi f i 18 Estatística Básica CAPÍTULO 6 GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:    Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. Clareza: O gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. Veracidade: O gráfico deve expressar a verdade sobre o fenômeno em estudo. 6.1. Principais tipos de gráficos Os principais tipos de gráficos podem ser classificados em diagramas, cartogramas e pictogramas. Nesse nosso estudo, serão abordados especificamente gráficos do tipo diagramas, no entanto, a título de conhecimento, podemos citar também os outros tipos.  Diagramas: São gráficos geométricos que utilizam em geral o sistema cartesiano para representá-lo. Dentre os principais gráficos desse tipo podemos temos gráfico de linhas ou curvas, gráficos de colunas ou barras, gráficos de setores, histogramas e polígonos de freqüências. Exemplos: 19 Estatística Básica  Cartogramas: São gráficos cujas representações são feitas em cartas geográficas. Este tipo de gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Exemplos:  Pictogramas: Os gráficos de pictogramas constituem um dos processos gráficos bem interessantes, comunica de maneira simples ao público, pela sua forma ao mesmo tempo, atraente e sugestiva. Sua representação gráfica é feita através de figuras relacionadas aos dados que estão sendo apresentados. Exemplos: 20 Estatística Básica 6.2. Diagramas Existem normas nacionais para a construção e gráficos, ditadas pela Fundação IBGE. Assim, é importante que os gráficos apresentem título, escala e legenda. O título pode ser colocado tanto acima como abaixo do gráfico. As escalas devem crescer da esquerda para a direita ou de baixo para cima. As legendas explicativas dever ser colocadas, de preferência, à direita do gráfico. Dentre os principais diagramas podemos destacar os gráficos de barras, colunas, linhas, curvas, setores, histogramas e polígonos de freqüências. Vejamos na seqüência, cada um desses gráficos:  Gráfico de barras ou colunas Os gráficos de barras ou de colunas são usados para apresentar variáveis qualitativas ou ordinais. Para fazer estes tipos de gráficos, primeiro traça-se o sistema de eixos cartesianos. Depois colocam-se, no eixo das abscissas (ou das ordenadas) as categorias da variável em estudo. Em seguida, constroem-se barras retangulares com base no eixo das abscissas (ou das ordenadas) e com alturas (ou comprimentos) proporcionais às freqüência dos dados. Os gráficos quando em colunas, são constituídos de retângulos que têm a mesma base e as alturas são proporcionais aos dados estatísticos representados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Exemplos: 21 Estatística Básica  Gráfico em linhas ou curvas O gráfico de linhas ou curvas se utiliza da linha poligonal para representar a série estatística. Constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Tendo determinado graficamente, todos os pontos da série, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que irá representar uma poligonal, que é o gráfico em linha ou em curva correspondente à série em estudo. Exemplo:  Gráfico de setores Este gráfico é constituído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. Este total é representado pelo círculo que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360. Exemplo: 22 Estatística Básica  Histograma Os dados apresentados em tabelas de distribuição de freqüências em intervalos de classes podem ser representados graficamente em através de histogramas. Este tipo de gráficos consiste em um conjunto de retângulos contíguos, tantos quantos forem as classes de uma distribuição representada. O princípio de um histograma é que as bases dos retângulos sejam proporcionais aos intervalos das classes e que as alturas sejam proporcionais às freqüências da distribuição, resultando, assim, em áreas dos retângulos também proporcionais às freqüências das classes. Exemplo:  Polígono de freqüências Os dados apresentados em tabelas de distribuição de freqüência em intervalos de classes, também podem se apresentados em gráficos denominados polígonos de freqüência. Para fazer esse tipo de gráfico, primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classes são iguais, marcam-se pontos com abscissas iguais aos pontos médios dos intervalos das classes e ordenadas iguais às respectivas freqüências. Para fechar o polígono, unem-se os extremos da figura com o eixo horizontal, nos pontos de abscissas iguais aos pontos médios de uma classe imediatamente inferior à primeira, e de uma classe imediatamente superior à última. 23 Estatística Básica Exemplo1: Exemplo 2: 24 Estatística Básica CAPÍTULO 7 MEDIDAS DE TENDÊNCIA CENTRAL As medidas de posição ou medidas de tendência central são estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal. As mais importantes são as medidas de tendência central, onde os dados observados tendem, em geral, a se agrupar em torno dos valores centrais. 7.1. Média aritmética É o quociente da divisão da soma dos valores da variável pelo número total de valores existentes na série. Utilizamos a média quando desejamos obter a medida de posição que possui maior estabilidade. Em uma tabela com distribuição de freqüência de dados agrupados, para efetuar o cálculo da média aritmética, devemos considerar as seguintes situações:  Sem intervalos de classes: Neste caso as freqüências são números indicadores de intensidade de cada valor da variável, funcionando como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: X X  f f i i i Onde: X i : Valores da variável fi : Freqüência simples absoluta Exemplo: Seja a tabela abaixo. Determine a média aritmética da série. X X  f f i i i X 846 44 X  19, 23 25 Estatística Básica  Com intervalo de classes: Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada pela fórmula: X X  f f i i i Onde: X i : Ponto médio da classe fi : Freqüência simples absoluta Observação: Para determinar o ponto médio de cada um dos intervalos de classe, podemos utilizar a seguinte fórmula: Xi  linfi  lsupi 2 Onde: linfi : Limite inferior do intervalo de classe lsupi : Limite superior do intervalo de classe Exemplo: Seja a tabela abaixo. Determine a média aritmética da série. X X  f f i i i X 2440 40 X  61 7.2. Moda Moda é a denominação dada ao resultado que aparece mais vezes em um conjunto de dados, ou seja, o valor que ocorre com maior freqüência em uma série de valores. A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou ainda, quando a medida de posição deve ser o valor mais típico da distribuição. 26 Estatística Básica Podemos encontrar séries que apresentem dois ou mais valores de concentração. Neste caso, dizemos que estas séries possuem dois ou mais valores modais. Entretanto, podemos encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Neste caso, dizemos que se trata de uma série amodal. Em uma tabela com distribuição de freqüência de dados agrupados, para encontrar o valor da moda, devemos considerar as seguintes situações:  Sem intervalos de classes: Uma vez agrupados os dados, é possível determinar a moda, fixando o valor da variável de maior freqüência. Exemplo 1: Seja a tabela abaixo. Determine a moda da série. Mo  20 A moda representa o valor da variável de maior freqüência da tabela ( f 2  13 ).  Com intervalo de classes: Consiste em tomar o ponto médio da classe modal. A classe modal é representada pelo intervalo de classe que apresenta a maior freqüência. Mo  linfMo  lsupMo 2 Onde: linfMo : Limite inferior da classe modal lsup Mo : Limite superior da classe modal Exemplo 2: Seja a tabela abaixo. Determine a moda da série. Classe modal: Mo  Mo  linf Mo  lsupMo 2 158  162 2 Mo  160 cm 27 Estatística Básica 7.3. Mediana A mediana é definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Este valor separa exatamente ao meio uma série, quando seus valores estão em ordem crescente ou decrescente. A mediana de um conjunto de valores ordenados é o valor situado de tal forma nesse conjunto, que o separa em dois subconjuntos de mesmo número de elementos. Empregamos a mediana quando desejamos obter o ponto que divide a distribuição em partes iguais. Ou ainda, quando há valores extremos que afetam de uma maneira acentuada o cálculo da média aritmética. Em uma tabela com distribuição de freqüência de dados agrupados, para calcular o valor da mediana, devemos considerar as seguintes situações:  Sem intervalos de classes: Neste caso, identificamos a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana, então, será o valor da variável que corresponde a tal freqüência acumulada. Devemos considera duas situações possíveis. a) Quando o somatório da freqüência simples absoluta (  fi ) for um número ímpar o valor mediano será o termo de ordem dado pela fórmula: Onde: Termo : Valor correspondente a posição obtida f i : Somatório da freqüência simples absoluta Exemplo 1: Seja a tabela abaixo. Determine a mediana da série. 28 Estatística Básica b) Quando o somatório da freqüência simples absoluta (  fi ) for um número par o valor mediano será o termo de ordem dado pela fórmula: Onde: Termo : Valor correspondente a posição obtida f i : Somatório da freqüência simples absoluta Exemplo 2: Seja a tabela abaixo. Determine a mediana da série.  Com intervalo de classes: Neste caso, devemos determinar o ponto do intervalo em que está compreendido a mediana. Portanto, temos que encontrar a classe na qual se acha a mediana (classe mediana). Na prática, para determinar a mediana numa série com intervalos de classes, executamos os seguintes passos: a) Determinamos a freqüência simples acumulada dos intervalos de classes ( Fi ) b) Calculamos a posição ou lugar da classe mediana ( LMd ), para determinar o intervalo de classe onde a mediana deverá situar-se. Para isso utilizamos a seguinte fórmula: LMd  f i 2 29 Estatística Básica Onde: LMd : Posição (lugar) da classe mediana  fi : Somatório da freqüência simples absoluta c) Marcamos a classe correspondente à freqüência simples acumulada que seja F imediatamente anterior a classe mediana ( antMd ). d) Aplicamos a seguinte fórmula para o cálculo da mediana ( Md ). Md  linf Md   fi  FantMd   2 f Md        hMd    Onde: linf Md : Limite inferior da classe mediana f i : Somatório da freqüência simples absoluta hMd : Amplitude do intervalo da classe mediana f Md : Freqüência simples absoluta da classe mediana FantMd : Freqüência acumulada da classe anterior à classe mediana Exemplo: Seja a tabela abaixo. Determine a mediana da série. Resolução: a) Calcular a Freqüência Acumulada ( Fi ) dos intervalos de classes (estes valores estão calculados na tabela acima). 30 Estatística Básica b) Calcular o lugar da classe mediana: LMd  f  LMd  i 2 40  LMd  20 2 Logo, a classe mediana será: c) Marcar freqüência acumulada da classe anterior à classe mediana: FantMd  13 d) Aplicar a fórmula para calcular a mediana: Md  linf Md   fi  FantMd   2 f Md        hMd     40   2  13   20  13  7 Md  58     4  Md  58     4  Md  58     4  11   11   11    Md  58  0,6363  4  Md  58  2,54  Md  60,54 31 Estatística Básica CAPÍTULO 8 MEDIDAS DE DISPERSÃO Para avaliar quantitativamente o grau de variabilidade ou dispersão dos valores de um conjunto de números em torno do valor médio lançaremos mão das estatísticas denominadas medidas de dispersão. As principais são: a amplitude total, a variância, o desvio padrão e o coeficiente de variação de Person. São medidas utilizadas para medir o grau de variabilidade dos valores observados em torno da média aritmética. Medem a representatividade da média e proporcionam o conhecimento do nível de homogeneidade ou heterogeneidade dentro de cada grupo analisado. 8.1. Amplitude total A amplitude total corresponde à diferença entre o maior e o menor valor da série de dados, ou seja, à distância entre os valores extremos. É a forma mais simples de avaliar a dispersão dos dados, de tal modo que quanto maior for a amplitude total maior é a dispersão dos dados. Este valor, porém, não mede bem a dispersão dos dados porque, em seu cálculo, usam-se apenas os valores extremos, e não todos os dados da amostra. Os valores extremos são muito variáveis com relação a amostra que se retire de uma população, de tal modo que duas distribuições podem ter a mesma amplitude total, mas dispersões muito diferentes. Outro inconveniente da amplitude total é consequência de não tomar em consideração as frequências das observações. No entanto, a amplitude é muito utilizada, principalmente porque é fácil de calcular e interpretar. Para calcular esta medida, podemos considerar as seguintes situações:  Sem intervalos de classes: Quando os dados estiverem organizados dessa forma, você poderá calcular a amplitude total utilizando a seguinte expressão: AT  xmax  xmin Onde: xmax : Maior valor da tabela xmin : Menor valor da tabela 32 Estatística Básica Exemplo: Seja a tabela abaixo. Determine a amplitude total. AT  xmax  xmin Tabela 1 xi fi 0 2 1 6 2 12 3 7 4 3 AT  4  0 AT  4  Com intervalos de classes: Quando os dados estiverem organizados dessa forma, você poderá calcular a amplitude total utilizando a seguinte expressão: AT  lmax  lmin Onde: lmax : Limite superior da última classe lmin : Limite inferior da primeira classe Exemplo: Seja a tabela abaixo. Determine a amplitude total. AT  lmax  lmin Tabela 2 classes fi 50 |— 54 4 55 |— 58 9 58 |— 62 11 Total 14 AT  62  50 AT  12 8.2. Variância Os dados distribuem-se em torno da média, então, o grau de dispersão de um conjunto de dados pode ser medido pelos desvios em relação à média. Para medir a dispersão dos valores da série em relação à média, pode-se pensar que basta simplesmente somar os desvios em relação à média. Porém, se fizer esta experiência verificará que não foi uma boa idéia, porque a soma dos desvios é sempre igual a zero. Assim será necessário considerar os desvios independentemente do sinal da diferença. 33 Estatística Básica E isso será feito por meio do cálculo da diferença ao quadrado. Tem-se então, que a variância baseia-se nos desvios em torno da média aritmética, porém, determinando a média aritmética dos quadrados dos desvios.  Variância populacional: Quando o conjunto das observações é uma população, é chamada de variância da população ou variância populacional. A variância populacional é dada por: 2  x  x  2 i n Onde:  2 : Variância populacional n : Tamanho da população ( n fi ) xi : Ponto médio de cada classe x : Média aritmética da população f i : Freqüência absoluta de cada classe Quando já se têm os dados organizados em uma tabela, pode-se calcular a variância amostral pela seguinte fórmula:   2      f i  xi   f i  xi2   n n 2 Na prática, quando lidamos com grandes populações, é quase sempre impossível achar o valor exato da variância da população, devido ao tempo, custo e outras restrições aos recursos.  Variância amostral: Se o conjunto das observações é uma amostra estatística, chamamos de variância da amostra ou variância amostral. A variância amostral é dada por: s2   (x  x ) 2 i n 1 34 Estatística Básica Onde: s 2 : Variância amostral n : Tamanho da amostra da população ( n fi ) xi : Ponto médio de cada classe x : Média aritmética da amostra f i : Freqüência absoluta de cada classe Com relação a diferença entre as fórmulas podemos observar que para o caso da variância 2 populacional (  ), utiliza-se a média populacional ( x ) tendo como denominador o 2 tamanho da população ( n ). Para o cálculo da variância amostral ( s ), utiliza-se a média amostral ( x ), tendo como denominador o tamanho da amostra menos ( n  1). Quando já se têm os dados organizados em uma tabela, pode-se calcular a variância amostral pela seguinte fórmula: s  2      f i  xi   fi  xi2   n n 1 2 Exemplo: Considerando os dados apresentados na tabela abaixo, calcular a variância amostral tabela. Resolução: 2   2   f i  xi  6.440  2    1.038.080   fi  xi  n 2 2 40 s  s  n 1 40  1 41.473.600 1.038.080  1.038.080  1.036.840 40 s2   s2  39 39 1.240 s2   s 2  31,7948 39 35 Estatística Básica  Informações importantes: A importância de estudarmos a variância dos dados está no fato da possibilidade de compararmos distribuições amostrais e populacionais. Neste sentido, quanto maior a variância, menor será a concentração dos dados em torno da média. Por outro lado, quanto menor a variância, mais homogênea será a distribuição de freqüências. A variância é uma medida de dispersão extremamente importante na teoria estatística. Do ponto de vista prático, ela tem o inconveniente de se expressar uma unidade quadrática em relação à da variável em questão, o que nem sempre faz sentido. A variância é dada sempre no quadrado da unidade de medida da série. Se os dados são expressões em metros, a variância é expressa em metros quadrados. Em algumas situações, a unidade de medida da variância nem faz sentido, por exemplo, quando os dados da série forem expressos em litros, a variância será expressa em litros quadrados. Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja, a variância não tem interpretação. Exatamente para suprir esta deficiência é que se define o desvio padrão, que será explicado posteriormente. 8.3. Desvio padrão Com já mencionamos, o uso prático da variância muitas vezes se torna inconveniente visto que é expressa pelo quadrado da variável em estudo. Para contornar o problema da unidade, define-se o desvio padrão. Podemos considerar, sem dúvida, que o desvio padrão é a mais importante das medidas de dispersão. É fundamental que ao ser analisado, consiga-se relacionar o valor obtido dessa medida com os dados da série. O desvio padrão terá sempre a mesma unidade de medida da série, portanto admite interpretação. Como se pode calcular a variância populacional e também a variância amostral, também é possível calcular os valores para o desvio padrão populacional e amostral respectivamente.  Desvio padrão populacional: Você poderá calcular o desvio padrão populacional utilizando a seguinte expressão:    (x i  x )2 n 1 36 Estatística Básica Onde:  : Desvio padrão populacional n : Tamanho da amostra da população ( n fi ) xi : Ponto médio de cada classe x : Média aritmética da amostra f i : Freqüência absoluta de cada classe Quando já se têm os dados organizados em uma tabela, pode-se calcular a desvio padrão pela seguinte fórmula:        f i  xi   f i  x i2   n n 1 2  Desvio padrão amostral: Você poderá calcular o desvio padrão populacional utilizando a seguinte expressão: s   (x i  x )2 n 1 Onde: s : Desvio padrão amostral n : Tamanho da amostra da população ( n fi ) xi : Ponto médio de cada classe x : Média aritmética da amostra f i : Freqüência absoluta de cada classe Quando já se têm os dados organizados em uma tabela, pode-se calcular a desvio padrão pela seguinte fórmula: s      f i  xi   f i  x i2   n n 1 2 37 Estatística Básica Exemplo: Considerando os dados apresentados na tabela abaixo, calcular a variância amostral e o desvio padrão para a tabela. Resolução: 2   2   fi  xi  6.440  2    f x   1.038.080   i i n 40 s2   s2  40  1 n 1 41.473.600 1.038.080  1.038.080  1.036.840 40 s2   s2  39 39 1.240 s2   s 2  31,7948 (variância) 39 s  31,7948  s  5,6386 (desviopadrão) 8.4. Coeficiente de variação O coeficiente de variação é uma medida adimensional de dispersão, sendo definida como o quociente entre o desvio padrão e a média aritmética. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem.  Coeficiente de variação populacional: Você poderá calcular o coeficiente de variação populacional utilizando a seguinte expressão: CV   100 x Onde: CV : Coeficiente de variação populacional  : Desvio padrão populacional x : Média aritmética da população 38 Estatística Básica  Coeficiente de variação amostral: Você poderá calcular o coeficiente de variação amostral utilizando a seguinte expressão: CV  s 1 00 x Onde: CV : Coeficiente de variação populacional s : Desvio padrão amostral x : Média aritmética da amostra da população  Informações importantes: Se tivermos que comparar duas ou mais variáveis, isto só será possível com as estatísticas até aqui estudadas, se forem satisfeitas as seguintes condições: a) Ambas as variáveis deverão possuir a mesma unidade de medida; b) Ambas as variáveis deverão possuir a mesma quantidade de observações, pois a que tiver mais elementos terá maior probabilidade de ser mais heterogênea. Quando estas condições não forem satisfeitas, devemos utilizar o coeficiente de variação de Pearson. Para entender com se interpreta o coeficiente de variação, imagine dois grupos de pessoas, onde, no primeiro grupo, as pessoas as seguintes idades: 3, 1 e 5 anos. No segundo grupo, as pessoas têm as seguintes idades: 55, 57 e 53 anos. No primeiro grupo, a média de idade é de 3 anos ( x  3 ) e no segundo grupo a média de idade é de 55 anos ( x  55 ). Nos dois grupos a dispersão dos dados é a mesma. Ambos têm a mesma variância ( s 2  4 ). Veja os cálculos: ─ Para o primeiro grupo, temos: x 3 1 5 9  x   x  3 (média aritmética) 3 3  x1  x    3  3  02  0 2 2 2  x2  x   1  3   2   2 2  x3  x    5  3  22  4 2 s2  2  (x  x ) i n 1    4    ( xi  x ) 2  0  4  4  8   2  s2  8 8  s 2   s 2  4 (variância) 3 1 2 39 Estatística Básica ─ Para o segundo grupo, temos: x 55  57  53 165 x  x  55 (média aritmética) 3 3  x1  x    55  55  02  0 2 2  x2  x    57  55  22  4 2 2 2  x3  x    53  55   2   2 s2  2  (x  x ) i n 1    2    ( xi  x )  0  4  4  8  4  2  s2  8 8  s 2   s 2  4 (variância) 3 1 2 Mas as diferenças de dois anos são muito mais importantes no primeiro grupo, quem tem média igual a 3, do que no segundo grupo, que tem média igual a 55. Agora, veja os coeficientes de variação de cada um dos grupos. ─ Para o primeiro grupo, temos: s2  4 s  4  s  2 s CV  100 x 2 C V  10 0  C V  66, 6 7 % 3 ─ Para o segundo grupo, temos: s2  4 s  4  s  2 s 100 CV  x 2  1 0 0  C V  3, 6 4 % CV  55 Um coeficiente de variação igual a 66,67% indica que a dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é muito alta. Já um coeficiente de variação de 3,64% indica que a dispersão dos dados em relação à média é pequena. Em outras palavras, diferenças de 2 anos são relativamente mais importante no primeiro grupo, que tem média 3 e coeficiente de variação 66,67% do que no segundo grupo que tem média 55 e coeficiente de variação 3,64%. Então, o coeficiente de variação mede dispersão em relação à média. 40 Estatística Básica CAPÍTULO 9 PROBABILIDADE O pesquisador, quando realiza uma pesquisa, observa alguns casos, no entanto, quer se referir a todos os casos similares, ou seja, ele tem dados de uma amostra e quer se referir a toda população. Assim, partindo dessa amostra, pode inferir (deduzir, concluir) para toda uma população. Na estatística inferencial os métodos estatísticos são usados para que se possam tirar conclusões, estimações, predições e generalizações sobre todo um conjunto de dados, estudando apenas parte dele. Para se fazer as inferências estatísticas utilizam-se das teorias probabilísticas para explicar a frequência da ocorrência de eventos, tanto em estudos observacionais quanto em experimentos. 9.1. Conceito de probabilidade O estudo da probabilidade tem seus primórdios ligados aos jogos de azar. Esta origem permitiu conceituar probabilidade. Se por exemplo, lançarmos um dado, podemos admitir que há seis resultados igualmente prováveis (1, 2, 3, 4, 5 ou 6), ou ainda se lançarmos uma moeda podemos observar que há duas possibilidades de observarmos o resultado da face de cima (cara ou coroa). No entanto, para que possamos entender o conceito de probabilidade de forma mais técnica é necessário abordar outras questões básicas que servirão apoio para esse entendimento como: experimentos aleatórios, espaço amostral, evento.  Experimentos aleatórios: São aqueles que, repetidos em idênticas condições, produzem resultados que não podem ser previstos com certeza. Assim, um experimento é dito aleatório, quando satisfaz às seguintes condições: a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmas condições; b) Embora não saibamos qual o resultado que irá ocorrer, em geral conseguimos descrever o conjunto de todos os resultados possíveis que podem ocorrer; c) Obedece à regularidade estatística nos resultados, isto é, torna-se possível construir um modelo matemático preciso com o qual se analisará o experimento. As variações de resultados, de experimentos para experimento, são devidas a uma multiplicidade de causas que não podemos controlar, as quais denominamos acaso. Como exemplos de experimentos aleatórios podemos citar: a) Ao lançarmos uma moeda, não podemos prever qual das duas faces ficará voltada para cima. No entanto, sabemos que podem ocorrer as faces cara ou coroa. 41 Estatística Básica b) Ao lançarmos um dado, não podemos prever qual número ficará voltado para a face de cima. No entanto, sabemos que podem ocorrer os números 1, 2, 3, 4, 5 ou 6. c) Quando selecionamos uma carta de um baralho de 52 cartas, não podemos prever qual será ou seu valor (número ou naipe). Porém, podem calcular quais as possibilidades de ocorrer um ás de espadas, por exemplo. Observe que os experimentos aleatórios podem ser repetidos inúmeras vezes, assim, conhecemos os resultados possíveis, porém, o resultado de cada experimento não é previsível. Esses resultados são chamados probabilísticos. Por outro lado, experimentos previsíveis mesmo antes de realizado são chamados de determinísticos. Neste caso, repetindo o experimento, nas mesmas condições, o resultado é sempre o mesmo. Podemos citar alguns exemplos deste caso: a) Sujeita à pressão de 1 atmosfera, podemos prever que a água entrará em ebulição à temperatura de 100 °C. b) Se um corpo percorre uma distância de 120 km, de um determinado espaço, com velocidade média de 60 km/h, podemos determinar, pelas leis da Física, que ele gastará 2 horas para percorrer o referido espaço.  Espaço amostral: Chamamos de espaço amostral, um conjunto formado por todos os resultados possíveis de um experimento aleatório. Podemos indicar o espaço amostral por S (space) ou pelo símbolo  (ômega). A cada experimento aleatório, em geral, há vários resultados possíveis, por exemplo: a) Lançar uma moeda e observar a face de cima. Os resultados possíveis ou o espaço amostral desse experimento aleatório pode ser:   cara, coroa b) Lançar um dado e observar o número da face de cima. Os resultados possíveis ou o espaço amostral desse experimento aleatório pode ser:   1, 2,3, 4,5, 6 c) Lançar dois dados e observar os números das faces de cima. Os resultados possíveis ou o espaço amostral desse experimento aleatório pode ser:   (1,1), (1, 2), (1,3), (1, 4), (1,5), (1, 6), (2,1), (2, 2), (2,3), (2, 4), (2,5), (2,6), (3,1),(3, 2), (3,3),(3, 4), (3,5), (3, 6), (4,1),(4, 2), (4,3), (4, 4), (4,5), (4,6), (5,1), (5, 2), (5,3), (5, 4), (5,5), (5, 6), (6,1), (6, 2), (6,3), (6, 4), (6,5), (6, 6) 42 Estatística Básica  Evento: Consideremos um experimento aleatório, cujo espaço amostral é  . Chamamos de evento todo subconjunto desse espaço amostral  . Em geral indicamos um evento por uma letra maiúscula do alfabeto: A, B, C ,..., X , Y , Z . Portanto, diremos que um evento A ocorre se, realizado o experimento, o resultado obtido for pertencente a A . Vejamos alguns exemplos: a) Um dado é lançado e observa-se o número da face de cima. Espaço amostral:   1, 2,3, 4,5, 6 Evento A : Ocorrência de número ímpar. A  1,3,5 Evento B : Ocorrência de número par. B  2, 4,6 Evento C : Ocorrência de número múltiplo de 3. C  3, 6 Evento D : Ocorrência de número maior ou igual 7. D   (evento impossível) b) Duas moedas são lançadas e observa-se a sequência de caras e coroas. Espaço amostral ( K = cara e C = coroa):   ( K , C ), ( K , C ), (C , K ),(C , C ) Evento A : Ocorrência de uma cara. A  ( K , C ), (C , K ) Evento B : Ocorrência de duas caras. B  ( K , K ) Evento D : Ocorrência de pelo menos uma coroa. D  (C , K ), ( K , C ), (C , C )  Eventos mutuamente exclusivos: Dizemos que dois eventos são mutuamente exclusivos quando a ocorrência de um impossibilita (ou exclui) a ocorrência do outro, ou seja, se A e B são eventos mutuamente exclusivos contidos em  , então, A  B   . Exemplos: Seja o lançamento de um dado e os eventos: Espaço amostral:   1, 2,3, 4,5, 6 Evento A : Ocorrência de números pares. A  2, 4,6 Evento B : Ocorrência de números ímpares. B  1,3,5 43 Estatística Básica  Eventos complementares: Dizemos que dois eventos são complementares, se a união entre eles resulta no espaço amostral e se a interseção resulta num evento impossível, ou seja, se C e D são eventos complementares contidos em  , então, C  D   e CD Exemplos: Seja o lançamento de um dado e os eventos: Espaço amostral:   1, 2,3, 4,5, 6 Evento C : Ocorrência de números ímpares. C  1,3,5 Evento C : Ocorrência de números não ímpares. C  2, 4,6 ou   C  2, 4,6 Evento D : Ocorrência de números pares. D  2, 4,6 Evento D : Ocorrência de números não pares. D  1,3,5 ou   D  1,3,5 Os eventos C e D são complementares, ou seja, C  D e D  C .  Probabilidade: Dado um experimento aleatório, sendo  o seu espaço amostral, vamos admitir que todos os elementos de  tenham a mesma chance de acontecer, ou seja, que o espaço amostral  é um conjunto equiprovável. Chamamos de probabilidade de um evento A , onde A   , o número real P ( A) , tal que: P ( A)  n( A) n( ) Então, podemos dizer que a probabilidade é um número entre 0 e 1 utilizado para exprimir o grau de certeza acerca da ocorrência de um evento associado a um experimento aleatório. Vejamos alguns exemplos: a) Considerando o lançamento de duas moedas e sendo A o evento, “obter pelo menos uma cara”, temos:   ( K , C ), ( K , C ),(C , K ), (C , C )  n()  4 A  ( K , C ), ( K , C ), (C , K )  n( A)  3 n( A) 3  P( A)  ou P ( A)  0, 75 n ( ) 4 Ou ainda, P ( A)  0, 75  P ( A)  0,75  100  P ( A)  75% Logo, P( A)  O resultado acima nos permite afirmar que, ao lançarmos duas moedas equilibradas, temos 75% de chance de que apareça pelo menos uma cara na face superior. 44 Estatística Básica b) Considerando o lançamento simultâneo de dois dados diferentes e sendo B o evento “ocorrer a soma dois números igual a 5”, temos:   (1,1), (1, 2), (1, 3), (1, 4), (1,5), (1, 6), (2,1), (2, 2), (2,3), (2, 4), (2,5), (2, 6), (3,1), (3, 2),(3,3), (3, 4),(3,5),(3, 6), (4,1), (4, 2), (4,3), (4, 4),(4,5), (4, 6), (5,1), (5, 2),(5,3), (5, 4),(5,5),(5, 6),(6,1), (6, 2),(6,3), (6, 4),(6,5),(6, 6) B  (1, 4),(4,1), (3, 2), (2,3)  n( B)  4 Logo, P( B)  n( B ) 4 1  P( B)   ou P ( B )  0,1111 36 9 n( ) Ou ainda, P ( B )  0,1111 100  P ( B )  11,11% O resultado acima nos permite afirmar que, ao lançarmos dois dados simultaneamente, temos 11,11% de chance de que apareça a soma de dois números igual a 5, na face superior.  Teoremas: Podem ser definidos alguns teoremas sobre probabilidades em um espaço amostral finito. 1. Teorema 1: A probabilidade do evento certo é igual a 1, então, P ()  1 2. Teorema 2: Se A e B são eventos de um mesmo espaço amostral  e se A  B , então, temos que: P  A  P  B  . 3. Teorema 3: A probabilidade de um evento A , é um número real P ( A) , tal que, 0  P ( A)  1 4. Teorema 5: Se A é o complementar de A , então, P  A   1  P  A  5. Teorema 6: Se  é um evento impossível, então, P ()  0 9.2. Probabilidade condicional Muitas vezes, dois eventos relacionam-se entre si de tal modo que a probabilidade de um ocorrer dependa da ocorrência do outro. Analisando de forma mais detalhada esta situação, vamos considerar as seguintes afirmações: 45 Estatística Básica Seja  um espaço amostral e consideremos dois eventos, A e B . Podemos representar com o símbolo P  A | B  que se lê “probabilidade de A , dado B ”, ou seja, a probabilidade condicional do evento A ocorrer, uma vez que o evento B já tenha ocorrido. Ao calcularmos P  A | B  , tudo se passa como se B fosse o novo espaço amostral “reduzido”, dentro do qual queremos calcular a probabilidade de A . Os exemplos propostos na sequência ilustram a idéia de probabilidade condicional, ou seja, a idéia de ocorrer um evento pode ser modificada quando se impõe uma determinada condição.  Exemplo 1: O conceito de probabilidade permite responder a questões do tipo: “Qual a probabilidade de ocorrer um ás de espadas, quando se retira ao acaso uma carta do baralho?”. Para responder a esta pergunta é preciso saber que um baralho tem 52 cartas. Dessas, apenas uma tem a característica “ser um ás de espadas”, então, a probabilidade de sair “ás de espadas”, quando se retira uma carta ao acaso de um baralho é dada por: P  A  1  0,0192 , ou ainda, P  A   0,0192  P  A   0,0192  100  1,92% 52 Imagine agora que foi feita a seguinte pergunta: “Qual é a probabilidade de se retirar um ás de espadas de um baralho, sabendo-se que saiu uma carta de espadas?”. Ora, esta informação limita o número de eventos possíveis. Existem 13 cartas de espadas, a probabilidade de ter ocorrido um ás nessas condições é dada por: P  A  1  0, 0769 , ou ainda, P  A   0,0769  P  A   0,0769  100  7, 69% 13  Exemplo 2: Numa cidade, 400 pessoas foram classificadas, segundo sexo e estado civil, de acordo com a tabela mostrada abaixo: Masculino (M) Feminino (F) Total Solteiro (S) 50 150 200 Casado (C) 60 40 100 Desquitado (D) 40 10 50 Viúvo (V) 30 20 50 Total 180 220 400 Uma pessoa é escolhida ao acaso. Sejam os eventos: S : A pessoa escolhida é solteira. M : A pessoa escolhida é do sexo masculino. Então, P  S | M  significa a probabilidade de a pessoa escolhida ser solteira, no novo espaço amostral reduzido das 180 pessoas do sexo masculino. Ora, como existem 50 pessoas solteiras nesse novo espaço amostral: 46 Estatística Básica PS | M   50 5  PS | M   , ou ainda, 180 18 P  S | M   0, 2777  P  S | M   0, 2777 100  P  S | M   27, 77% Sejam ainda os eventos: F : A pessoa escolhida é do sexo feminino. D : A pessoa escolhida é desquitada. Então, P  F | D  significa a probabilidade de a pessoa escolhida ser do sexo feminino, no novo espaço amostral reduzido das 50 pessoas desquitadas. Ora, como existem 10 pessoas do sexo feminino nesse novo espaço amostral: P  F | D  10 1  P  F | D   , ou ainda, 50 5 P  F | D   0, 20  P  F | D   0, 20 100  P  F | D   20% É importante notar que P  F | D   P  D | F  , pois, se efetuarmos os cálculos também para P  D | F  , veremos que os valores são diferentes, já que este significa a probabilidade de a pessoa escolhida ser desquitada, no espaço amostral reduzido das pessoas do sexo feminino, veja os cálculos: PD | F   10 1 , ou ainda,  PD | F   220 22 P  D | F   0,0454  P  D | F   0,0454  100  P  D | F   4,54%  Modos de cálculo: Temos dois modos de calcular a probabilidade condicional, considerando P  A | B  . a) Considerando que a probabilidade do evento A será calculada em relação ao espaço amostral “reduzido” pelo evento B . b) Empregando a fórmula, onde as probabilidades são calculadas em relação ao espaço amostral original  . P  A | B  P  A  B P B 47 Estatística Básica 9.3. Teorema da multiplicação (produto) Antes de definirmos o teorema da multiplicação, convém mencionar que, quando um evento tem influência na ocorrência do outro, eles são chamados de eventos dependentes, caso contrário, são chamados de eventos independentes, ou seja, a ocorrência de um, não afeta a de outro. Em várias situações, pode haver interesse em determinar a probabilidade de dois eventos ocorrerem ao mesmo tempo, ou um em seguida do outro. Uma consequência importante da definição formal da probabilidade condicional é a seguinte: P  A | B  P  A  B  P  A  B  P  B  P  A | B P  B P  B | A  P  A  B  P  A  B   P  A  P  B | A P  A  Eventos dependentes: Se A e B são eventos dependentes, a probabilidade de ocorrer os eventos A e B é dada pela probabilidade de ocorrer A , multiplicada pela probabilidade condicional de ocorrer B , dado que A ocorreu, então, temos que: P  A  B   P  A  P  B | A Isto é, a probabilidade da ocorrência simultânea de dois eventos, ou seja, P  A  B  , é o produto da probabilidade de um deles pela probabilidade do outro, dado o primeiro.  Exemplo 01: Imagine que uma pessoa retira, ao acaso, uma bola de uma urna e, em seguida, sem que essa bola seja recolocada na urna, retira uma segunda bola. Imagine que essa urna contenha duas bolas pretas e oito bolas brancas. Qual a probabilidade de terem sido retiradas as duas bolas pretas? É fácil verificar que a probabilidade de uma pessoa retirar ao acaso uma bola preta de uma urna que contém duas bolas pretas e oito bolas brancas é dada por: P  A  2 10 Se sair a bota preta, e se essa bola não for recolocada na urna, a probabilidade de a pessoa retirar uma segunda bola preta é dada por: P  B | A  1 9 48 Estatística Básica Isto ocorre porque a urna passa a conter nove bolas (uma já foi retirada), das quais apenas uma é preta. Para determinar a probabilidade de ocorrer uma bola preta na primeira retirada e uma bola preta na segunda retirada, multiplicam-se as probabilidades, isto é, calcula-se: P  A  B   P  A  P  B | A  P  A  B   2 1 2 1    10 9 90 45 P  A  B   0,0222 100  P  A  B   2, 22%  Eventos independentes: Se A e B são eventos independentes, a probabilidade de ocorrer os eventos A e B é dada pela probabilidade de ocorrer A , multiplicada pela probabilidade de ocorrer B , então, temos que: P  A  B   P  A  P  B  Dados dois eventos A e B de um espaço amostral  , diremos que A independe de B se P  A | B   P  A  , isto é, A independe de B se a ocorrência de B não afeta a probabilidade de A . Observemos também que, se A independe de B , ou seja, P  A   0 , então, B independe de A , pois: P  A | B  P  A  B  P( B)  P  A | B  P( B)  P  A     P( B) P( A) P( A) P( A) Em resumo, se A independe de B , então, B independe de A e além disso, temos que: P  A  B   P ( A)  P ( B | A)  P ( A)  P ( B )    P( B) Isso sugere a definição: Se dois eventos A e B são chamados independentes se: P  A  B   P( A)  P( B )  Exemplo 02: Imagine que são lançadas duas moedas. É claro que o fato de sair cara numa moeda não influi sobre o fato de sair cara na outra moeda. Então, esses eventos são independentes. Consequentemente, a probabilidade de ocorrerem duas caras, quando se lançam duas moedas é dada por: 1 1 1 P  A  B   P( A)  P( B)  P  A  B     2 2 4 P  A  B   0, 25 100  P  A  B   25% 49 Estatística Básica 9.4. Teorema da soma Todos os resultados possíveis de uma experiência podem ser representados por pontos no espaço, denominado de espaço amostral, e como já mencionamos, pode ser indicado por  . Assim, se considerarmos um experimento aleatório, como por exemplo, “o lançamento de um dado”, teremos como espaço amostral,   1, 2,3, 4,5, 6 . Para facilitar o entendimento, poderíamos representar este espaço amostral por um diagrama. Qualquer subconjunto de  é um evento, que podemos indicar por E . A cada evento, E podemos associar um número não negativo menor ou igual a 1, definido como a relação entre o número de elementos de E e o número  . Esse número como já mencionamos em tópicos anteriores é a probabilidade de ocorrer o evento E , assim, teremos: PE  n( E ) n( E ) , portanto, P( E )   1 , logo, 0  P ( E )  1 n ( ) n ( ) Se no exemplo do lançamento do dado, se chamarmos de E1 a ocorrência do número 2, sua probabilidade será: P  E1   n( E1 ) 1  P  E1   n( ) 6 Utilizando o mesmo exemplo, se chamarmos de E2 a ocorrência do número 4, sua probabilidade será: P  E2   n( E2 ) 1  P  E2   n ( ) 6 No entanto, poderíamos questionar: “Qual seria a probabilidade de ocorrer o número 2 ou o número 4 no lançamento desse dado? Para responder a esta questão vamos, observar o diagrama abaixo: Observe que estes eventos são mutuamente exclusivos, ou seja, a ocorrência de um impossibilita (exclui) a ocorrência do outro. 50 Estatística Básica Para calcular a probabilidade da reunião desses dois eventos, consideraremos que se E1 e E2 podem ocorrer ao mesmo tempo, a probabilidade de ocorrer E1 ou E2 é dada pela probabilidade de ocorrer E3 , mais a probabilidade ocorrer E4 . Podemos escrever esta situação da seguinte forma: P  A  B   P( A)  P( B) Considerando o exemplo citado acima, teremos a seguinte situação:   1, 2,3, 4,5, 6  n     6 E1  2  n  E1   1 E2  4  n  E2   1 P  E1  E2   P( E1 )  P( E2 )  P  E1  E2   P  E1  E2   n( E1 ) n( E2 )  n ( ) n (  ) 1 1 2   P  E1  E2   6 6 6 Vamos supor agora, outra situação envolvendo dois eventos. Um evento E3 caracterizado pela ocorrência de resultados menores que 5 e um evento E4 caracterizado pela ocorrência de números pares. Neste caso, vamos observar o diagrama abaixo: Observe que os eventos não são mutuamente exclusivos, ou seja, a ocorrência de um não impossibilita a ocorrência do outro, pois, há dois elementos comuns entre estes eventos, ou seja, o número 2 e o número 4. Para calcular a probabilidade da reunião desses dois eventos, temos que considerar o fato de que existirem elementos comuns entre eles. Portanto, se E3 e E4 podem ocorrer ao mesmo tempo, a probabilidade de ocorrer E3 ou E4 é dada pela probabilidade de ocorrer E3 , mais a probabilidade de ocorrer E4 , menos a probabilidade de ocorrer E3 e E4 . Podemos escrever esta situação da seguinte forma: P  A  B   P( A)  P( B)  P  A  B  51 Estatística Básica Considerando o exemplo citado acima, teremos a seguinte situação:   1, 2,3, 4,5, 6  n     6 E3  1, 2,3, 4  n  E3   4 E4  2, 4,6  n  E4   3 E3  E4  2, 4  n  E3  E4   2 P  E3  E4   P( E3 )  P( E4 )  P  E3  E4  P  E3  E4   n( E3 ) n( E4 ) n( E3  E4 )   n (  ) n ( ) n ( ) P  E3  E4   4 3 2 5    P  E3  E4   6 6 6 6 52 Estatística Básica CAPÍTULO 10 DISTRIBUIÇÕES DE PROBABILIDADE Neste capítulo serão estudados alguns modelos teóricos que pode ser adequados a uma série de problemas práticos. Estes modelos envolvem parâmetros cujo conhecimento é necessário para cálculos de distribuição de probabilidade. 10.1. Variável aleatória Muitos experimentos aleatórios produzem resultados não-numéricos. Antes de analisá-los, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de associação de um valor numérico a cada ponto do espaço amostral. Portanto, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos probabilísticos. Veremos que uma variável aleatória tem um número para cada resultado de um experimento e que uma distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento. Vamos supor a existência de um espaço amostral  e que a cada ponto amostral seja atribuído um número. Fica, então, definida uma função chamada variável aleatória, indicada por uma letra maiúscula, sendo seus valores indicados por letras minúsculas. Por definição, variável aleatória, é uma função que associa a cada ponto amostral de  , um valor real. 10.2. Função de probabilidade É uma função matemática que associa probabilidades a valores assumidos pela variável aleatória X . Existe uma diferença para esta função para o caso em que a variável aleatória em estudo seja discreta ou contínua.  Variável aleatória discreta: A variável aleatória X é uma variável aleatória discreta, se o conjunto de valores que X pode assumir é um conjunto finito ou um conjunto infinito enumerável. Como X pode assumir certos valores com dadas probabilidades, ele é freqüentemente denominado variável aleatória discreta, ou seja, transforma espaço amostral não numérico em espaço amostral numérico. 53 Estatística Básica O número de pontos do espaço amostral de um dado experimento pode ser finito ou infinito. Se o espaço amostral é finito, então os eventos são enumeráveis e a variável a ele associada deve permitir a contagem dos elementos nele contidos. Neste caso, a variável aleatória é dita “discreta” ou “enumerável”. Exemplos: Número de jogadores de um time de futebol; número de torcedores no estádio; número de gols marcados na partida.  Variável aleatória contínua: Como já foi dito, o número de pontos do espaço amostral de um dado experimento pode ser finito ou infinito. Se o espaço amostral é infinito, então a contagem do seu número de elementos não é possível por nenhum meio. Neste caso, a variável aleatória é dita “contínua”, indicando que ela pode assumir qualquer valor dentro do seu intervalo de validade. Exemplos: tempo de duração de um jogo; peso e velocidade da bola na hora do gol. 10.3. Distribuição de probabilidade Seja X uma variável aleatória que pode assumir os valores x1 , x2 , x3 ,..., xn . A cada valor de xi correspondem pontos do espaço amostral. Associamos, então, a cada valor xi a probabilidade pi de ocorrência de tais pontos no espaço amostral. Assim temos que: pi  1 Os valores x1 , x2 , x3 ,..., xn e seus correspondentes p1 , p2 , p3 ,..., pn definem uma distribuição de probabilidade. Para melhor compreensão destes conceitos, vejamos a um exemplo.  Exemplo: Seja E o experimento: “lançamento simultâneo de duas moedas”, e sejam X ”o número de caras obtidas” e    K , K  ,  K , C  ,  C , K  ,  C , C  , representando o espaço amostral relativo ao experimento. Vejamos a tabela mostrada abaixo: Lançamento de duas moedas PX  Ponto amostral X K, K  2 1 1 1   2 2 4 K,C 1 1 1 1   2 2 4 C, K  1 1 1 1   2 2 4 C, C  0 1 1 1   2 2 4    1 1 2     4 4 4  54 Estatística Básica Logo, podemos escrever: Lançamento de duas moedas PX  Número de caras ( X ) 1 2 4 2 1 4 1 0 4 1  Os valores assumidos por X , e suas probabilidades associadas, podem ser expressas por uma regra ou uma relação, que é chamada de função de probabilidade, referida também como distribuição de probabilidade da variável aleatória X . Os valores xi  i  1, 2,3,..., n  formam o domínio da função e os valores pi  i  1, 2,3,..., n  , o seu conjunto imagem. Essa função assim definida é representada por: P  X  xi  Portanto, a função P  X  xi  , determina a distribuição de probabilidade da variável aleatória X . 10.4. Binômio de Newton  Fatorial: Chama-se fatorial de um número natural n > 1 e se indica por n! ao produto dos n fatores decrescentes de n até 1. Observações: n! lê-se n fatorial; por definição: 0! = 1 e 1! = 1 Exemplos: 1. Calcule: a) 5! = 5.4.3.2.1 = 120 b) 4! = 4.3.2.1 = 24 c) 3!.2! = (3.2.1).(2.1) = 12 55 Estatística Básica d) 5! 5.4.3. 2. 1 = 60 = 2! 2 .1 e) 8! 8.7.6.5! = 336 = 5! 5! 2. Simplifique: a) n! n(n  1)( n  2 )!   n(n  1) (n  2)! ( n  2 )! b) n(n  1)! n( n  1 )! n   (n  2)! (n  2)( n  1 )! n  2 c) n! n( n  1 )!  n (n  1)! ( n  1 )! d) (n  2)! (n  2)(n  1)n( n  1 )!  (n  2)(n  1)n  (n  1)! ( n  1 )! e) n! n(n  1)( n  2 )! n(n  1)   2!(n  2)! 2 2!( n  2 )!  Números binomiais: Chama-se número binomial de classe r do número n , onde n e r são números naturais e r  n , a expressão: n n!    r  r ! n  r  ! Onde: n ― é o numerador do número binomial r ― é denominador do número binomial Exemplos: 1. Calcule: a) b) c) 56 Estatística Básica 2. Mostre que: a) 8 8     5   3 8 8! 8! 8.7.6. 5! 8.7.6 8.7.6 336     56     3! 3.2.1 6 5! .3!  5  5! 8  5  ! 5!.3! 8 8! 8! 8.7.6. 5! 8.7.6 8.7.6 336     56     3! 3.2.1 6 3!. 5!  3  3! 8  3 ! 3!.5! b) 10  10     3  7  10  10! 10! 10.9.8. 7! 10.9.8 10.9.8 720     120     3! 3.2.1 6 3!. 7!  3  3!10  3 ! 3!.7! 10  10! 10! 10.9.8. 7! 10.9.8 10.9.8 720     120     3! 3.2.1 6 7!.3!  7  7!10  7 ! 7!.3! Observação: Esses números binomiais são chamados complementares, ou seja, mesmo numerador ( n ) e a soma dos denominadores ( r ) é igual a n . 10.5. Distribuição Binomial A distribuição Binomial constitui uma extensão da distribuição de Bernoulli, sendo aplicada em problemas, nos quais um experimento de Bernoulli é realizado um número de vezes preestabelecido. Cada uma destas realizações é denominada prova. É a distribuição adequada quando os pontos do espaço amostral podem ser agrupados em duas classes ou categorias mutuamente excludentes, às quais se atribuem os nomes genéricos de “sucesso” e “insucesso”, indistintamente. Outra forma de caracterizar a distribuição Binomial é dizer que ela é a distribuição aplicável quando o experimento atende às condições típicas do processo de amostragem de Bernoulli, que são as seguintes: a) O experimento deve ser repetido, nas mesmas condições, um número finito de vezes, ou seja, n vezes; b) As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas; c) Em cada prova deve aparecer um dos dois possíveis resultados, ou seja, sucesso ( p ) ou insucesso ( q ). d) No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q do insucesso ( q  1  p ), manter-se-ão constantes. 57 Estatística Básica Utilizando a distribuição binomial, resolveremos problemas do tipo: Determinar a probabilidade de se obterem k sucessos em n tentativas. Sabemos que, quando da realização de um experimento qualquer em uma única tentativa, se a probabilidade de realização de um evento é p (sucesso), a probabilidade de não realização desse mesmo evento é q (insucesso), assim, temos que: q  1  p . Vamos considerar, agora, uma situação em que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas, é dada pela função: n f ( X )  P( X  k )     p k  q nk k  Onde: P ( X  k ) ― Probabilidade de que o evento se realize k vezes em n provas; p ― Probabilidade de que o evento se realize em uma só prova (sucesso); q ― Probabilidade de que o evento não se realize no decurso dessa prova (insucesso); n! n ― Coeficiente binomial de n sobre k, igual a .   k ! n  k  ! k  Essa função denominada lei binomial, define a distribuição binomial. O nome binomial vem do fato de que a função mostrada acima, ser o termo geral do desenvolvimento do binômio de Newton.  Exemplos: 1. Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 “caras” nessas 5 provas. Resolução: Número de provas: n  5 Número de sucessos: k  3 Probabilidade de “obter cara” numa só prova: p  Probabilidade de “não obter cara” numa 1 (sucesso) 2 só prova: q 1 , 2 ou seja, 1  1 q  (1  p )  q  1    q  (insucesso), então temos que: 2  2 58 Estatística Básica 3 53 3 2  n  k nk 5  1   1   5  1   1  P( X  k )     p  q  P( X  3)                   k  3  2   2   3  2   2  5! 1   P( X  3)  3!(5  3)!  2  P( X  3)  3 2  1  5.4. 3! 1 1 5.4. 3! 1 1         3!  2! 8 4 3!  2.1 8 4 2 20 1 1 20 5     P( X  3)  2 8 4 64 16 Em porcentagem temos que: P( X  3)  5  100  0,3125  100  P( X  3)  31, 25% 16 2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos. Resolução: n  6; k  4; p  1 1 2 ; q  1  3 3 3 Obs.: Note que pode haver três resultados possíveis, ou seja, vitória do time A (sucesso), vitória do time B (insucesso) e empate entre A e B (insucesso). Então, temos que: 4 64 4 2  n  k nk 6  1   2  6  1   2  P( X  k )     p  q  P( X  4)                   k   4  3   3   4  3   3  4 2 6!  1   2  6.5. 4! 1 4 30 1 4      P( X  4)       4! 6  4 !  3   3  4!  2! 81 9 2 81 9 P( X  4)  30 1 4 120 20     P( X  4)  2 81 9 1458 243 Em porcentagem temos que: P( X  4)  20  100  0,0823  100  P( X  3)  8, 23% 243 59 Estatística Básica 3. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contém 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo: a) Nenhuma peça defeituosa; b) Uma peça defeituosa. a) Resolução: Nenhuma peça defeituosa. Portanto, estamos interessados em encontrar P ( X  k )  p ( X  0) , ou seja, 0 sucesso. n  12 (número de repetições independentes) k  0 (considerando peças defeituosas como sucesso, queremos 0 sucesso). p 10  0,10 (10 % de peças defeituosas – sucesso) 100 q 90  0,90 (90% de peças boas – insucesso) 100 Então, temos que: n 12  0 12  0 P( X  k )     p k  q n  k  P( X  0)      0,10    0,90  k  0  12  12! 0 12 0 12 P( X  0)      0,10    0,90     0,10    0,90  0!12  0  ! 0  P( X  0)  12! 1 0, 2824  11 0, 2824  P( X  0)  0, 2824 0! 12! Em porcentagem temos que: P ( X  0)  0, 2824 100  P ( X  0)  28, 24% b) Resolução: Uma peça defeituosa. Portanto, estamos interessados em encontrar P ( X  k )  p ( X  1) , ou seja, 1 sucesso. n  12 (número de repetições independentes) k  1 (considerando peças defeituosas como sucesso, queremos 1 sucesso). 60 Estatística Básica p 10  0,10 (10 % de peças defeituosas – sucesso) 100 q 90  0,90 (90% de peças boas – insucesso) 100 Então, temos que: n 12  1 12 1 P( X  k )     p k  q n  k  P( X  1)      0,10    0,90  k  1  12  12! 1 11 1 11 P( X  1)      0,10    0,90     0,10    0,90  1!12  1 ! 1  12.11! P( X  1)   0,10  0,3138  12  0,10  0,3138  P( X  1)  0,3766 1! 11! Em porcentagem temos que: P ( X  1)  0,3766 100  P ( X  1)  37, 66% 61 Estatística Básica REFERÊNCIAS COSTA, Sérgio F. Introdução Ilustrada à Estatística. (com muito humor!). São Paulo: Habra, 1988. CRESPO, Antonio A. Estatística Fácil. São Paulo: Saraiva, 1988. FIGUEIRA, Sebastião de P.; COELHO, Ulysses F.; NEVES, Maria C. B. Estatística básica. Rio de Janeiro: Ed. Senac, 1998. HAZZAN, Samuel. Fundamentos de matemática elementar. Vol 5. Combinatória e Probabilidade. 7. Ed. São Paulo: Atual, 2004. IEZZI, Gelson; HAZZAN, Samuel.; DEGENSZAJN, David. Fundamentos de matemática elementar. Vol 11. Estatística descritiva. 1. Ed. São Paulo: Atual, 2004. NAZARETH, Helenalda R. de S. Curso básico de estatística. 12. Ed. São Paulo: Ática, 2009. SILVA, Jorge D.; FERNANDES, Valter dos Santos. Matemática. Coleção Horizontes. São Paulo: IBEP, 2000. VIEIRA, Sonia. Introdução a Bioestatística. São Paulo: Campos, 2004. VIEIRA, Sonia.; HOFFMANN, Rodolfo. Elementos de estatística. 2. Ed. São Paulo: Atlas, 1990. 62 Estatística Básica ATIVIDADES ATIVIDADE 1 Uma equipe da área de saúde de um determinado município fez uma pesquisa com alguns moradores de uma determinada comunidade, onde foram identificados alguns casos de pessoas com problemas de saúde por causa da obesidade. Foram selecionadas 20 pessoas desta população, as quais foram submetidas a vários testes clínicos, além disso, foram obtidas informações sobre o IMC dessas pessoas, as quais podem ser observadas na tabela ao lado. Para podermos analisar de forma mais precisa as informações sobre este grupo de pessoas pesquisado devemos construir uma tabela de distribuição de freqüência com intervalos de classes dos dados apresentados na tabela primitiva. Esta tabela deverá possuir as seguintes informações sobre os intervalos de classes definidos: a) b) c) d) e) f) Freqüência simples (fi); Ponto médio (xi); Freqüência simples relativa (fri); Freqüência acumulada (Fi); Freqüência acumulada relativa (Fri); Títulos e fontes da tabela. 63 Estatística Básica ATIVIDADE 2 Os alunos de uma turma do curso de Química Industrial da de uma determinada faculdade, fizeram uma pesquisa para identificar as alturas (em centímetros), dos alunos da sua sala de aula. Após terem tabulados os dados que foram coletados, os alunos elaboraram uma tabela primitiva que foi reproduzida ao lado. Considerando as informações contidas nesta tabela e os conhecimentos que vocês adquiriram nas aulas de Estatística, execute os seguintes procedimentos: a) Elabore uma tabela de distribuição de freqüências com intervalos de classes. A tabela deverá possuir uma estrutura padrão, ou seja, o título da tabela, a fonte dos dados, os títulos das colunas e demais dados que julgar necessários. b) Calcule também, para a tabela elaborada anteriormente, as seguintes medidas de posição: A média aritmética e a moda. 64 Estatística Básica ATIVIDADE 3 O supervisor do departamento de recursos humanos de uma determinada indústria química, na expectativa de elaborar um plano de melhoria das condições de trabalho dos funcionários, solicitou à sua secretária que elaborasse uma pesquisa sobre os 25 funcionários que atuam no laboratório de química da empresa e que já tiveram algum caso de acidente envolvendo a manipulação de produtos químicos. Para facilitar seu trabalho, a secretária decidiu organizar os dados pesquisados em uma tabela, considerando a faixa etária desses funcionários, para que fosse possível analisar informações. Considerando que esta organização tenha sido feita conforme mostrada na tabela primitiva apresentada ao lado, complete o trabalho desta secretária, construindo uma tabela com distribuição de freqüência em intervalos de classes. A tabela a ser elaborada deverá possuir os seguintes dados: a) b) c) d) e) f) Freqüência simples (fi); Freqüência simples relativa (fri); Freqüência acumulada (Fi); Freqüência acumulada relativa (Fri); Ponto médio dos intervalos de classe (xi); Títulos, totais, cabeçalhos e fontes. Após ter elaborado a tabela mencionada acima, crie um gráfico de histograma e um de polígono (podem ser sobrepostos) para representar os dados desta tabela. 65 Estatística Básica ATIVIDADE 4 Uma instituição de ensino propôs a um grupo de 25 alunos de seu corpo discente que fizessem uma redação sobre o tema “Aquecimento Global”. Após ter sido feita a correção destas redações, os professores elaboraram uma tabela com as notas obtidas por estes alunos. A tabela mostrada ao lado reproduz a tabela criada pelos professores, no entanto, como se trata de uma tabela primitiva, não é possível fazer análises mais completas sobre o desempenho desses alunos. Assim, foi pedido ao professor de Estatística que elaborasse uma tabela com distribuição de freqüência em intervalos de classes baseados nos dados da tabela primitiva. O professor, então, solicitou ajuda aos seus alunos na elaboração desta tabela e propôs também que fizessem algumas análises que seriam importantes para que a diretoria da escola pudesse ter uma idéia do desempenho dos alunos que participaram da redação. Você, como aluno da disciplina de Estatística, ajude na elaboração desta tabela, que deverá possui os seguintes dados: a) Intervalos de classe com as notas obtidas pelos alunos que fizeram a redação, título da tabela, linha de totais, cabeçalhos e fontes; b) Colunas de freqüência simples absoluta (fi), freqüência simples relativa (fri), freqüência acumulada (Fi), freqüência acumulada relativa (Fri), ponto médio dos intervalos de classe (xi); c) Calcule também para a tabela elaborada, a média aritmética, a moda e a mediana. 66 Estatística Básica ATIVIDADE 5 Um concurso público para provimento de vaga de professor de Química, para atuar nas escolas da região de Campinas, teve 550 participantes. Como este número foi bastante elevado, decidiu-se que um dos critérios que seria utilizado para casos de desempate, seria o tempo de serviço que cada um desses participantes teria, atuando como professor na rede de ensino. Para analisar estas informações, o comitê organizador do concurso elaborou uma tabela, com intervalos de classes que mostrasse o tempo de atuação em anos de trabalho, como professor, desse grupo de candidatos. Assim, as informações foram tabuladas conforme mostrado na tabela ao lado. Usando seus conhecimentos de Estatística, e considerando os dados desta tabela, você deverá completá-la com algumas informações para que possa responder às seguintes questões: a) Qual a quantidade de candidatos que possuem tempo de serviço entre 8 e 12 anos, exclusive? b) Qual a quantidade de candidatos que possuem tempo de serviço entre 0 e 16 anos, exclusive? c) Qual a porcentagem de candidatos que possuem tempo de serviço entre 16 e 20 anos, exclusive? d) Qual a porcentagem de candidatos que possuem tempo de serviço entre 0 e 12 anos, exclusive? 67 Estatística Básica ATIVIDADE 6 Um professor de estatística de uma determinada faculdade, na expectativa de mostrar aos seus alunos do curso de Química Industrial os riscos que podem existir quando da manipulação indevida de alguns produtos químicos, solicitou que estes alunos fizessem uma pesquisa. Deveriam ser pesquisadas algumas pessoas, para saber se estas já haviam tido algum caso de acidente ao utilizar o Hidróxido de Sódio (soda cáustica). Dessas pessoas, foram selecionadas um grupo de 20 pessoas que tiveram pelo menos um caso de acidente pelo uso indevido deste produto químico. O professor então, decidiu elaborar uma tabela com distribuição de frequência em intervalo de classes considerando as idades dessas pessoas, para que pudessem ser feitas algumas análises e discussões sobre os resultados obtidos. Considerando que a tabela apresentada ao lado seja uma reprodução do trabalho realizado por esse professor e o seu grupo de alunos, calcule a média de idade dos casos de acidente pelo uso indevido de Hidróxido de Sódio do grupo de pessoas pesquisadas. 68 Estatística Básica ATIVIDADE 7 Num processo de seleção para o cargo de Químico de uma determinada empresa, são efetuadas quatro provas a fim avaliar os candidatos. Para calcular a média final de cada candidato, deve-se levar em consideração que as provas têm graus de importância diferentes, determinados pelas ponderações mostradas na tabela ao lado. Supondo que a candidata Érica, tenha participado do processo de seleção e tenha obtido para cada uma das provas as seguintes notas: 6,75 em Português; 7,50 em Matemática; 4,25 em Física e 6,75 em Química. Considerando estas informações, qual terá sido a média final dessa candidata? a) b) c) d) e) 5,85 6,25 6,35 6,15 5,75 69 Estatística Básica ATIVIDADE 8 Os dados apresentados em tabela de distribuição de frequências com intervalos de classes, também podem ser representados em gráficos do tipo histogramas. Considerando o gráfico de histograma ao lado, qual das tabelas de distribuição de frequência mostradas abaixo, pode melhor representar este gráfico? 70 Estatística Básica ATIVIDADE 9 Os dados apresentados na tabela abaixo referem-se às informações das estaturas de um grupo de 40 alunos do curso de Química Industrial de uma determinada faculdade. Quando estruturamos uma tabela utilizando a distribuição de frequência, ajuda-nos a responder algumas questões de forma mais fácil. Considerando a referida tabela e as afirmações apresentadas na sequência, qual das alternativas representa a melhor resposta. I. Existem 24 pessoas que possuem estatura entre 150cm, inclusive e 162cm. II. Podemos identificar que 80% dos alunos tem menos de 166cm de estatura. III. Podemos verificar que 20% dos alunos tem estatura entre 158cm, inclusive e 162cm. a) b) c) d) e) I, II e III estão corretas. Somente II e III estão corretas. Somente I e III estão corretas. Somente I e II estão corretas Todas estão incorretas. 71 Estatística Básica ATIVIDADE 10 Quase um século após ter sido descoberta, a Doença de Chagas constitui, ainda hoje, um grave problema de saúde pública no Brasil e na América Latina. Estima-se que 16 a 18 milhões de pessoas estejam infectadas pelo Trypanosoma cruzy. Atualmente, no Brasil, o número de infectados situa-se em torno de 3,5 milhões. Destes aproximadamente 600 mil residem no estado de Minas Gerais. Nota-se que na região do Norte de Minas, onde se localiza a cidade de Montes Claros, existe uma endemicidade da Doença de Chagas, conforme trabalho de pesquisa efetuada em 2005, por estudantes do 10° período de medicina da Universidade Estadual de Montes Claros. Podemos observar na tabela apresentada acima a distribuição por faixa-etária dos portadores de Doença de Chagas, no Programa de Saúde da Família – Tancredo Neves, da cidade de Montes Claros. Com os dados desta tabela, propomos que você complete o trabalho desta equipe, calculando as seguintes informações: a) A média aritmética da distribuição b) A moda da distribuição c) A mediana da distribuição 72 Estatística Básica ATIVIDADE 11 Considerando o gráfico apresentado no texto, é possível elaborar uma tabela com distribuição de frequência em intervalos de classes dos valores anuais gastos com educação por aluno dos 33 países. Portanto, complete a tabela de distribuição abaixo, considerando o número de países que se enquadram dentro de cada intervalo de classe. Tendo elaborado a tabela acima, responda às seguintes perguntas: a) Do total de países, constantes da tabela, quantos investem anualmente menos de 7000 Euros em educação por aluno? b) Qual a porcentagem de países que investem anualmente entre 1000 Euros e 5000 Euros, exclusive, em educação por aluno? c) Qual a porcentagem de países que investem anualmente entre 11000 Euros e 13000 Euros, exclusive, em educação por aluno? 73 Estatística Básica ATIVIDADE 12 Para resolver os problemas propostos nesta avaliação, considere os dados da tabela primitiva mostrada ao lado. Distribuição do tempo de internação, em dias, de 50 pacientes que sofreram acidentes graves no trabalho, em um dado hospital Obtenha um rol da tabela acima, classificando os dados em ordem crescente de valores. Calcule todos os dados a seguir e uma tabela com distribuição de freqüência em intervalos de classes. Se desejar poderá utilizar o modelo apresentado no final da página. a) Calcule a Amplitude Total (AT) do rol obtido acima. b) Determine o número de classe utilizando qualquer uma das regras conhecidas (regra prática ou regra de Sturges). c) Determine a amplitude das classes (h). d) Crie os intervalos de classes. e) Calcule a Freqüência Simples Absoluta (fi) de cada classe. f) Calcule a Freqüência Simples Relativa (fri) de cada classe. g) Calcule a Freqüência Acumulada Absoluta (Fi) de cada classe. h) Calcule a Freqüência Acumulada Relativa (Fri) de cada classe. i) Complete a tabela de distribuição de freqüência seguindo a regras para criação de tabelas, ou seja, utilizando os elementos: Título da tabela, cabeçalho, coluna indicadora, fonte, notas, etc. 74 Estatística Básica ATIVIDADE 13 Numa determinada cidade, foi feita uma pesquisa com 30 casais para saber qual a quantidade de filhos que eles possuiam. Após ter feita a tabulação dos dados coletados, elaborouse uma tabela contendo estas informaçõe. A tabela mostra abaixo, ilustra as informações tabuladas desta pesquisa. Considerando as informações mostradas nesta tabela, calcule para esta tabela: a) A amplitude total b) A variância c) O desvio padrão d) O coeficiente de variação Números de filhos de 30 casais. 75 Estatística Básica ATIVIDADE 14 Uma pesquisas feita por agentes de saúde de uma determinada cidade, pesquisou um grupo de 30 pessoas portadoras de deficiência física que era atendidas pelo posto de saúde de um determinado bairro. Após a tabulação dos dados pesquisados, foi elaborada uma tabela contendo informações sobre as idade dessas pessoas, para que fosse feito um trabalho de atendimento especial de acordo com algumas faixas etárias. Considerando os dados fornecidos pela tabela apresentada abaixo como sendo o resultado da pesquisa elaborada pelos agentes de saúde, calcule para esta tabela: a) A amplitude total b) A variância c) O desvio padrão d) O coeficiente de variação. Idade de pessoas com deficiência física 76 Estatística Básica ATIVIDADE 15 Considerando os dados apresentados na tabela ao lado, calcule para esta tabela: a) A amplitude total b) A variância c) O desvio padrão d) O coeficiente de variação. Peso, em gramas, de ratos da raça Wistar de 30 dias Ordem Peso 1 76,2 2 81,5 3 50,0 4 47,5 5 63,5 6 65,1 7 63,2 8 64,5 77 Estatística Básica ATIVIDADE 16 Considerando os dados apresentados na tabela ao lado, calcule para cada um dos itens (peso e comprimento): a) A amplitude total b) A variância c) O desvio padrão d) O coeficiente de variação. Observação: Peso em quilogramas e comprimento, em centímetros, de 10 cães Ordem Peso Comprimento 1 23,0 104 2 22,7 107 3 21,2 103 4 21,5 105 5 17,0 100 6 28,4 104 7 19,0 108 8 14,5 91 9 19,0 102 10 19,5 99 Não se podem comparar desvios padrões de peso e comprimento porque as unidades de medida são diferentes. Mas os coeficientes de variação podem ser comparados porque são adimensionais. 78 Estatística Básica ATIVIDADE 17 PROBABILIDADE 1. Um casal tem dois filhos. Qual é a probabilidade de: a) O primogênito ser homem? b) Os dois serem homens? c) Pelo menos um dos filhos ser homem? Resolução: 1 , ou seja, é de 50%, e que o sexo do segundo 2 filho não depende do sexo do primeiro. Então temos que: Suponha que a probabilidade de nascer menino é de a) A probabilidade de o primogênito ser homem é:   ( M , F ), ( M , M ), ( F , M ), ( F , F )  n     4 A  ( M , F ), ( M , M )  n  A  2 P( A)  n  A 2 1   n  4 2 P( A)  0,50 100  P( A)  50% b) A probabilidade de os dois filhos serem homens é:   ( M , F ), ( M , M ), ( F , M ), ( F , F )  n     4 A  ( M , F ), ( M , M )  n  A   2 B  ( M , F ), ( M , M )  n  B   2 São eventos mutuamente exclusivos, ou seja, a ocorrência de um impossibilita a ocorrência do outro. Neste exemplo, se ocorrer o evento A , não ocorrerá o evento B . Portanto, teremos a seguinte solução: 79 Estatística Básica P  A  B   P  A  P  B   P  A  B   P  A  B  n  A n  B   n  n  2 2 4 1   P  A  B   0, 25  100   4 4 16 4 P  A  B   25% c) A probabilidade de pelo menos um dos filhos ser homem é:   ( M , F ), ( M , M ), ( F , M ), ( F , F )  n     4 A  ( M , F )  n  A   1   B  ( M , M )  n  B   1 “Pelo menos um dos filhos ser homem.”  C  ( F , M )  n  C   1  D  ( F , F )  n  D   1 São quatro eventos possíveis, do quais os três primeiros atendem à característica “pelo menos um dos filhos ser homem”. Portanto, podemos calcular esta probabilidade da seguinte forma: n  A n  B  n C  P  A  P  B   P  C     n  n  n  1 1 1 3    4 4 4 4 P  A   P  B   P  C   0,75  100 P  A  P  B   P  C   P  A  P  B   P  C   75% 80 Estatística Básica ATIVIDADE 18 PROBABILIDADE Um grupo de 50 moças é classificado de acordo com a cor dos cabelos, e dos olhos de cada moça, segundo a tabela abaixo. Se você marca um encontro com uma dessas garotas, escolhida ao acaso, Cabelos Olhos Castanhos 9 Loira Azuis 17 Morena 4 14 Ruiva 3 3 a) Qual a probabilidade dela ser morena de olhos azuis? b) Qual a probabilidade dela ser morena ou ter olhos azuis? c) Qual a probabilidade dela ser loira? d) Suponha que esteja chovendo quando você encontra a garota. Seus cabelos estão completamente cobertos (deve ter feito “chapinha”), mas você percebe que ela tem olhos castanhos. Qual a probabilidade de que ela seja morena? 81 Estatística Básica ATIVIDADE 19 PROBABILIDADE A tabela abaixo fornece o número de estudantes matriculados por sexo e curso, numa determinada faculdade, no ano de 2009. Curso Química Industrial Sexo Masculino Feminino 30 52 Pedagogia 2 100 Biologia 132 120 Ao escolher um aluno, qual a probabilidade de o mesmo ser: a) Do sexo feminino ou do curso de Biologia? b) Do sexo masculino ou do curso de Pedagogia? c) Não se do curso de Química Industrial? d) Do sexo masculino e do curso de Química Industrial? 82 Estatística Básica ATIVIDADE 20 DISTRIBUIÇÃO BINOMIAL 1. Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda 5 (Resposta: ou 21, 25% ) 16 2. Jogando-se um dado 3 vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes 2 (Resposta: ou 22, 22% ). 9 3. Dois times de futebol A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A: a) Ganhar dois ou três jogos (Resposta: 400 ou 54,87% ). 729 b) Ganhar pelo menos um jogo (Resposta: 665 ou 91, 22% ). 729 4. A probabilidade de um atirador acertar o alvo é acertar exatamente 2 tiros? (Resposta: 2 . Se ele atirar 5 vezes, qual a probabilidade de 3 40 ou 16, 46% ) 243 5. Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles? (Resposta: 40 ou 9,84% ). 243 83 Estatística Básica Resolução: n  6; k  2; p  10 90  0,10 ; q   0,90 100 100 n 6 2 6 2 P( X  k )     p k  q n  k  P( X  2)      0,10    0,90  k   2 P( X  2)  6! 6.5. 4! 2 6 2 2 4   0,10    0,90     0,10    0,90  2! 6  2  ! 2! 4! P ( X  2)  30  0,01  0,6561  15  0,01  0,6561  P ( X  2)  0,098415 2 Em porcentagem temos que: P ( X  2)  0,098415 100  P ( X  2)  9,84% 84 Estatística Básica ATIVIDADE 21 DISTRIBUIÇÃO BINOMIAL 1. Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro-quente, determine a probabilidade de que: a) Todos queiram mostarda (Resposta: 55,78 %). b) Apenas um não queira mostarda (Resposta: 33,96 %). 2. Sabe-se que 4% das peças produzidas por certa máquina são defeituosas. Em um lote de 10 peças, calcular a probabilidade de: a) Exatamente 2 peças serem defeituosas (Resposta: 5,19%) b) Menos de 2 peças serem defeituosas (Resposta: 94,18%) 3. Numa empresa os funcionários com formação superior são classificados como “júnior” e “sênior”. Sabe-se que 20% do total pertence ao grupo “sênior”. Se são selecionados ao acaso 4 funcionários, qual a probabilidade de, no máximo, três pertencerem ao grupo “sênior”? (Resposta: 0, 9984). 4. Sabe-se que a probabilidade de ocorrer acidente de trabalho com um funcionário de uma empresa metalúrgica é de 10%. Qual a probabilidade de, no máximo, encontramos quatro que sofreram acidente de trabalho dentre seis funcionários selecionados? (Resposta: 0, 9999) 5. Suponha que a probabilidade de atingir o alvo é de 1 . Disparando-se 8 tiros no alvo, qual a 4 probabilidade de que o alvo seja atingido: a) Pelo menos duas vezes? (Resposta: 0, 63) b) No máximo uma vez? (Resposta: 0,37) 85