Transcript
APOSTILA DE ESTATÍSTICA DESCRITIVA
PROF. EDGAR NASCIMENTO
POTENCIAÇÃO E NOTAÇÃO CIENTÍFICA
Uma notação científica é escrita da seguinte forma:
Em outras palavras escrevemos o valor de uma grandeza como um número
compreendido entre um (1) e dez (10), multiplicado pela potência de dez
conveniente.
Observe que:
Se o valor for maior ou igual a dez o expoente do dez é positivo.
Ex.:
110 = 1,1 × 102
10 = 1 × 102
5001 = 5,001 × 103
Se o valor for menor de que 1, o expoente do dez é negativo.
Ex.:
0,11 = 1,1 × 10-1
0,00852 = 8,52 × 10-3
Se o valor for maior ou igual a um e menor do que 10, então podemos
escrever o número sem potência
de dez.
ORDEM DE GRANDEZA
Para encontramos a ordem de grandeza de um número, procedemos da seguinte
forma:
1. Escreva os números abaixo em notação científica:
0,00006=
0,00000000078=
1220000000=
6850000000=
23500000000=
0,0000468=
295000000000=
0,000555=
0,00000007245=
2. Resolva as potencias abaixo:
a.
b.
c.
d.
e.
f.
3. Calcule as potencias abaixo:
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
4. Resolva as expressões abaixo:
a. =
b. =
c. =
d. =
e. =
f. =
g. =
h. =
i. =
j. =
k. =
l. =
m. =
n. =
Radiciação
5. Simplifique os radicais abaixo:
2) Calcule:
6. O valor da expressão é:
a)1
b)2
c)3
d)4
e)5
7. O valor de é:
a)100
b)150
c)200
d)250
e)300
8. Ao resolver a expressão , encontramos qual valor:
9. Simplifique as expressões a – b ( 0
a- (a2 . b3)2 . (a3 . b2)3 =
b-=
c-[ ( a3 . b2 )2 ]3=
d-=
10. Calcule:
a- 3-1 b- (-2)-1 c-
-3-1 d- -( -3 )-1
e- f- g- ( 0,25
)-3 h- ( - 0,5 )-3
i- j- k-
11. Calcular o valor das expressões:
a- =
b- =
12. Classificar em verdadeiro(V) ou falso(F):
a- ( 53 )-2 = 5-6
b- 2-4 = 16
c- = 7-3
d- л1 + л –1 = 1
13. Simplificar as expressões:
a- =
b- =
c- =
REGRA DE TRÊS
1. Uma molécula de açúcar comum (sacarose) pesa 5,7x10-22g e uma de
água, 3,0x10-23g. Num copo de água com 180g, há quantas
moléculas? Em uma amostra de 11,4g de açúcar há quantas
moléculas?
2. Uma molécula de cloreto de sódio pesa 9,7x10-23g. Quantas
moléculas existem em 1KG de sal?
3. Uma bactéria tem massa aproximada de 0,000005 g, e seu
comprimento é mais ou menos 1,8x10-4 mm.
a) Escreva a massa da bactéria em notação científica.
b) Quantas bactérias precisaríamos "enfileirar" para obter 18 cm de
comprimento?
4. Dois carros partem juntos, a fim de dar voltas em torno de uma
pista de corrida. O carro mais rápido demora 3 minutos para
completar uma volta e o outro carro demora 5 minutos. Após
quanto tempo os carros irão se encontrar novamente?
5. Um trem, deslocando-se a uma velocidade média de 400 Km/h, faz
um determinado percurso em 3 horas. Em quanto tempo faria esse
mesmo percurso, se a velocidade utilizada fosse de 480 km/h?
1) Uma equipe de operários, trabalhando 8 horas por dia, realizou
determinada obra em 20 dias. Se o número de horas de serviço for
reduzido para 5 horas, em que prazo essa equipe fará o mesmo trabalho?
2) Em 8 horas, 20 caminhões descarregam 160m3 de areia. Em 5 horas,
quantos caminhões serão necessários para descarregar 125m3?
3) Dois pedreiros levam 9 dias para construir um muro com 2m de altura.
Trabalhando 3 pedreiros e aumentando a altura para 4m, qual será o
tempo necessário para completar esse muro?
4) Três torneiras enchem uma piscina em 10 horas. Quantas horas levarão
10 torneiras para encher 2 piscinas?
5) Uma equipe composta de 15 homens extrai, em 30 dias, 3,6 toneladas de
carvão. Se for aumentada para 20 homens, em quantos dias conseguirão
extrair 5,6 toneladas de carvão?
6) Vinte operários, trabalhando 8 horas por dia, gastam 18 dias para
construir um muro de 300m. Quanto tempo levará uma turma de 16
operários, trabalhando 9 horas por dia, para construir um muro de
225m?
7) Um caminhoneiro entrega uma carga em um mês, viajando 8 horas por dia,
a uma velocidade média de 50 km/h. Quantas horas por dia ele deveria
viajar para entregar essa carga em 20 dias, a uma velocidade média de
60 km/h?
8) Um atleta percorre um 20 km em 2h, mantendo o mesmo ritmo, em quanto
tempo ele percorrerá 30 km?
9) Quatro trabalhadores constroem uma casa em 8 dias. Em quanto tempo,
dois trabalhadores constroem uma casa?
10) Determine o número de tacos de 6cm de largura por 24cm de comprimento
necessários para assoalhar uma sala de 3,6m de largura por 4,2cm de
comprimento.
11) Uma caixa d'água comporta 360 litros e tem uma torneira que a enche em
15 horas e outra que a esvazia em 20 horas. Abrindo-se as duas
torneiras simultaneamente, qual o número de horas necessárias para
encher a caixa?
12) Um pátio retangular tem 1,8dam de comprimento e 75dm de largura. Para
pavimentar o pátio foram escolhidos ladrilhos quadrados de 25cm de
lado. Determine o número de ladrilhos gastos.
13) Determine o número de voltas que uma roda de 50dm de raio precisa dar,
para percorrer uma distância de 628km.
14) Uma lavoura de grãos com 100km2 de área plantada fornece uma produção
de 5 toneladas por hectare. Sabendo-se as máquinas usadas colheram
2000 toneladas por dia. Qual o tempo gasto para se fazer a colheita
desta lavoura?
15) Um trem, com velocidade de 48km/h, gasta 1 hora e 20 minutos para
percorrer certa distância. Para fazer o mesmo percurso a 60km/h o trem
gastaria
16) Uma turma de operários faz uma obra, cujo coeficiente de dificuldade é
0,2 em 8 dias. Em quantos dias a mesma turma faria outro trabalho, com
coeficiente de dificuldade 0,25?
17) Para fazer um determinado serviço, 15 homens gastam 40 dias; para
fazer o mesmo serviço em 30 dias quantos novos operários têm de ser
contratados
18) Numa viagem de automóvel, uma pessoa gastou 9 horas andando à
velocidade de 80km/h. Na volta, quanto tempo irá gastar, se andar com
velocidade de 100km/h?
19) As dimensões de um tanque retangular são 1,5m, 2,0m e 3,0m. Com uma
torneira de vazão10litros por minuto, qual o menor tempo gasto para
enchê-lo?
20) Se a massa de 1000cm3 de certo líquido é 3,75kg, qual a massa de
1,35m3 do mesmo líquido?
21) Trabalhando 10 horas por dia, certa máquina faz um trabalho em 240
dias. Se a mesma máquina funcionar 8 horas por dia, em quanto dias
fará o mesmo trabalho?
22) Um edifício projeta uma sombra de 12m no mesmo instante em que um
objeto de 2m de altura projeta uma sobra de 80cm. Calcule a altura do
edifício
23) Uma torneira enche um tanque de 100 litros em 1 hora, enquanto uma
segunda gasta 2 horas. As duas juntas encherão o tanque em quanto
tempo?
24) Para vender todos os ingressos de um cinema Aline gasta 15 minutos e
Junior 30 minutos. Trabalhando juntos, qual o tempo gasto para
venderem os ingressos?
25) Para escrever um texto, usando 54 letras por linha, foram necessárias
15 linhas. Quantas linhas serão necessárias para 30 letras em cada
linha?
26) Para fazer uma cerca, são necessários 80 postes distantes entre si de
2,5m. Quantos postes serão necessários, se a distância entre eles for
de 2m?
27) Uma vara de 5 m, colocada em posição vertical, projeta no chão uma
sombra de 3,5m. Calcule a altura de um prédio que, na mesma hora e o
mesmo local, projeta uma sombra de 12,6m.
28) Com 72kg de lã, faz-se uma peça de fazenda de 63m de comprimento.
Quantos kg de lã seriam necessários para fazer 84m da mesma fazenda?
29) Numa cidade, há 22410 estrangeiros. A razão entre o número de
habitantes é de 18 para 100. Quantos habitantes há na cidade?
Objeto da Estatística
Estatística é uma ciência exata que visa fornecer subsídios ao analista
para coletar, organizar, resumir, analisar e apresentar dados. Trata de
parâmetros extraídos da população, tais como média ou desvio padrão.
A estatística fornece-nos as técnicas para extrair informação de dados, os
quais são muitas vezes incompletos, na medida em que nos dão informação
útil sobre o problema em estudo, sendo assim, é objetivo da Estatística
extrair informação dos dados para obter uma melhor compreensão das
situações que representam.
Definições Básicas da Estatística
1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo
estudo seja possível da aplicação do método estatístico. São divididos em
três grupos:
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por
uma simples observação. A estatística dedica-se ao estudo desses fenômenos.
Fenômenos individuais: são aqueles que irão compor os fenômenos de massa.
Fenômenos de multidão: quando as características observadas para a massa
não se verificam para o particular.
2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima
sobre a qual iremos aplicar os métodos estatísticos.
3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos,
uma característica comum.
4) AMOSTRA: é uma parcela representativa da população que é examinada com o
propósito de tirarmos conclusões sobre a essa população.
5) PARÂMETROS: São valores singulares que existem na população e que servem
para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a
população.
6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso
da amostra.
7) ATRIBUTO: quando os dados estatísticos apresentam um caráter
qualitativo, o levantamento e os estudos necessários ao tratamento desses
dados são designados genericamente de estatística de atributo.
8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um
fenômeno.
Variável Qualitativa: Quando seus valores são expressos por atributos
Variável Quantitativa: Quando os dados são de caráter nitidamente
quantitativo, e o conjunto dos resultados possui uma estrutura numérica,
trata-se, portanto da estatística de variável e se dividem em:
Variável Discreta ou Descontínua: Seus valores são expressos geralmente
através de números inteiros não negativos. Resulta normalmente de
contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística
econômica no 1º semestre de 1997: mar = 18, abr = 30, mai = 35 , jun = 36.
Variável Contínua: Resulta normalmente de uma mensuração, e a escala
numérica de seus possíveis valores corresponde ao conjunto R dos números
Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois
limites. Ex.: Quando você vai medir a temperatura de seu corpo com um
termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao
dilatar-se, passará por todas as temperaturas intermediárias até chegar à
temperatura atual do seu corpo.
Planejamento para Coleta e Análise de Dados
O processo deve incluir:
1. planejamento cuidadoso da coleta de dados;
2. análise de dados para tirar conclusões estatísticas e
3. transição para a resposta ao problema técnico original.
Os passos-chave são:
1. Coletar informações anteriores suficientes para traduzir o problema de
engenharia em problema específico que possa ser avaliado por métodos
estatísticos;
2. Planejar a coleta de dados:
A. Determinar o tipo de dados necessários – quantitativos (mais custo, mais
útil) e qualitativos;
B. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis
ao presente problema;
C. Se o problema exigir uma avaliação de várias decisões alternativas,
obter informações sobre as conseqüências econômicas de uma decisão errada.
d. Se o problema exigir a estimação de um parâmetro, definir a precisão
necessária para a estimativa;
e. Determinar se o erro de medição é grande o suficiente para influenciar o
tamanho calculado da amostra ou o método da análise de dados;
f. Definir as suposições necessárias para calcular o tamanho da amostra
exigido;
g. Calcular o tamanho da amostra necessário considerando a precisão
desejada do resultado, erro amostral, variabilidade dos dados, erros de
medição e outros fatores;
h. Definir quaisquer requisitos para preservar a ordem das medições quando
o tempo for um parâmetro chave;
i.Determinar quaisquer requisitos para coletar dados em grupos definidos –
diferentes condições a serem avaliadas;
j. Definir o método de análise de dados e quaisquer hipóteses necessárias;
k.Definir os requisitos para quaisquer programas de computador que venham a
ser necessários.
Coletar dados:
a. Usar métodos para assegurar que a amostra é selecionada de forma
aleatória;
b. Registrar os dados e também as condições presentes no momento de cada
observação;
c. Examinar os dados amostrais para assegurar que o processo mostra
estabilidade suficiente para se fazer previsões válidas para o futuro.
4. Analisar os dados:
a. Selecionar os dados;
b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar
atitudes corretivas (novas observações);
c. Aplicar técnicas estatísticas para avaliar o problema original;
d. Determinar se dados e análises adicionais são necessários;
e. Realizar "análises de sensibilidade" variando estimativas amostrais
importantes e outros fatores na análise e observando o efeito sobre as
conclusões finais.
5. Rever as conclusões da análise de dados para determinar se o problema
técnico original foi avaliado ou se foi modificado para se enquadrar nos
métodos estatísticos.
6. Apresentar os resultados:
a. Estabelecer as conclusões de forma significativa, enfatizando os
resultados nos termos do problema original, e não na forma dos índices
estatísticos usados na análise;
b. Apresentar graficamente os resultados quando apropriado. Usar métodos
estatísticos simples no corpo do relatório e colocar as análises complexas
em um apêndice.
7. Determinar se as conclusões do problema específico são aplicáveis a
outros problemas ou se os dados e cálculos poderiam ser úteis para outros
problemas.
DISTRIBUIÇÃO DE FREQÜENCIAS
É uma ferramenta estatística apropriada para a apresentação de grandes
massas de dados numa forma que torna mais clara a tendência central e a
dispersão dos valores ao longo da escala de medição, bem como a freqüência
relativa de ocorrência dos diferentes valores.
Quando da análise de dados, é comum procurar conferir certa ordem aos
números tornando-os visualmente mais amigáveis. O procedimento mais comum é
o de divisão por classes ou categorias, verificando-se o número de
indivíduos pertencentes a cada classe.
É um tipo de tabela que condensa uma coleção de dados conforme as
freqüências (repetições de seus valores).
Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que
não foram numericamente organizados. É difícil formarmos uma idéia exata do
comportamento do grupo como um todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58,
60, 51
ROL: Tem-se um rol após a ordenação dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58,
60, 60
Distribuição de freqüência sem intervalos de classe: É a simples
condensação dos dados conforme as repetições de seus valores. Para uma
tabela de tamanho razoável esta distribuição de freqüência é inconveniente,
já que exige muito espaço. Veja exemplo abaixo:
Tabela 1
"Dado"Freqüên"
"s "cia "
"41 "3 "
"42 "2 "
"43 "1 "
"44 "1 "
"45 "1 "
"46 "2 "
"50 "2 "
"51 "1 "
"52 "1 "
"54 "1 "
"57 "1 "
"58 "2 "
"60 "2 "
"Tota"20 "
"l " "
Distribuição de freqüência com intervalos de classe: Quando o tamanho da
amostra é elevado é mais racional efetuar o agrupamento dos valores em
vários intervalos de classe.
Tabela 2
"Classes "Freqüên"
" "cias "
"41 "7 "
""-------" "
"45 " "
"45 "3 "
""-------" "
"49 " "
"49 "4 "
""-------" "
"53 " "
"53 "1 "
""-------" "
"57 " "
"57 "5 "
""-------" "
"61 " "
"Total "20 "
2.1 Elementos de uma Distribuição de Freqüência com classes
CLASSE: são os intervalos da variável simbolizada por i e o número total de
classes simbolizada por k. Ex: na tabela anterior k=5 e 49 "------- 53 é a
3ª classe, onde i=3. Para a construção de uma tabela a partir de um dado
bruto calcularemos o k através da Regra de Sturges" k=1+3,3logn ou k=(n
(para n<100).
LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o
limite inferior de classe (li) e o maior número, limite superior de classe
(Ls). Ex: em 49 "--- 53 Li3= 49 e Ls3= 53. O símbolo "--- representa um
intervalo fechado à esquerda e aberto à direita. O dado 53 não pertence à
classe 3 e sim a classe 4 representada por 53 "--- 57.
AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o
limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na
tabela anterior a= 53 - 49 = 4. Obs: Na distribuição de freqüência c/
classe o c será igual em todas as classes. Para a construção de uma tabela
a partir de um dado bruto temos: a=Ls-Li/K
AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o valor máximo e o
valor mínimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60 -
41 = 19.
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas
partes iguais. Ex: em 49 "------- 53 o ponto médio x3 = (53+49)/2 = 51, ou
seja, x3=(Li+Ls)/2.
Os dados brutos a seguir apresentam um conjunto de tempos para determinada
operação.
"5,1 "5,3 "5,3 "5,6 "5,8 "5,9 "6 "6,1 "6,2 "6,2 "
"6,3 "6,3 "6,3 "6,4 "6,4 "6,4 "6,5 "6,5 "6,6 "6,7 "
"6,7 "6,8 "6,8 "6,9 "6,9 "7 "7,1 "7,1 "7,2 "7,2 "
"7,3 "7,4 "7,5 "7,5 "7,6 "7,6 "7,6 "7,7 "7,7 "7,8 "
"7,8 "7,9 "7,9 "8 "8 "8,1 "8,2 "8,3 "8,3 "8,4 "
"8,5 "8,5 "8,6 "8,7 "8,8 "8,8 "8,9 "9 "9,1 "9,2 "
"9,4 "9,4 "9,5 "9,5 "9,6 "9,8 "9,9 "10 "10,2 "10,2 "
"10,4 "10,6 "10,8 "10,9 "11,2 "11,5 "11,8 "12,3 "12,7 "14,9 "
Regras para a elaboração de uma distribuição de freqüências com
classes
1º Organize os dados brutos em um ROL.
2º Calcule a amplitude total At.
No nosso exemplo: At =14,9 – 5,1 = 9,8
3º Calcule o número de classes (K), que será calculado usando K = .
Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é
igual a 8,94, aproximadamente, 8. No nosso exemplo: n = 80 dados, então ,
k=(n = 8,9 .
4º Conhecido o número de classes define-se a amplitude de cada classe:
No exemplo, a será igual a:
5º Temos então o menor nº da amostra, o nº de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes
com freqüência = 0 (zero).
6º Com o conhecimento da amplitude de cada classe, define-se os limites
para cada classe (inferior e superior), onde limite Inferior será 5,1 e o
limite superior será 15 + 1,23.
"Intervalo de "Freqüência "Freqüência "Freqüência "Freqüência "
"Classe "Absoluta "Acumulada "Relativa "Acumulada "
" "(fi) "(Fi) "(fr) "(Fr) "
"05,10 "---" "13 "13 "16,25 "16,25 "
"06,33 " " " " "
"06,34 "---" "21 "34 "26,25 "42,50 "
"07,57 " " " " "
"07,58 "---" "22 "56 "27,50 "70,00 "
"08,81 " " " " "
"08,82 "---" "15 "71 "18,75 "88,75 "
"10,05 " " " " "
"10,06 "---" "4 "75 "5,00 "93,75 "
"11,29 " " " " "
"11,30 "---" "3 "78 "3,75 "97,50 "
"12,53 " " " " "
"12,54 "---" "1 "79 "1,25 "98,75 "
"13,77 " " " " "
"13,78 "---" "1 "80 "1,25 "100 "
"15,01 " " " " "
"Total "80 "- "100 "- "
Obs: Agrupar os dados em classes é uma importante ferramenta para resumir
grandes massas de dados brutos, no entanto acarreta perda de alguns
detalhes.
Freqüências simples ou absolutas (fi): são os valores que realmente
representam o número de dados de cada classe. A soma das freqüências
simples é igual ao número total dos dados da distribuição.
Freqüências relativas (fr): são os valores das razões entre as freqüências
absolutas de cada classe e a freqüência total da distribuição. A soma das
freqüências relativas é igual a 1 (100 %).
Freqüência simples acumulada de uma classe (Fi): é o total das freqüências
de todos os valores inferiores ao limite superior do intervalo de uma
determinada classe.
Freqüência relativa acumulada de uma classe (Fr): é a freqüência acumulada
da classe, dividida pela freqüência total da distribuição.
MEDIDAS DE CENTRALIDADE
Há várias medidas de tendência central, entretanto nesta apostila, será
abordado o estudo de apenas aquelas que são mais significativas. As mais
importante medidas de tendência central são: a média aritmética, média
aritmética para dados agrupados, média aritmética ponderada, mediana, moda.
Medidas de Centralidade
3.1 Média Aritmética=
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com
a sua utilização, pois pode dar uma imagem distorcida dos dados.
A média possui uma particularidade bastante interessante, que consiste no
seguinte:
se calcularmos os desvios de todas as observações relativamente à média e
somarmos esses desvios o resultado obtido é igual a zero.
A média tem uma outra característica, que torna a sua utilização vantajosa
em certas aplicações: Quando o que se pretende representar é a quantidade
total expressa pelos dados, utiliza-se a média.
Na realidade, ao multiplicar a média pelo número total de elementos,
obtemos a quantidade pretendida.
É igual ao quociente entre a soma dos valores do conjunto e o número total
dos valores.
...onde xi são os valores da variável e n o número de valores.
.Dados não-agrupados:
Quando desejamos conhecer a média dos dados não-agrupados em tabelas de
freqüências, determinamos a média aritmética simples.
Exemplo: Os dados a seguir apresentam leituras de concentração de um
processo químico feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12,
temos, uma concentração média de:
.= (10+14+13+15+16+18+12) / 7 = 14
Desvio em relação à média: é a diferença entre cada elemento de um conjunto
de valores e a média aritmética, ou seja:.. di = Xi -
No exemplo anterior temos sete desvios:.d1 = 10 - 14 = - 4 ,.d2 = 14 - 14 =
0 , d3 = 13 - 14 = - 1 ,.d4 = 15 - 14 = 1 ,.d5 = 16 - 14 = 2 ,..d6 = 18 -
14 = 4 e.d7 = 12 - 14 = - 2.
Propriedades da média
1ª propriedade: A soma algébrica dos desvios em relação à média é nula.
No exemplo anterior: d1+d2+d3+d4+d5+d6+d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os
valores de uma variável, a média do conjunto fica aumentada (ou diminuída)
dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da
variável temos:
Y = 12+16+15+17+18+20+14 / 7 = 16 ou
Y = .+ 2 = 14 +2 = 16
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma
variável por uma constante (c), a média do conjunto fica multiplicada (ou
dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores
da variável temos:
Y = 30+42+39+45+48+54+36 / 7 = 42 ou
Y = x 3 = 14 x 3 = 42
.
Dados agrupados:
Sem intervalos de classe
Consideremos a distribuição relativa de um canal de comunicação que está
sendo monitorado pelo registro do nº de erros em um conjunto de caracteres
(string) 1.000 bits. Dados para 34 desses conjuntos são vistos a seguir.
"Nº de "Freqüência"
"erros "= fi "
"0 "2 "
"1 "6 "
"2 "10 "
"3 "12 "
"4 "4 "
"total "34 "
Como as freqüências são números indicadores da intensidade de cada valor da
variável, elas funcionam como fatores de ponderação, o que nos leva a
calcular a média aritmética ponderada, dada pela fórmula:
"..x"..f"..xi."
"i. "i. "fi . "
"0 "2 "0 "
"1 "6 "6 "
"2 "10 "20 "
"3 "12 "36 "
"4 "4 "16 "
"tot"34 "78 "
"al " " "
onde 78 / 34 = 2,3 erros
Com intervalos de classe
Neste caso, convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio, e determinamos a média
aritmética ponderada por meio da fórmula:
.onde Xi é o ponto médio da classe.
Exemplo: Calcular o número de molas fora de conformidade, em cada batelada
de produção, com um tamanho igual a 40 conforme a tabela abaixo.
"Nº de "Freqüência"ponto médio"..xi."
"molas "= fi "= xi "fi. "
"50 "4 "52 "208 "
""---- " " " "
"54 " " " "
"54 "9 "56 "504 "
""---- " " " "
"58 " " " "
"58 "11 "60 "660 "
""---- " " " "
"62 " " " "
"62 "8 "64 "512 "
""---- " " " "
"66 " " " "
"66 "5 "68 "340 "
""---- " " " "
"70 " " " "
"70 "3 "72 "216 "
""---- " " " "
"74 " " " "
"Total "40 " "2.440"
Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 molas
MODA
É o valor que ocorre com maior freqüência em uma série de valores.
Mo é o símbolo da moda.
Desse modo, a força modal de remoção para um conector é a força mais comum,
isto é, a força de remoção medida em um teste de laboratório para um
conector.
.
A Moda quando os dados não estão agrupados
A moda é facilmente reconhecida: basta, de acordo com definição,
procurar o valor que mais se repete.
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a
10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum
valor apareça mais vezes que outros.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
.Em outros casos, pode haver dois ou mais valores de concentração.
Dizemos, então, que a série tem dois ou mais valores modais.
Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas
modas: 4 e 7. A série é bimodal.
.A Moda quando os dados estão agrupados
a) Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda:
basta fixar o valor da variável de maior freqüência.
Exemplo: Qual a temperatura mais comum medida no mês abaixo:
"Temperatu"Freqüên"
"ras "cia "
"0º C "3 "
"1º C "9 "
"2º C "12 "
"3º C "6 "
Resp: 2º C é a temperatura modal, pois é a de maior freqüência.
.
b) Com intervalos de classe
A classe que apresenta a maior freqüência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste caso, é o valor dominante que
está compreendido entre os limites da classe modal. O método mais simples
para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta.
"Mo = ( Li+ "
"Ls) / 2 "
onde Li = limite inferior da classe modal e Ls= limite superior da classe
modal.
Exemplo: Calcule a resistência modal dos 33 resistores conforme a tabela
abaixo.
"Resistência (em"Freqüên"
"ohms) "cia "
"54 "---- 58 "9 "
"58 "---- 62 "11 "
"62 "---- 66 "8 "
"66 "---- 70 "5 "
Resp: a classe modal é 58"--- 62, pois é a de maior freqüência. Li=58 e
Ls=62
Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o
valor real da moda).
Método mais elaborado pela fórmula de CZUBER:
Mo = Li + ((fmo - fant) / ( 2fmo – (fant + fpost))) x c
Li= limite inferior da classe modal
fmo = freqüência da classe modal
fant =freqüência da classe anterior à da classe modal
fpost =freqüência da classe posterior à da classe modal
c = amplitude da classe modal
Obs: A moda é utilizada quando desejamos obter uma medida rápida e
aproximada de posição ou quando a medida de posição deva ser o valor mais
típico da distribuição. Já a média aritmética é a medida de posição que
possui a maior estabilidade.
MEDIANA
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente
ou decrescente), é o valor situado de tal forma no conjunto que o separa em
dois subconjuntos de mesmo número de elementos.
Símbolo da mediana: Md
.A mediana em dados não-agrupados
Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definição de mediana, o primeiro passo a ser dado é o da
ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15
}
O valor que divide a série acima em duas partes iguais é igual a 9, logo a
Md = 9.
Método prático para o cálculo da Mediana
Se a série dada tiver número ímpar de termos:
O valor mediano será o termo de ordem dado pela fórmula:
"O elemento mediano "
"será:..EMd = n + 1 / 2 "
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da
série ordenada será a mediana.
A mediana será o 5º elemento, ou seja, Md = 2
Se a série dada tiver número par de termos:
"O elemento mediano "
"será:..EMd = n / 2 "
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a fórmula ficará: :..EMd = 10 / 2 = 5
Será na realidade (5º termo + 6º termo) / 2
A mediana será = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo será a
média aritmética do 5º e 6º termos da série.
Notas:
Quando o número de elementos da série estatística for ímpar, haverá
coincidência da mediana com um dos elementos da série.
Quando o número de elementos da série estatística for par, nunca
haverá coincidência da mediana com um dos elementos da série. A
mediana será sempre a média aritmética dos 2 elementos centrais da
série.
Em uma série a mediana, a média e a moda não têm, necessariamente, o
mesmo valor.
A mediana, depende da posição e não dos valores dos elementos na série
ordenada. Essa é uma da diferenças marcantes entre mediana e média
(que se deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10
Isto é, a média do segundo conjunto de valores é maior do que a do
primeiro, por influência dos valores extremos, ao passo que a mediana
permanece a mesma.
.
A mediana em dados agrupados
a) Sem intervalos de classe
Neste caso, é o bastante identificar a freqüência acumulada imediatamente
superior à metade da soma das freqüências. A mediana será aquele valor da
variável que corresponde a tal freqüência acumulada.
Exemplo conforme tabela abaixo:
"Variáve"Freqüênci"Freqüência "
"l xi "a fi "acumulada "
"0 "2 "2 "
"1 "6 "8 "
"2 "9 "17 "
"3 "13 "30 "
"4 "5 "35 "
"Total "35 "- "
Quando o somatório das freqüencias for ímpar o valor mediano será o termo
de ordem dado pela fórmula :.
" "
Como o somatório das freqüencias = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º
termo = 3..
Quando o somatório das freqüências for par o valor mediano será o termo de
ordem dado pela fórmula:.
" "
Exemplo - Calcule Mediana da tabela abaixo:
"Variáve"Freqüênci"Freqüência "
"l xi "a fi "acumulada "
"12 "1 "1 "
"14 "2 "3 "
"15 "1 "4 "
"16 "2 "6 "
"17 "1 "7 "
"20 "1 "8 "
"Total "8 "- "
Aplicando a fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º
termo) / 2 = (15 + 16) / 2 = 15,5
b) Com intervalos de classe
Devemos seguir os seguintes passos: 1º) Determinamos as freqüências
acumuladas; 2º) Calculamos ; 3º) Marcamos a classe correspondente à
freqüência acumulada imediatamente superior à . Tal classe será a
classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula:..Li + [(EMd
- Fant) x c] / fMd
Li = é o limite inferior da classe mediana.
Fant = é a freqüência acumulada da classe anterior à classe mediana.
fMd= é a freqüência simples da classe mediana.
c = é a amplitude do intervalo da classe mediana.
Exemplo:
"classe"Freqüência"Freqüência "
"s "= fi "acumulada "
"50 "4 "4 "
""---- " " "
"54 " " "
"54 "9 "13 "
""---- " " "
"58 " " "
"58 "11 "24 "
""---- " " "
"62 " " "
"62 "8 "32 "
""---- " " "
"66 " " "
"66 "5 "37 "
""---- " " "
"70 " " "
"70 "3 "40 "
""---- " " "
"74 " " "
"Total "40 "- "
= 40 / 2 =.20.. logo.a classe mediana será 58 "---- 62
Li = 58....... Fant = 13........... fMd = 11........... c = 4
Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4]
/ 11 = 58 + 28/11 = 60,54
OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.
Emprego da Mediana
Quando desejamos obter o ponto que divide a distribuição em duas
partes iguais.
Quando há valores extremos que afetam de maneira acentuada a média
aritmética.
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
Veremos agora como medir a variabilidade presente num conjunto de dados.
Um aspecto importante no estudo descritivo de um conjunto de dados é o da
determinação da variabilidade ou dispersão desses dados, relativamente à
medida de localização do centro da amostra.
DESVIO PADRÃO ( S )
É a medida de dispersão mais empregada, pois leva em consideração a
totalidade dos valores da variável em estudo. É um indicador de
variabilidade bastante estável. O desvio padrão baseia-se nos desvios em
torno da média aritmética e a sua fórmula básica pode ser traduzida como: a
raiz quadrada da média aritmética dos quadrados dos desvios e é
representada por S.
Uma vez que a variância envolve a soma de quadrados, a unidade em que se
exprime não é a mesma que a dos dados. Assim, para obter uma medida da
variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a
raiz quadrada da variância e obtemos o desvio padrão.
O desvio padrão é uma medida que só pode assumir valores não negativos e
quanto maior for, maior será a dispersão dos dados.
A fórmula acima é empregada quando tratamos de uma população de dados não-
agrupados.
Exemplo: Calcular o desvio padrão da população representada por - 4 , -3 ,
-2 , 3 , 5
" Xi" " " "
" " [pic" " "
" "] " " "
"- 4 "- 0,2"- 3,8 "14,44 "
"- 3 "- 0,2"- 2,8 "7,84 "
"- 2 "- 0,2"- 1,8 "3,24 "
" 3 "- 0,2" 3,2 "10,24 "
" 5 "- 0,2" 5,2 "27,04 "
"Tota"- "- "62,8 "
"l " " " "
Sabemos que n = 5 e 62,8 / 5 = 12,56.
A raiz quadrada de 12,56 é o desvio padrão = 3,54
Quando os dados estão agrupados (temos a presença de frequências) a fórmula
do desvio padrão ficará:
ou
Exemplo: Calcule o desvio padrão populacional da tabela abaixo:
" Xi" f"Xi ." " " " . f i"
" "i "f i "[pi" " " "
" " " "c] " " " "
" " " " " " " "
"0 "2 "0 "2,1"-2,1 "4,41 "8,82 "
"1 "6 "6 "2,1"-1,1 "1,21 "7,26 "
"2 "12 "24 "2,1"-0,1 "0,01 "0,12 "
"3 "7 "21 "2,1"0,9 "0,81 "5,67 "
"4 "3 "12 "2,1"1,9 "3,61 "10,83 "
" Tot"30 "63 "- "- "- "32,70 "
"al " " " " " " "
Sabemos que ( fi = 30 e 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 é o desvio padrão = 1,044
Se considerarmos os dados como sendo de uma amostra o desvio padrão seria a
raiz quadrada de 32,7 / (30 -1) = 1,062
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser
utilizada é a mesma do exemplo anterior.
VARIÂNCIA ( S2 )
Define-se a variância, como sendo a medida que se obtém somando os
quadrados dos desvios das observações da amostra, relativamente à sua
média, e dividindo pelo número de observações da amostra menos um.
A variância é uma medida que tem pouca utilidade como estatística
descritiva, porém é extremamente importante na inferência estatística e em
combinações de amostras.
SÉRIES ESTATÍSTICAS
TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de
maneira sistemática.
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela
devemos colocar:
Um traço horizontal ( - ) quando o valor é zero;
Três pontos ( ... ) quando não temos os dados;
Zero ( 0 ) quando o valor é muito pequeno para ser expresso pela
unidade utilizada;
Um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão
de determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.
É qualquer tabela que apresenta a distribuição de um conjunto de dados
estatísticos em função da época, do local ou da espécie.
Séries Homógradas: são aquelas em que a variável descrita apresenta
variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou
específica.
a) Série Temporal: Identifica-se pelo caráter variável do fator
cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série
também é chamada de histórica ou evolutiva.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 2002
"PERÍODO " "
" "UNIDADES VENDIDAS *"
"JAN/2002 "2 0 "
"FEV/2002 "1 0 "
"TOTAL "3 0 "
* Em mil unidades
.b) Série Geográfica: Apresenta como elemento variável o fator geográfico.
A época e o fato (espécie) são elementos fixos. Também é chamada de
espacial, territorial ou de localização.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 2002
"FILIAIS " "
" "UNIDADES VENDIDAS *"
"São Paulo "1 3 "
"Rio de Janeiro "1 7 "
"TOTAL "3 0 "
* Em mil unidades
c) Série Específica: O caráter variável é apenas o fato ou espécie. Também
é chamada de série categórica.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 2002
"MARCA " "
" "UNIDADES VENDIDAS *"
"FIAT "1 8 "
"GM "1 2 "
"TOTAL "3 0 "
* Em mil unidades
Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São
apropriadas à apresentação de duas ou mais séries de maneira conjugada,
havendo duas ordens de classificação: uma horizontal e outra vertical. O
exemplo abaixo é de uma série geográfica-temporal.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 2002
"FILIAIS "Janeiro/2002 "Fevereiro/2002"
"São Paulo "1 0 "3 "
"Rio de Janeiro "1 2 "5 "
"TOTAL "2 2 "8 "
* Em mil unidades
Obs: as séries heterógradas serão estudas no capítulo 2 (distribuição de
freqüências).
-----------------------
S2 =