You are on page 1of 25

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA


DEPARTAMENTO DE ESTATÍSTICA
DOCENTE: Lígia Magnólia Confessor Rocha

Medidas de dispersão ou variabilidade

NATAL/RN
2015
 Utilizaremos o termo dispersão para indicar o
grau de afastamento de um conjunto de
números em relação a sua média.

 Será que a média sempre é confiável? Calcule


a média nos seguintes casos:

 X: 70, 70, 70, 70, 70


 Y: 68, 69, 70, 71, 72
n

X i
350
X i 1
X  70
n 5

Y i
350
Y i 1
Y   70
n 5
 Já que a média nesse caso não é eficaz, então
o que poderíamos usar?

 Resposta: Podemos utilizar as medidas de


dispersão! ! !
Variância

A medida de dispersão mais utilizada. É


definida como sendo o quociente entre a soma
dos quadrados dos desvios e o número de
elementos.
 Variância Populacional (𝜎)
N

(X i   )²
2  i 1
N

 Variância Amostral (S)


n

(X i  X )²
S²  i 1
n 1
 Variância (dados sem Classes)

 Quando os dados estão em uma distribuição


de frequência simples podemos utilizar a
fórmula a seguir:
 Variância (dados em Classes)

Quando os dados estão em classes podemos


utilizar as fórmulas a seguir:
 VARIÂNCIA (dados em forma de rol)

 Exemplo: Calcule a variância da estatura de


cinco jogadores de basquete disponibilizados
a seguir:

1,92 1,72 1,82 1,80 1,84


 Solução
 VARIÂNCIA (dados em Classes)

 Exemplo: Considere a seguinte distribuição


de dados.
 Calculando a variância

n  50 (n  1)  49  pm². f  38650  pm. f  1220

1  (1220)² 
S ²  . 38650    181, 27
49  50 
 Características da fórmula e do resultado da
variância.

 A variância é sempre um número positivo

 As fórmulas para a amostra e para a


população têm o mesmo numerador, a soma
dos quadrados dos desvios.
“Desvantagem” do uso da variância

 No cálculo da variância, quando elevamos


ao quadrado a diferença , a unidade de
medida da série fica também elevada ao
quadrado.

 Portanto, a variância é dada sempre no


quadrado da unidade de medida da série. Se
os dados são expressos em metros, a
variância é expressa em metros quadrados.
 Em algumas situações, a unidade de medida
da variância nem faz sentido. É o caso,
por exemplo, em que os dados são
expressos em litros. A variância será
expressa em litros quadrados?

 Logo, o valor da variância não pode ser


comparado diretamente com os dados da
série, ou seja: variância não tem
interpretação. Que solução poderíamos
tomar?
Usar o DESVIO-PADRÃO ! ! !

 O desvio padrão nada mais é que a raiz


quadrada da variância.
 Conclusão do desvio padrão

 O desvio padrão depende da soma dos


quadrados dos desvios dos dados da variável
com relação à sua média. Portanto, quanto
menor for o desvio padrão, mais os valores
da variável se aproximarão de sua média.
 Dissemos antes que, por serem as unidades
do desvio-padrão as mesmas que as
unidades dos dados originais, é mais fácil
entender o desvio-padrão do que a variância.
No entanto, aquela mesma propriedade torna
difícil comparar a variação para valores
originados de diferentes populações, ou seja,
quando as medidas de duas ou mais variáveis
são expressas em unidades diferentes como
peso/altura, capacidade/comprimento, etc.
 Usa-se então o Coeficiente de Variação (CV),
que é uma medida relativa, que expressa o
desvio padrão como uma porcentagem da
média aritmética e ele não tem unidade
específica. Quanto mais próximo de zero,
mais homogênea é a distribuição. Quanto
mais distante, mais dispersas.
 O CV mede a dispersão em relação à média. É
a razão entre o desvio padrão e a média. O
resultado obtido dessa operação é
multiplicado por 100, para que o coeficiente
de variação seja dado em porcentagem.

S
CV  .100
X
 Análise:

DISPERSÃO BAIXA: CV < 15%


DISPERSÃO MÉDIA: 15% ≤ CV < 30%
DISPERSÃO ALTA: CV ≥ 30%

 OBS.: um CV alto indica que a dispersão dos


dados em torno da média é muito grande.
 Alturas e Pesos de alunos do sexo masculino
de uma turma de Administração. Usando os
dados amostrais de alturas e pesos de 40
alunos do sexo masculino de uma turma de
matematica, encontramos as estatísticas
dadas na tabela a seguir.
 Calcule o coeficiente de variação para altura e
peso, e a seguir, compare os dois resultados.

Solução:
 Reparem que se fôssemos comparar apenas o
desvio padrão (fazendo isso já estaríamos
errando, pois não pode comparar desvios-
padrão de populações com unidades de
medição diferentes, neste caso cm e kg),
iríamos erroneamente deduzir que as duas
populações tinham variabilidades muito
próximas.
 No entanto, ao calcular os coeficientes de
variação para as duas populações, analisa-se
que a variabilidade das alturas dos alunos do
sexo masculino é quase quatro vezes menos
que a variabilidade dos pesos. Isso faz
sentido intuitivamente, porque vemos
rotineiramente que os pesos entre homens
variam muito mais do que as alturas.

You might also like