You are on page 1of 24

MEDIDA DE DISPERSIÓN

MEDIDA DE DISPERSIÓN
Las medidas de dispersión nos informan sobre
cuánto se alejan del centro, los valores de la
distribución.
Entonces las medidas de dispersión describen la
variabilidad entre un conjunto de datos, si están
cercanos o carecen de dispersión.
¡A MAYOR DISPERSIÓN, MAYOR ES LA
DIFERENCIA ENTRE LOS DATOS!
MEDIDA DE DISPERSIÓN
• VARIANZA (δ2)
• DESVIACIÓN TÍPICA O ESTÁNDAR (S)
• DESVIACIÓN MEDIA (DM)
• DESVIACIÓN MEDIA ABSOLUTA (MAD)
VARIANZA (δ2)
Esta medida nos permite determinar el promedio aritmético de
fluctuación de los datos respecto a su punto central o medio.
La Varianza nos da como resultado un valor numérico que
representa:
¡EL PROMEDIO DE DIFERENCIA QUE HAY ENTRE LOS DATOS Y LA
MEDIA!
VARIANZA (δ2)
La VARIANZA (δ2) de una serie de n valores x1, x2,…xn se denota
por S y se define como:

Si x1, x2,…,xk, se presentan con frecuencias f1, f2, …..,fk


respectivamente, la desviación típica puede escribirse como:
CALCULO DE LA VARIANZA

Para calcular la Varianza, se sigue estos pasos:


1. Calcular la media (el promedio de los números).
2. Ahora, por cada número se resta la media y eleva el
resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora se calcula la media de esas diferencias al cuadrado
(¿Por qué al cuadrado?).
¿POR QUÉ AL CUADRADO?
1. Elevar cada diferencia al cuadrado hace que todos los
números sean positivos (para evitar que los números
negativos reduzcan la varianza).
2. Y también hacen que las diferencias grandes se destaquen.
Por ejemplo:
(100)2 = 10 000 es mucho más grande que (50)2 = 2 500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande,


así que lo deshacemos (con la raíz cuadrada) y así obtenemos la
desviación estándar:

¡LA DESVIACIÓN ESTÁNDAR ES MUCHO MÁS ÚTIL!


CALCULO DE LA VARIANZA (δ2)
Ejemplo:
Calcular la varianza de la siguiente colección de leyes de oro en gr/onz: 12, 6, 7, 3,
15, 10, 18, 5.
=12+6+7+3+15+10+18+5/8 = 9,5

S=(12-9,5)2+(6-9,5)2+(7-9,5)2+(3-9,5)2+(15-9,5)2+(10-9,5)2+(18-9,5)2+(5-9,5)2/8-1

S= 6,25+ 12,25+ 6,25+ 42,25+ 30,25+0,25+72,25+20,25/7

S =  5,22
S2 = 5,22
CALCULO DE LA VARIANZA
Ejemplo
1. Se miden las alturas de unos perros (en milímetros):

Las alturas (de los hombros) son: 600, 470, 170, 430 y 300.

2. Se calcula la media
Respuesta:
CALCULO DE LA VARIANZA
La altura media de los perros es 394 mm, se muestra esto en el
gráfico:

3. Ahora calculamos la diferencia de cada altura con la media:


CALCULO DE LA VARIANZA
Para calcular la varianza, se toma cada diferencia con respecto a la media,
se eleva al cuadrado, y se calcula la media:

Y la desviación estándar es la raíz cuadrada de la varianza, así que:


Desviación estándar: σ = √21 704 = 147,32 mm
¡LO BUENO DE LA DESVIACIÓN ESTÁNDAR ES QUE ES ÚTIL!
Ahora se verá qué las alturas de los perros están a distancia menor de la
desviación estándar (147mm) que la media:
DIVIDE POR N-1, DONDE N ES LA CANTIDAD DE PUNTOS DE DATOS.

Hace mucho tiempo, los estadísticos dividían la varianza de la muestra por n.


Esto te da el valor promedio de la desviación al cuadrado, que coincide perfectamente con la varianza de la
muestra.

¡Pero recordemos que la muestra es solo una estimación de una población


más grande!
Si tomas otra muestra aleatoria y haces el mismo cálculo, obtendrás un resultado diferente.

Por este motivo, al dividir por n-1 en vez de por n obtendrás una mejor estimación de la varianza de una
población más grande y eso es justamente lo que estás buscando.
Esta corrección es tan común que se ha convertido en la definición aceptada de la varianza de una muestra.

En el ejemplo:
Varianza S2 = 27 132 mm
Desviación estándar S= 164,712 mm
CALCULO DE LA VARIANZA
Así que usando la desviación estándar tenemos
una manera "estándar" de saber qué es:
• Normal,
• Extra grande o
• Extra pequeño.
Se llega a la conclusión que:
Los Rottweilers son perros grandes y los
Dachsunds son un poco menudos...
¡PERO QUE NO SE ENTEREN!
¡Porque nos puede morder!
VARIANZA
La Varianza de un conjunto de datos se define como:

EL CUADRADO DE SU DESVIACIÓN TÍPICA O ESTANDAR

S2
CALCULO DE LA DESVIACIÓN TÍPICA O ESTÁNDAR (S)

Para calcular la Desviación Estándar basta con hallar la raíz


cuadrada de la varianza, por lo tanto su ecuación sería:
DESVIACIÓN MEDIA (DM)
La desviación media de una serie de n números x1, x2,x3,….xn
definida por:

Ejemplo: Hallar la desviación media de las leyes de oro en gr/onz:


2, 3, 6, 8, 11:

= 2+3+6+8+11/5= 6
DM= l2-6l+l3-6l+l6-6l+l8-6l+l11-6l/ 5
DM = 4+3+0+2+5 / 5
DM = 2,8
DESVIACIÓN MEDIA (DM)
Sí, x1, x2,….,xk se presentan con frecuencias f1, f2, ….fk
respectivamente, la desviación n media puede escribirse
como:
DESVIACIÓN MEDIA ABSOLUTA (MAD)

La Desviación Media Absoluta de n valores x1, x2,…..,xn se


define como:
MAD= Mediana de lxn- Mediana de xnl

VALE DECIR:
 Primero se calcula la mediana de los xn
 Luego, se obtienen los valores absolutos de las
diferencias xn-Mediana.
 Finalmente se determina la Mediana de las diferencias
que es el MAD.
La MAD es entonces:
¡LA MEDIANA DE LAS DIFERENCIAS ABSOLUTAS
OBTENIDAS EN EL PASO ANTERIOR!
DESVIACIÓN MEDIA ABSOLUTA (MAD)
Ejemplo:
Obtener la MAD de la siguiente colección de leyes de oro
en gr/onz: 1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6.
1. Mediana = m = 3,5

2. MAD = Mediana de l1-3,5l, l2-3,5l, l2-3,5l, l3-3,5l, l3-


3,5l, l3-3,5l, l4-3,5l, l4-3,5l, l4-3,5l, l5-3,5l, l5-3,5l,
l6-3,5l
MAD= Mediana de 2,5, 1,5, 1,5, 0,5, 0,5, 0,5, 0,5, 0,5,
0,5, 1,5, 1,5, 2,5 
3. Ordenar MAD= Mediana de 0,5, 0,5, 0,5, 0,5, 0,5, 0,5,
1,5, 1,5, 1,5, 1,5, 2,5, 2,5

4. MAD = Mediana de 0,5+1,5/2 = 1


CONCLUSIÓN
Igualmente resulta interesante analizar :
¡ SI LAS MEDIDAS DE DISPERSIÓN DESCRITAS CUMPLEN SU
OBJETIVO!
Considérese el mismo conjunto de datos anterior:

1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6

Inicialmente se debe destacar que la distribución de frecuencias de


este conjunto es simétrica.
Para este conjunto se tiene que:
• Desviación típica (S) = 1,45
• Desviación Media (MD) = 1,16
• Desviación Absoluta Media (MAD) = 1,00
CONCLUSIÓN
Todas las medidas de dispersión dan
aproximadamente el mismo valor.
Este valor (aproximadamente 1) refleja además la
dispersión media respecto de la tendencia central
(3,5) del conjunto de valores; vale decir:

¡TODAS LAS MEDIDAS DE DISPERSIÓN CUMPLEN SU


COMETIDO!

Esto se debe a que la distribución de valores:


¡ES SIMÉTRICA!
CONCLUSIÓN
Si el valor más alto fuera 60 en lugar de 6 se tendría que:
• Desviación Típica (S) = 16,42
• Desviación Media (MD) = 4,50
• Desviación Absoluta Media (MAD) = 1,00
El cambio de uno solo de los valores hace que medidas de
dispersión tales como la:
• Desviación Típica (S) y
• La Desviación Media (MD)
¡NO CUMPLAN CON SU OBJETIVO!
• La Desviación Típica (S) es casi 11 veces mayor que el
mencionado rango y
• La Desviación Media (MD) es casi 4 veces mayor que dicho
rango.
CONCLUSIÓN
Claramente, se puede ver que la Desviación Media (MD) y
la Desviación Típica son medidas:
¡NO RESISTENTES DE DISPERSIÓN!

En cambio la MAD permanece inalterable y en realidad


refleja la dispersión de los primeros 11 valores respecto de
su tendencia central.
LA MAD ES RESISTENTE.
RECOMENDACIÓN
En general se recomienda utilizar la Desviación Típica o
Estándar (S) como medida confiable de dispersión
solamente cuando:
¡LA FORMA DE LA DISTRIBUCIÓN ES
SIMÉTRICA!
De otra manera se recomienda:
¡RECURRIR A LA MAD!

You might also like