You are on page 1of 43

MEDIDAS DE DISPERSIN

Un promedio no dice nada acerca de la diseminacin de los datos. El promedio no es


representativo cuando se tiene una amplia dispersin. Se puede comparar cun dispersas
estn dos o ms distribuciones.

Una medida de dispersin puede utilizarse para evaluar la confiabilidad de dos o ms


promedios.

Medidas de dispersin:

Varias medidas de dispersin:

Amplitud de Variacin: Tal intervalo especial se utiliza ampliamente en las aplicaciones


del control estadstico de procesos.

AMPLITUD DE VARIACIN = VALOR MS GRANDE - VALOR MS PEQUEO

Desviacin media: Es la media aritmtica de los valores absolutos de las desviaciones


con respecto a la media aritmtica.

/X-X/

DESVIACIN MEDIA DM =

Donde:

X valor de cada observacin

X media aritmtica de los valores

n nmero de observaciones de la muestra

/ / Valor absoluto

No se consideran los signos de las desviaciones respecto de la media dado que las
desviaciones positivas y negativas se compensaran exactamente y la desviacin media
siempre sera cero. Cero es un dato estadstico intil.

Dos ventajas:

Utiliza en su clculo todos los valores de la muestra.

Fcil de comprender pues es el promedio en que los valores se desvan con respecto a la
media.

Desventaja:
ESTADISTICA 1
El uso de valores absolutos.

Variancia y Desviacin Estndar: se basan en las desviaciones al cuadrado con respecto


a la media.

Variancia: la media aritmtica de las desviaciones cuadrticas con respecto al a media

La Variancia Poblacional para datos no agrupados o para datos no tabulados en una


distribucin de frecuencias se calcula como:

"(X - )2

2=

Donde:

2 smbolo de variancia poblacional

X valor de una observacin de poblacin

N nmero total de observaciones en la citada poblacin

media aritmtica de la poblacin

La variancia es difcil de interpretar a causa de las unidades.

La Desviacin Estndar Poblacional es el promedio de las desviaciones respecto de la


media, se presenta en las mismas unidades que los datos. Frmula:

( X - )2

( X - X )2

Variancia Muestral s2 =

n-1

Donde:

X valor de las observaciones en la muestra

X media de la muestra

N nmero total de observaciones de la muestra


ESTADISTICA 2
Puede demostrarse que:

( X - X )2 = X2 - (X)2/ n

Frmula operativa de la variancia muestral:

X2 - (X)2/ n

s2 =

n-1

La Desviacin Estndar Muestral se utiliza como un estimador, es la raz cuadrada de la


variancia muestral:

X2 - (X)2/ n

s=

n-1

Medidas de dispersin para datos agrupados en distribucin de frecuencias:

Amplitud de Variacin: se resta el lmite inferior de la clase ms pequea del lmite


superior de la clase mayor.

Desviacin estndar: para datos no agrupados. Frmula:

fX2 - (fX)2/ n

s=

n-1

Donde:

S desviacin estndar muestral

X punto medio de la clase

f frecuencia de clase

n nmero total de observaciones en la muestra

Para encontrar la desviacin de los datos agrupados en una distribucin de frecuencias


se produce:

Paso 1. Cada frecuencia de clase se multiplica por su punto medio.

Paso 2. Se calcula fX2, esto podra explicarse como fX. X.


ESTADISTICA 3
Paso 3. Se suman las columnas fX y fX2..

Interpretacin y usos de la desviacin estndar:

La desviacin estndar se emplea como una medida para comparar la dispersin en dos
o ms conjuntos de observaciones.

o Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o


poblacin), la proporcin mnima de los valores que se encuentran dentro
de k desviaciones estndares desde la media es al menos 1 - 1/k2, donde k es una
constante mayor que 1.

o Regla emprica: Para una distribucin de frecuencias simtrica de campana,


aproximadamente 68% de las observaciones estar a ms y menos una desviacin
estndar desde la media, aproximadamente 95% de tales observaciones se encontrar a
ms y menos dos desviaciones estndares de la misma; y prcticamente todas las
observaciones (99,7%) se hallarn a ms y menos tres desviaciones con respecto a la
media.

Forma grfica:

Curva simtrica de campana que muestra las relaciones entre la desviacin estndar y la
media

-3s -2s -1s X 1s 2s 3s

70 80 90 100 110 120 130

68%

95%

99,7%

Si una distribucin es simtrica con forma de campana, prcticamente todas las


observaciones se encuentran entre la media ms o menos tres desviaciones estndares.

Dispersin Relativa:

Karl Pearson (1857-1936) desarroll una medida relativa denominada coeficiente de


variacin (CV). Es una medida til cuando:

Los datos estn en unidades diferentes (como U$S y das de asistencia).

Los datos estn en la mismas unidades, pero las medias muy distantes (ingresos de
superiores e ingresos de empleados).

o Coeficiente de variacin: es la razn (cociente) de la desviacin estndar a la media


aritmtica, expresada como un porcentaje:

ESTADISTICA 4
s

CV = (100)

Karl Pearson desarroll tb una medida para evaluar el grado de orientacin al sesgo,
denominada coeficiente de asimetra (CA):

3 (media - mediana)

CA =

Desviacin Estndar

Otras medidas de dispersin:

Un mtodo es determinar la ubicacin de los valores que dividen un conjunto de


observaciones en partes iguales. Estas medidas son:

o Los cuartiles, que dividen un conjunto de observaciones en 4 partes iguales (conjuntos


ordenados de menor a mayor). El primer cuartil (Q1) es el valor abajo del cual se
encuentra el 25% de las observaciones, y, el tercer cuartil (Q3) es el valor por abajo del
cual se encuentra el 75% de las observaciones. Q2 es la mediana.

o Los deciles dividen un conjunto de observaciones en 10 partes iguales.

o Los centiles se utilizan para reportar resultados acerca de ciertas pruebas nacionales
estandarizadas, empleado para calificar la admisin a programas.

Cuartiles, Deciles y Centiles ( o Porcentiles):

Para formalizar el procedimiento, sea Lp la ubicacin del centil deseado.

Ej: porcentil 33 L33 . El nmero de observaciones es n. Entonces se aplica: (n +1) /2

Ubicacin de un centil Lp = (n +1) P/100

o Diagramas de caja: representacin grfica basada en cuartiles, que ayuda a ilustrar un


conjunto de dato. Se necesitan 5 valores estadsticos: el valor mnimo; Q1 ; la mediana;
Q3 ; y el valor mximo.

Mediana

Q1 Q3

Valor mnimo Valor Mximo

ESTADISTICA 5
La distancia entre los extremos de la caja se denomina amplitud
cuartlica (o intercuartlica). Dicho intervalo es la distancia entre el primero y el tercer
cuartiles.

Se indican dos asteriscos (**) . Uno indica n dato impropio. Un dato incongruente es
un valor inconsciente con el resto de los datos. Es como aquel valor que ms de 1,5
veces el valor de la amplitud intercuartlica, mayor que Q3 o bien, menor que Q1.

Dato incongruente = Q1 - 1,5 (Q3 - Q1)

RANGO O RECORRIDO.

Es la diferencia entre dos valores entre los dos valores extremos mximo y mnimo.
Evidentemente, la dispersin de los datos ser tanto mayor, cuando mayor sea el
recorrido.

El rango recorrido no es una buena medida de dispersin, puesto que basta que un dato
se aleje mucho de la media para que el rango recorrido resulte muy afectado, ya que
nicamente depende de dos valores, sin que influyan para nada los datos distantes

Ejemplo: Hallar el rango de la siguiente serie de nmeros:


4, 5, 7, 9, 10, 12, 15

Solucin: el rango ser la diferencia entre los valores extremos. Es decir,


15-4 = 11.

DESVIACION MEDIA

Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos
a un punto de concentracin, debemos como primera medida, calcular la distancia de
cada dato respecto a una medida de tendencia central. Por ejemplo:

4 5 3

5 3 2

2 2 2

3 5 1

ESTADISTICA 6
4 1 4

Tenemos que la media aritmtica es de aproximadamente 3,0667 (indicador de


tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333
hacia la derecha. Grficamente tendramos:

Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmtica:

Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la media.
Para indicar las distancias de estos puntos, agregaremos el signo negativo, por tanto, la
distancia del tercer dato sera 0,0667. La representacin grfica de todos los puntos
quedara:

El total de las distancias de los puntos que estn a la izquierda respecto a la media es de
-8,6 (empleando todos los decimales), que es igual a la sumatoria de las distancias de
los puntos que estn a la derecha respecto a la media 8,6. Concluimos que la sumatoria
de todas las distancias de cada punto respecto a la media aritmtica es igual a cero (las
distancias se anulan):

Para responder a la pregunta de qu tan disperso estn los datos respecto a la media
aritmtica?, recurriremos nuevamente al promedio simple. Para llegar a una frmula
bsica de dispersin, en que las distancias positivas y negativas no se eliminen,
modificaremos la frmula anterior para trabajar solo con distancias positivas mediante
el valor absoluto:

La distancia promedio sera de aproximadamente 1,15 (resultado de la divisin entre la


distancia total absoluta y el total de datos). A esta distancia promedio se le conoce con el
nombre de desviacin media y significa que en promedio, los datos se separan de la
media en 1,15.

Desviacin media (Dm): Equivale a la divisin de la sumatoria del valor


absoluto de las distancias existentes entre cada dato y su media
aritmtica y el nmero total de datos.

ESTADISTICA 7
Se debe hacer la distincin que para datos poblacionales (no agrupados), la frmula
quedara:

La variacin para los datos agrupados en tablas tipo B radica en cambiar el valor de
Xi por la marca de clase correspondiente, multiplicando esa distancia por su frecuencia:

Para las tablas tipo A solo cambiaremos la marca de clase por su respectivo valor de
clase (representada por Xi):

5.1.1 Ejemplo: Desviacin media para datos no agrupados

Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10
materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es
encontrar al alumno ms idneo para representar al colegio en un torneo a nivel
nacional.

El nmero de preguntas buenas por materia se muestra a continuacin:

Materia Carlos Pedro Juan

1 2 7 5

2 9 2 6

3 10 2 5

4 2 6 5

ESTADISTICA 8
5 3 6 5

6 1 3 5

7 9 6 4

8 9 7 5

9 1 6 6

10 4 5 4

SOLUCIN

Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos,
con el fin de determinar el alumno con mayor promedio de preguntas buenas.

Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen
responden en promedio 5 preguntas correctas por prueba. Cul sera entonces el
indicador diferenciador entre los alumnos?.

Complementemos el anlisis anterior calculando la desviacin media:

Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en
promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin (2,9),
siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por arriba como
por debajo de la media aritmtica. Se recomienda al colegio elegir como ganador en este
caso a Juan, presenta resultados ms constantes que los otros dos alumnos, Juan en
promedio acierta 5 preguntas buenas con una variacin muy baja (rondando entre 4 y 6).

5.1.2 Ejemplo: Desviacin media para datos agrupados

Una maquina dispensadora de gaseosas est programada para llenar un envase con 350
c.c. de un refresco popular. A partir de una muestra de prueba realizada sobre 30 envases
se realiz la siguiente tabla de frecuencia:

ESTADISTICA 9
Ni Lm Ls F Mc

1 130.0 140.1 2 135.1

2 140.1 150.1 5 145.1

3 150.1 160.1 14 155.1

4 160.1 170.1 4 165.1

5 170.1 180.1 4 175.1

6 180.1 190.0 1 185.1

Total 30

Calcular e interpretar la desviacin media.

SOLUCIN

PASO 1: Calcular la media aritmtica.

PASO 2: Calcular la desviacin media.

La desviacin media es de aproximadamente 8,8 c.c. Concluimos que con datos


suministrados de una muestra, el dispensador llen los 30 envases con un promedio de
157,095 c.c. con una desviacin media de 8,8 c.c.

La desviacin media describe un rango de dispersin promedio de llenado del


dispensador, ubicndolo entre 148,295 c.c. (equivale a restar la media a la desviacin
media) y 165,895 c.c. (sumar una desviacin media a la media aritmtica).

5.1.3 Clculos de la desviacin media en Excel

1
ESTADISTICA
0
Presentaremos el clculo de la desviacin media en Excel tanto para datos sin agrupar,
como para los datos agrupados en tablas de frecuencias. Copiemos los siguientes datos a
partir de la celda B2.

Excel cuenta con la funcin DESVPROM para el clculo de la desviacin media para
datos sin agrupar.

DESVPROM: Calcula la desviacin media de un conjunto de datos numricos.

Formato: DESVPROM (nmero1; nmero 2;)

Categora: Estadsticas

Activemos esta funcin en la celda B9, sealando el rango de celdas B2:F7 en el campo
nmero1.

Al pulsar en el botn Aceptar, se mostrar la desviacin media.

Para el clculo de la desviacin media en tablas de frecuencia debemos calcular de


antemano la media aritmtica y el valor absoluto de las distancias.

Copiemos la siguiente tabla de frecuencia en una hoja nueva en Excel (es la misma
utilizada en el ejemplo 5.1.2).

El primer paso es calcular la media aritmtica para datos agrupados con ayuda de la
funcin SUMAPRODUCTO (ver el ejemplo dado en el punto 4.1.7), aplicado sobre las
frecuencias y marcas de clases.

Luego hallaremos las distancias de cada marca de clase respecto a la media,


convirtindolas a su valor absoluto con la funcin ABS.

1
ESTADISTICA
1
ABS: Devuelve el valor absoluto de un nmero.

Formato: ABS (nmero)

Categora: Matemticas y trigonomtricas

Esta funcin posee un nico campo (nmero) el cual contendr, la distancia entre la
marca de clase y la media. Para el primer intervalo de clase tendramos:

Donde F3 representa la primera marca de clase y B11 la media aritmtica. Para


completar el clculo, multiplicaremos esta funcin por la frecuencia respectiva:

Para poder arrastrar la frmula, debemos recordar que la celda B11 no vara (la media
aritmtica es una sola), ubicndonos sobre las letras B11 en modo de edicin y luego
pulsando la tecla F4.

El resultado final, despus de haber arrastrado la frmula, debera verse como sigue:

El total de las distancias se muestra en la celda G9. La desviacin (que ubicaremos en la


celda B12), es el resulta de la divisin de la distancia total sobre el nmero de datos
empleados en el ejercicio.

VARIANZA

En teora de probabilidad, la varianza (que suele representarse como de una variable


aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la
desviacin de dicha variable respecto a su media.

Est medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si la


variable mide una distancia en metros, la varianza se expresa en metros al cuadrado.
La desviacin estndar es la raz cuadrada de la varianza, es una medida de dispersin
alternativa expresada en las mismas unidades de los datos de la variable objeto de
estudio. La varianza tiene como valor mnimo 0.

1
ESTADISTICA
2
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias
tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersin
ms robustas.

DEFINICIN DEVARIANZA
La nocin de varianza se suele emplear en el mbito de la estadstica. Se trata de una
palabra impulsada por el matemtico y cientfico ingls Ronald Fisher (18901962) y
sirve para identificar a la media de las desviaciones cuadrticas de una variable de
carcter aleatorio, considerando el valor medio de sta.

La varianza de las variables aleatorias, por lo tanto, consiste en una medida vinculada a
su dispersin. Se trata de la esperanza del cuadrado de la desviacin de esa variable
considerada frente su media y se mide en una unidad diferente. Por ejemplo: en los
casos en que la variable mide una distancia en kilmetros, su varianza se expresa en
kilmetros al cuadrado.
Cabe destacar que las medidas de dispersin (tambin identificadas con el nombre
de medidas de variabilidad) se encargan de expresar la variabilidad de una distribucin
por medio de un nmero, en los casos en que las diferentes puntuaciones de la variable
estn muy alejadas de la media. A mayor valor de la medida de dispersin, mayor
variabilidad. En cambio, a menor valor, ms homogeneidad.
Lo que hace la varianza es establecer la variabilidad de la variable aleatoria. Es
importante tener en cuenta que, en ciertos casos, es preferible emplear otras medidas de
dispersin ante las caractersticas de las distribuciones.
Se denomina varianza muestral cuando se calcula la varianza de una comunidad, grupo
o poblacin en base a una muestra. La covarianza, por otra parte, es la medida de
dispersin conjunta de un par de variables.
Los expertos hablan de anlisis de la varianza para nombrar a la coleccin de modelos
estadsticos y sus procedimientos asociados en la cual la varianza aparece particionada
en distintos componentes

1
ESTADISTICA
3
CMO CALCULAR LA VARIANZA

2 mtodos: CALCULAR LA VARIANZA DE UNA MUESTRA


La varianza es una medida de qu tan disperso es un conjunto de datos. Si la
varianza es pequea, significa que los valores del conjunto estn bastante
agrupados. Si la varianza es grande, significa que los nmeros estn ms
dispersos. En estadstica, este concepto tiene muchos usos. Por ejemplo, si
comparas las varianzas de dos conjuntos de datos (por ejemplo, resultados de
pacientes femeninos contra resultados de pacientes masculinos) puedes
comprobar si una variable produce un efecto perceptible.[1] La varianza tambin
es muy til para crear modelos estadsticos, ya que una varianza pequea puede
ser un indicio de que ests ajustando demasiado los datos

TOMA NOTA DE LA MUESTRA DEL CONJUNTO DE DATOS.

En la mayora de los casos, los estadsticos solo tienen acceso a una muestra o a un
subconjunto de la poblacin que van a analizar. Por ejemplo, en vez de analizar la
poblacin "costo de todos los autos de Alemania", un estadstico averiguara el costo de
una muestra aleatoria de unos pocos miles de autos. De este modo podra basarse en esa
muestra para obtener una estimacin aproximada del costo de los autos en Alemania,
aunque es posible que no coincida con el valor exacto.

Ejemplo: analizando la cantidad de panquecitos que se venden todos los das en una
cafetera, tomas una muestra de seis das aleatorios y obtienes los siguientes
resultados: 17, 15, 23, 7, 9, 13. Esta es una muestra, no la poblacin, ya que no tienes
los datos de todos y cada uno de los das en los cuales ha estado abierta la cafetera.
Si tienes todos los puntos de datos de una poblacin, contina con el prximo
mtodo.
1. ANOTA LA FRMULA DE LA VARIANZA DE UNA MUESTRA.
La varianza de un conjunto de datos te indica qu tan dispersos estn los puntos de
datos. Mientras ms cerca de cero est la varianza, ms cercanos estarn entre s los
puntos de datos. Cuando vayas a trabajar con muestras de conjuntos de datos, utiliza la
siguiente frmula para calcular la varianza:[3]
o = [( - xx)]/(n - 1)
o es la varianza. La varianza siempre se mide en unidades elevadas al
cuadrado.
o representa un trmino de tu conjunto de datos.
o , que significa "sumatoria", te indica que debes calcular los siguientes
trminos para cada valor de y luego sumarlos a todos.
x
o x es la media de la muestra.

1
ESTADISTICA
4
o n es la cantidad de puntos de datos.
x
CALCULA LA MEDIA DE LA MUESTRA. xEl smbolo x o "x barra" se
refiere a la media de la muestra.[4] Calclala como lo calcularas cualquier media: suma
todos los puntos de datos, luego divdela por la cantidad de puntos de datos.
o Por ejemplo: primero suma todos los puntos de datos: 17 + 15 + 23 + 7 +
9 + 13 = 84
A continuacin, divide la respuesta por la cantidad de puntos de datos, en este caso, seis:
84 6 = 14.
x
xMedia de la muestra = x = 14 .
o Puedes pensar en la media como el "punto central" de los datos. Si los
datos se agrupan cerca de la media, entonces la varianza ser baja. Si se encuentran
esparcidos lejos de la media, la varianza ser alta.

PROPIEDADES DE LA VARIANZA
1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la varianza no vara.
3 Si todos los valores de la variable se multiplican por
un nmero la varianza queda multiplicada por el cuadrado de dicho nmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.

OBSERVACIONES SOBRE LA VARIANZA


1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones
extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones estn elevadas al cuadrado.

DESVIACIN TPICA

La desviacin tpica o desviacin estndar (denotada con el smbolo o s, dependiendo


de la procedencia del conjunto de datos) es una medida de dispersin para variables de
razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la
raz cuadrada de la varianza de la variable.

1
ESTADISTICA
5
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los
datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones. La desviacin tpica es la raz
cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las
puntuaciones de desviacin. La desviacin tpica se representa por .

Ejercicios de desviacin tpica


Ejercicio 1:
Calcular la desviacin tpica de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Ejercicio 2:
Calcular la desviacin tpica de la distribucin de la tabla:

xi fi xi fi xi2 fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

1
ESTADISTICA
6
[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Propiedades de la desviacin tpica


1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no
vara.
3 Si todos los valores de la variable se multiplican por un nmero la desviacin
tpica queda multiplicada por dicho nmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones tpicas se puede calcular ladesviacin tpica total.
Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

1
ESTADISTICA
7
CALCULO DE DESVIACIN TPICA
Se ha preguntado a un grupo de personas el nmero de veces que han ido al cine en el
ltimo trimestre. Las respuestas se recogen en la siguiente tabla:

veces: 0 1 2 3 4 5
personas: 2 20 41 26 9 2

Hallar la media y la desviacin tpica.

Para realizar los clculos con mayor facilidad construiremos una tabla de frecuencias
donde xi ser el nmero de veces, la variable a estudiar, y fi la frecuencia con que ocurre
dicha variable, es decir el nmero de personas que van al cine cero, una, dos... veces al
ao. Al lado construimos las columnas correspondientes al producto de fi por xi, es
decir fi xi,

y la columna correspondiente al producto de la frecuencia fi por el cuadrado de la


variable xi

es decir fi xi2

Ahora podemos calcular la media con facilidad dividiendo la suma () de todos


los fi xi entre el total de personas ecuestadas (n) que es la suma de todas las fi:

1
ESTADISTICA
8
MOMENTOS RESPECTO DEL ORIGEN

Dada una variable aleatoria X con funcin de probabilidad o densidad f(x)


podemos definir una funcin de X que sea igual a la variable elevada a un exponente
entero no negativo.

El valor esperado de z(x) es el k-simo momento de la variable X respecto a su


origen y se llama

k=0

k=1

a este primer momento respecto al origen que es igual al valor esperado se le llama
tambin media aritmtica de la variable y se le denomina X, simplemente .

En la mayora de los casos, la media expresa la tendencia central de la variable


o el orden de magnitud de sus valores.

El resto de los momentos respecto al origen tienen escaso inters en la mayora


de los casos.

MOMENTOS RESPECTO A LA MEDIA


Dada una variable aleatoria X con funcin de probabilidad o densidad f(x)
podemos definir una funcin de X que sea igual a la diferencia entre la variable y su
media aritmtica elevada a un exponente entero no negativo.

1
ESTADISTICA
9
El valor esperado de z(x) es el k-simo momento de la variable X respecto a la
media y se llama k.

k=0

k=1

es decir, en cualquier variable aleatoria su primer momento respecto de la media


es igual a 0. Esta propiedad se utilizar reiteradamente en las demostraciones
estadsticas.

k=2

EJEMPLO:

este segundo momento respecto de la media se le llama tambin varianza.

2
ESTADISTICA
0
La varianza de una variable mide la dispersin de sus valores respecto al
valor central .

Para calcular la varianza por un mtodo ms sencillo se utiliza la


expresin:

Es decir, la varianza de una variable es igual a la media de los cuadrados


menos el cuadrado de la media.

El principal problema de la varianza es que se expresa en unidades


cuadrticas que no siempre tienen una interpretacin clara. Para obviar este
problema se define otra medida de la dispersin que es la desviacin tpica, X, o
simplemente , que se calcula como la raz cuadrada positiva de la varianza;
evidentemente, la desviacin tpica se mide en las mismas unidades que la
variable

No obstante, la desviacin tpica no resuelve todos los problemas que se


pueden plantear, como por ejemplo la comparacin de situaciones en las que la
unidad de medida o el orden de magnitud de esta sea diferente. Para resolver esta
cuestin se define una medida adimensional de la variabilidad que es
el coeficiente de variacin, C V, que se calcula como el cociente entre la
desviacin tpica y la media (a veces este cociente se expresa en tanto por ciento
multiplicndolo por 100).

2
ESTADISTICA
1
En este contexto de la medida de la variacin se plantea el problema de
medir la variacin conjunta de variables de variables asociadas.

Supongamos que tenemos dos variables aleatorias X e Y, discretas o


continuas, con funcin de probabilidad o densidad conjunta f(x,y) y definimos
una funcin z(x,y) igual al producto de las desviaciones de cada valor a su media
respectiva (es decir, z(x,y) tiene la misma estructura que (X - )2 = (X - ) (X -
) si sustituimos una vez a X por Y).

Al valor esperado de z(x,y) se le llama covarianza de las variables X e Y


y se representa como xy o cov(x,y).

La covarianza es una medida de la variacin comn a dos variables y, por


tanto, una medida del grado y tipo de su relacin.

xy es positiva si los valores altos de X estn asociados a los valores


altos de Y y viceversa.

xy es negativa si los valores altos de X estn asociados a los valores


bajos de Y y viceversa.

Si X e Y son variables aleatorias independientes cov(x,y) = 0 .

La independencia es condicin suficiente pero no necesaria para que la


cov(x,y) sea nula.

2
ESTADISTICA
2
cov(x,y) = 0 cov(x,y) > 0 cov(x,y) < 0
Se puede deducir, algebraicamente, un medio ms sencillo para calcular
la covarianza de dos variables.

En el caso de la covarianza tenemos el mismo problema que se nos


present con la varianza, es decir, la covarianza se expresa en trminos del
producto de las unidades de medida de ambas variables, lo cual no siempre es
fcilmente interpretable. Por otra parte tambin es difcil comparar situaciones
diferentes entre s. En este caso, ambos problemas se solucionan de una vez
mediante la definicin del coeficiente de correlacin, , que se define como el
cociente entre la covarianza y el producto de las desviaciones tpicas de las dos
variables.

La correlacin toma valores entre -1 y 1, siendo su signo igual al de la


covarianza. Correlaciones con valor absoluto 1 implican que existe una
asociacin matemtica lineal perfecta, positiva o negativa, entre las dos variables
y correlaciones iguales a 0 implican ausencia de asociacin. Obviamente, las
variables independientes tienen correlacin 0, pero nuevamente, la
independencia es condicin suficiente pero no necesaria.

Correlaciones con valores absolutos intermedios indican cierto grado de


asociacin entre los valores de las variables.

Propiedades de la varianza

2
ESTADISTICA
3
Si X es una variable aleatoria con funcin de probabilidad o densidad
f(x), la varianza de una funcin de la variable X , m(x) , se calcula segn la
expresin:

Casos concretos:

1. Cuando a todos los valores de una variable se les suma una


constante, la varianza de la variable conserva el mismo valor (ver
imagen en las propiedades de la media)

2. Cuando a todos los valores de una variable se les multiplica por una
constante, la varianza de la variable queda multiplicada por el valor
de la constante elevado al cuadrado (ver imagen en las propiedades
de la media)

3. Si X e Y son dos variables aleatorias con funcin de densidad o


probabilidad conjunta f(x,y), la varianza de la funcin m(x,y) = a X
b Y, donde a y b son constantes reales se calcula como:

En el caso de que a = b = 1

Si adems ocurre que X e Y sean independientes xy = 0 , luego

2
ESTADISTICA
4
Volviendo al tema de los momentos respecto al origen, veamos los dos
siguientes que tambin son interesantes,

k=3

= asimetra

El tercer momento respecto de la media mide la asimetra de la


distribucin, es decir, si existen o no observaciones muy extremas en algn
sentido con frecuencias razonablemente altas. Si la asimetra es negativa, la
variable toma valores muy bajos con mayor frecuencia que valores muy altos y
se dice que tiene una cola izquierda pesada o que es asimtrica hacia la
izquierda. Si la asimetra es positiva, la variable toma valores muy altos con
mayor frecuencia que valores muy bajos y se dice que tiene una cola derecha
pesada o que es asimtrica hacia la derecha. Si la asimetra es cero, los valores
bajos y altos de la variable tienen probabilidades iguales (el ejemplo ms tpico
de variable simtrica es la variable normal)

La asimetra tiene el mismo problema que la varianza y la covarianza en


cuanto a sus unidades de medida y, por ello, normalmente se utiliza una medida
adimensional de la asimetra que es el coeficiente de asimetra, g1, que se calcula
como el cociente entre el tercer momento y el cubo de la desviacin tpica.

2
ESTADISTICA
5
k=4 = curtosis

El cuarto momento respecto de la media mide la curtosis de la


distribucin, es decir, la forma de la distribucin de probabilidad. Al representar
grficamente variables con curtosis pequea, platicrticas, se observan curvas o
histogramas con colas cortas y aspecto aplanado o en meseta; si la variable tiene
curtosis grande, es decir, si es leptocrtica, su grfica ser alta y estilizada, con
colas largas y pesadas.

La curtosis de una variable siempre es positiva y se mide en las unidades


de la variable elevadas a potencia 4. Por tanto, nuevamente se nos plantean los
problemas relacionados con las unidades de medida y las escalas y necesitamos
una medida adimensional de la curtosis. Esta medida adimensional de la curtosis
es el coeficiente de curtosis, g2, que se calcula como el cociente entre el cuarto
momento y el cuadrado de la varianza, al que se le resta 3 unidades. Esta
correccin se debe a que, sin ella, las variables normales tendran coeficiente de
curtosis igual a 3; al restar 3 conseguimos que el coeficiente de curtosis de la
variable normal sea 0 y que las variables platicrticas tengan coeficiente de
curtosis negativo y la leptocrticas positivo, lo cual es ms mnemotcnico que la
distincin entre curtosis pequea y grande.

2
ESTADISTICA
6
g2 = 0 g2 > 0 g2 < 0

1. ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme
alrededor del punto central (Media aritmtica). La asimetra presenta tres estados
diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn
distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva
cuando la mayora de los datos se encuentran por encima del valor de la media
aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma
cantidad de valores en ambos lados de la media y se conoce como asimetra negativa
cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Figura 5-1

El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,

Ecuacin 5-9

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los
valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de

esta ecuacin se interpretan:


2
ESTADISTICA
7
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente
la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir
por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (
0.5).
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a
reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a
reunir ms en la parte derecha de la media.

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia
que separa la aglomeracin de los valores con respecto a la media.

2. CURTOSIS
Esta medida determina el grado de concentracin que presentan los valores en la regin
central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si
existe una gran concentracin de valores (Leptocrtica), una concentracin normal
(Mesocrtica) una baja concentracin (Platicrtica).

Figura 5-2

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

Ecuacion 5-10

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la

media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se
interpretan:

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil


encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores
cercanos ( 0.5 aprox.).
(g2 > 0) la distribucin es Leptocrtica

2
ESTADISTICA
8
(g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y
un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es
de suma importancia ya que para la mayora de los procedimientos de la estadstica de
inferencia se requiere que los datos se distribuyan normalmente.

La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los


valores se encuentra dentro de una distancia de dos desviaciones estndar de la media
aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la
desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se
encontrara dentro del rango que compongan estos valores.

Figura 5-3

Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las
principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores
profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el
desconocimiento de los conceptos estadsticos.

Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica
para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro
Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava
edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras
encontraras una gran variedad de textos que pueden ser de bastante utilidad en la
introduccin a esta ciencia

Hasta ahora se han estudiado los parmetros de centralizacin y de dispersin


que son las medidas ms frecuentes que se calculan en cualquier estudio estadstico.

Sin embargo existe tambin medidas que indican de la simetra o asimetra de la


distribucin y del achatamiento o no de la misma.

Empezando con la simetra, es lgico pensar que si la distribucin tiene una


nica moda y es simtrica, entonces las tres medidas de centralizacin coinciden. Si no
es simtrica, suele suceder que la mediana est comprendida entre la moda y la media.

Medidas de simetra o asimetra. Miden la mayor o menor simetra de la


distribucin. Existen dos medidas de este tipo:

2
ESTADISTICA
9
ndice de simetra de Pearson:

ndice de simetra de Fisher:

Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a


la derecha, ambos son positivos; y si es asimtrica a la izquierda, ambos ndices son
negativos.

Medidas de curtosis. Miden la mayor o menor concentracin de datos alrededor


de la media. Se suele medir con el coeficiente de curtosis:

Si este coeficiente es nulo, la distribucin se dice normal (similar a la


distribucin normal de Gauss) y recibe el nombre de mesocrtica.

Si el coeficiente es positivo, la distribucin se llama leptocrtica, ms

3
ESTADISTICA
0
puntiaguda que la anterior. Hay una mayor concentracin de los datos en torno a la
media.

Si el coeficiente es negativo, la distribucin se llama platicrtica y hay una


menor concentracin de datos en torno a la media. sera ms achatada que la primera.

asimetra

El tercer momento respecto de la media mide la asimetra de la


distribucin, es decir, si existen o no observaciones muy extremas en algn
sentido con frecuencias razonablemente altas. Si la asimetra es negativa, la
variable toma valores muy bajos con mayor frecuencia que valores muy altos y
se dice que tiene una cola izquierda pesada o que es asimtrica hacia la
izquierda. Si la asimetra es positiva, la variable toma valores muy altos con
mayor frecuencia que valores muy bajos y se dice que tiene una cola derecha
pesada o que es asimtrica hacia la derecha. Si la asimetra es cero, los valores
bajos y altos de la variable tienen probabilidades iguales (el ejemplo ms tpico
de variable simtrica es la variable normal)

La asimetra tiene el mismo problema que la varianza y la covarianza en


cuanto a sus unidades de medida y, por ello, normalmente se utiliza una medida
adimensional de la asimetra que es el coeficiente de asimetra, g1, que se calcula
como el cociente entre el tercer momento y el cubo de la desviacin tpica.

3
ESTADISTICA
1
k=4 = curtosis

El cuarto momento respecto de la media mide la curtosis de la


distribucin, es decir, la forma de la distribucin de probabilidad. Al representar
grficamente variables con curtosis pequea, platicrticas, se observan curvas o
histogramas con colas cortas y aspecto aplanado o en meseta; si la variable tiene
curtosis grande, es decir, si es leptocrtica, su grfica ser alta y estilizada, con
colas largas y pesadas.

La curtosis de una variable siempre es positiva y se mide en la unidades


de la variable elevadas a potencia 4. Por tanto, nuevamente se nos plantean los
problemas relacionados con las unidades de medida y las escalas y necesitamos
una medida adimensional de la curtosis. Esta medida adimensional de la curtosis
es el coeficiente de curtosis, g2, que se calcula como el cociente entre el cuarto
momento y el cuadrado de la varianza, al que se le resta 3 unidades. Esta
correccin se debe a que, sin ella, las variables normales tendran coeficiente de
curtosis igual a 3; al restar 3 conseguimos que el coeficiente de curtosis de la
variable normal sea 0 y que las variables platicrticas tengan coeficiente de
curtosis negativo y la leptocrticas positivo, lo cual es ms mnemotcnico que la
distincin entre curtosis pequea y grande.

g2 = 0 g2 > 0 g2 < 0

3
ESTADISTICA
2
Definicin
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra
(o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin
tener que hacer su representacin grfica.

Como eje de simetra consideramos una recta paralela al eje de ordenadas que pasa por
la media de la distribucin. Si una distribucin es simtrica, existe el mismo nmero de
valores a la derecha que a la izquierda de la media, por tanto, el mismo nmero de
desviaciones con signo positivo que con signo negativo. Decimos que hay asimetra
positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga que la de la
izquierda, es decir, si hay valores ms separados de la media a la derecha. Diremos que
hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la media es ms
larga que la de la derecha, es decir, si hay valores ms separados de la media a la
izquierda.

Medidas de asimetra

Coeficiente de asimetra de Fisher


En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada parte del
uso del tercer momento estndar. La razn de esto es que nos interesa mantener el signo
de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren
a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el
momento estndar con respecto a la media de orden 1 (Ya que una simple suma de
todas las desviaciones siempre es cero!). Por ello, lo ms sencillo es tomar las
desviaciones al cubo.

El coeficiente de asimetra de Fisher, representado por 1, se define como:

donde 3 es el tercer momento en torno a la media y es la desviacin estndar.

Si 1 = 0, la distribucin es simtrica.

Si 1 > 0, la distribucin es asimtrica positiva o a la derecha.

Si 1 < 0, la distribucin es asimtrica negativa o a la izquierda.

Coeficiente de asimetra de Pearson

3
ESTADISTICA
3
Slo se puede utilizar en distribuciones uniformes, unimodales y moderadamente
asimtricas. Se basa en que en distribuciones simtricas la media de la distribucin es
igual a la moda.

Si la distribucin es simtrica, = moda y Ap = 0. Si la distribucin es asimtrica


positiva la media se sita por encima de la moda y, por tanto, Ap > 0.

Coeficiente de asimetra de Bowley


Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente expresin:

En una distribucin simtrica el tercer cuartil estar a la misma distancia de la mediana


que el primer cuartil. Por tanto AB = 0.

Si la distribucin es positiva o a la derecha, AB > 0.

La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen una
distribucin normal, esto es, simtrica en torno a la media. La distribucin normal tiene
una asimetra cero. Pero en realidad, los valores no son nunca perfectamente simtricos
y la asimetra de la distribucin proporciona una idea sobre si las desviaciones de la
media son positivas o negativas. Una asimetra positiva implica que hay ms valores
distintos a la derecha de la media.

Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto con las
medidas de apuntamiento o curtosis se utilizan para contrastar si se puede aceptar que
una distribucin estadstica sigue la distribucin normal. Esto es necesario para realizar
numerosos contrastes estadsticos en la teora de inferencia estadstica.

1) ASIMETRA
Es una medida de forma de una distribucin que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen
dentro de la distribucin. Permite identificar las caractersticas de la distribucin de
datos sin necesidad de generar el grfico.
1.1) TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:

3
ESTADISTICA
4
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora de los
datos est en la parte izquierda de la media. Este tipo de distribucin presenta un
alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos tiene a la
izquierda una cola ms larga que a la derecha. Tambin se dice que una distribucin es
simtrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmtica es
menor que la mediana y ste valor de la mediana a su vez es menor que la moda, en
smbolos

Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la


simetra.
Simtrica.- Se da cuando en una distribucin se distribuyen aproximadamente la misma
cantidad de los datos a ambos lados de la media aritmtica. No tiene alargamiento o
sesgo. Se representa por una curva normal en forma de campana llamada campana de
Gauss (matemtico Alemn 1777-1855) o tambin conocida como de Laplace (1749-
1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su
mediana y su moda son iguales, en smbolos Md=Mo

Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la minora de los


datos est en la parte derecha de la media aritmtica. Este tipo de distribucin presenta
un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los datos tiene a la
derecha una cola ms larga que a la izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo
cuando el valor de la media aritmtica es mayor que la mediana y ste a valor de la
mediana a su vez es mayor que la moda, en smbolos

1.2) MEDIDAS DE ASIMETRA


Coeficiente de Karl Pearson

Donde:
= media aritmtica.

Md = Mediana.
s = desviacin tpica o estndar.

3
ESTADISTICA
5
Nota:
El Coeficiente de Pearson vara entre -3 y 3
Si As < 0 ? la distribucin ser asimtrica negativa.
Si As = 0 ? la distribucin ser simtrica.
Si As > 0 ? la distribucin ser asimtrica positiva.
Medida de Yule Bowley o Medida Cuartlica

Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.

Nota:
La Medida de Bowley vara entre -1 y 1
Si As < 0 ? la distribucin ser asimtrica negativa.
Si As = 0 ? la distribucin ser simtrica.
Si As > 0 ? la distribucin ser asimtrica positiva.
Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde:
= cada uno de los valores; n = nmero de datos; = media aritmtica; f = frecuencia

absoluta
= cubo de la desviacin estndar poblacional; xm = marca de clase

Nota:
Si As < 0 ?Indica que existe presencia de la minora de datos en la parte izquierda de la
media, aunque en algunos casos no necesariamente indicar que la distribucin sea
asimtrica negativa
3
ESTADISTICA
6
Si As = 0 ? la distribucin ser simtrica
Si As > 0 ? Indica que existe presencia de la minora de datos en la parte derecha de la
media, aunque en algunos casos no necesariamente indicar que la distribucin sea
asimtrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la
siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Calculando la media aritmtica se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor

6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviacin estndar muestral se obtiene:

3
ESTADISTICA
7
Calculando el Coeficiente de Pearson se obtiene:

Calculando la Medida de Bowley se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene

Datos

6 -166,375

9 -15,625

9 -15,625

12 0,125

12 0,125

12 0,125

15 42,875

17 166,375

Total 12

3
ESTADISTICA
8
Los clculos en Excel se muestran en la siguiente figura:

Nota: El COEFICIENTE. ASIMETRIA (A2:A9) es un valor que tiene consideraciones


semejantes a la Medida de Fisher
2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a
la distribucin normal, es decir, mide cun puntiaguda es una distribucin.
2.1) TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la regin
central de la distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

3
ESTADISTICA
9
2.2) MEDIDAS DE CURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde: = cada uno de los valores; n = nmero de datos; = media aritmtica; =

Cudruplo de la desviacin estndar poblacional; f = frecuencia absoluta; xm = marca


de clase
Nota:
Si a < 3 ? la distribucin es platictica
Si a = 3 ? la distribucin es normal o mesocrtica
Si a > 3 ? la distribucin es leptocrtica
Medida basada en Cuartiles y Percentiles

(letra griega minscula kappa) = Coeficiente percentil de curtosis

Nota:
Si < 0,263 ? la distribucin es platicrtica

4
ESTADISTICA
0
Si = 0,263 ? la distribucin es normal o mesocrtica

Si > 0,263 ? la distribucin es leptocrtica

Esta medida no es muy utilizada.


Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9,
9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solucin: Calculando la media aritmtica se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene:

Datos

6 915,0625

9 39,0625

9 39,0625

12 0,0625

12 0,0625

12 0,0625

15 150,0625

17 915,0625

Total 2058,5

4
ESTADISTICA
1
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil tres se obtiene:

Calculando el percentil 90 se tiene:

Calculando el percentil 10 se tiene:

Calculando el coeficiente percentil de curtosis se obtiene:

Como a= 2,23 y la distribucin es platicrtica

Los clculos en Excel se muestran en la siguiente figura:

4
ESTADISTICA
2
EJEMPLO

4
ESTADISTICA
3

You might also like