Professional Documents
Culture Documents
=
+ + + +
i
n
x
N N
x x x x 1 ...
3 2 1
i i
n x
N
1
Medidas de tendencia CENTRAL:
MEDIA, MODA Y MEDIANA.
La MODA es el valor (o el intervalo) ms frecuente en la
distribucin.
La MEDIANA es el valor que queda en el centro de los datos tras
ordenarlos de menor a mayor.
Cuartiles, deciles y percentiles
El primer cuartil se define como el valor que deja por debajo la
cuarta parte de la distribucin.
El segundo cuartil coincide con la mediana
El tercer cuartil es el valor que tiene por encima el 25% de la
distribucin
El primer decil es el valor de la variable tal que el 10% de las
observaciones son menores que l. (Hay 9 deciles)
El primer centil : 1% del las observaciones son menores que l.
(Hay 99 centiles)
Medidas de tendencia CENTRAL:
MEDIA, MODA Y MEDIANA.
GRAFICOS DE CAJA
a b c d e
a y e = valores mnimo y mximo de la distribucin;
b = primer cuartil de la distribucin
c = mediana de la distribucin ;
d = tercer cuartil de la distribucin
Medidas de dispersin:
Medidas de asimetra.: La asimetra de la distribucin se puede ver
en el histograma, para cuantificarla se usan :
Primer coeficiente de asimetra de Pearson: Se divide la
diferencia entre la media y la moda entre la desviacin tpica.
Segundo coeficiente de asimetra de Pearson: se divide el triple
de la diferencia entre la media y la mediana entre la desviacin
tpica.
Si dan positivo, la asimetra se da a la derecha. Si es nulo no hay
asimetra
Si es negativo hay asimetra a la izquierda. Pueden tener distinto
signo
Medidas de dispersin:
Tercer Coeficiente de asimetra :
Si g 1 > 0 asimetra a la derecha ; si g 1 = 0 distribucin
simtrica; si g 1 < 0 asimetra a la izquierda
Apuntamiento o Kurtosis
C > 3 distribucin ms apuntada que la curva normal (leptocrica)
C = 3 distribucin igual de apuntada que la curva normal (mesocrtica)
C < 3 distribucin menos apuntada que la curva normal (platicrtica)
( )
3
3
1
) (
1
s
x x n
N
g
i i
|
.
|
\
|
=
( )
4
4
) (
1
s
x x n
N
C
i i
|
.
|
\
|
=
Elaboracin de una distribucin de
frecuencias para datos continuos
Determinar la amplitud de variacin de los datos. Dato mayor
menos el dato menor. Esta amplitud es denominada rango (r).
Definir el nmero de clases a utilizar. Generalmente se recomienda
usar entre 5 y 15 clases; esta eleccin es un balance entre el grado
de resumen y la informacin que se pierde. Una regla emprica es
calcular la raz cuadrada de n (nmero de datos) y adaptarla, si
es necesario, a los limites 5 y 15.
Dividir la amplitud de variacin (r) entre k, que es el nmero de
clases, para obtener una amplitud de clase (a). Por lo regular se
recomienda formar intervalos de igual amplitud debido a que los
intervalos desiguales tienden a distorsionar las comparaciones.
Para nuestro ejemplo tenemos que la amplitud de clase es a = r / k
Establecer los intervalos preliminares. Se inicia a partir del dato
menor del conjunto de datos ordenados.
Media o promedio
Mediana
Moda
Comparacin de las MTC
Medidas de Tendencia Central
Medida de tendencia central que se define como
la suma de un conjunto de puntajes dividido entre
el nmero total de puntajes del conjunto:
n
x
n
i
i
=
= X
1
Media o promedio
La media puede considerarse como el centro de
gravedad ya que la suma de las desviaciones de
cada marca con respecto a la media ser siempre
cero.
Media o promedio
n
x f
x
m
i
i i
=
=
1
N
x f
m
i
i i
=
=
1
Donde: _
X = Media o promedio muestral.
= Media o promedio poblacional.
X
i
= Punto medio de dicha clase o marca de clase.
f
i
= Frecuencia de la clase i-sima
n = Nmero total de datos.
N = Nmero total de la poblacin.
Se define como la medida de tendencia central
que corta la distribucin en dos partes iguales.
2
1 +
=
n
Md
Mediana
Se le conoce como una medida de posicin.
La mediana es un punto tal que la mitad de las
observaciones son menores a l y la otra mitad
mayores.
Mediana para datos no agrupados
Mediana
Lm w
f m
f a
n
m +
(
(
(
(
+
|
.
|
\
|
+
=
) 1 (
2
1
~
Mediana para datos agrupados
Donde:
Mediana muestral.
n = Nmero total de elementos en la distribucin.
fa = Suma de todas las frecuencias de clase hasta pero sin incluir a la clase
mediana.
fm = Frecuencia de la clase mediana.
w = Ancho del intervalo de clase.
Lm = Limite inferior del intervalo de clase mediana.
= m
~
= m
~
Es el valor que aparece ms a menudo en la
columna de frecuencia de la tabla.
Mo = puntaje que ms se repite
La moda se encuentra por inspeccin ms que
por clculo.
Moda
La moda requiere slo un conteo de frecuencia,
puede aplicarse a cualquier conjunto de datos
en los niveles de medicin nominal, ordinal o
por intervalos.
La mediana requiere un ordenamiento de los
valores (segn la magnitud). Puede aplicarse a
los niveles de medicin ordinal o por intervalos.
El uso de la media se restringe exclusivamente
a los datos por intervalos.
Comparacin
Localizan la posicin de algn caso en relacin
con el grupo.
Cuartiles: dividen a la distribucin de valores en
4 partes iguales.
Deciles: dividen la distribucin en 10 partes
Percentiles: indican el porcentaje de casos que
caen por debajo de un puntaje.
Medidas de Posicin
Rango
Desviacin Media
Desviacin Estndar
Coeficiente de Variabilidad
Medidas de Dispersin
Rango intercuartlico
Se define como la diferencia entre el puntaje
ms alto y el ms bajo de la distribucin.
Se considera como un ndice preliminar o
aproximado de la variabilidad de una
distribucin.
A mayor rango mayor dispersin.
R = Dato
Mayor
- Dato
Menor
Rango
Rango intercuartlico
Se define como la diferencia entre el tercer
cuartil y el primer cuartil.
Contempla al 50% de los casos con valores
centrales.
Ignora los valores extremos de la distribucin de
valores.
R = Q
3
Q
1
Se define como la media aritmtica de las
diferencias absolutas de cada marca con
respecto a la media.
n
x x
DM
n
i
i
=
=
1
Es una medida de la dispersin alrededor de la
media y se utiliza con fines puramente
descriptivos.
Desviacin Media
Se define como la raz de la media aritmtica de
las desviaciones cuadradas con respecto a la
media.
n
x x
s
n
i
i
=
=
1
2
) (
Representa la variabilidad promedio de una
distribucin de datos.
Cuanto mayor es la dispersin alrededor de la
media tanto mayor es la desviacin estndar
Desviacin Estndar
Se define como la desviacin estndar dividida
entre la media por 100.
Permite comparar a varios grupos en relacin con
su homogeneidad relativa cuando los grupos
tienen medias distintas.
) 100 (
x
s
C
V
=
Coeficiente de variabilidad