Professional Documents
Culture Documents
DISPERSIÓN
Las Medidas de Tendencia Central son valores numéricos que tienden a localizar, en algún
sentido, la parte central de un conjunto de datos. A menudo el término Promedio se asocia a
estas mediciones.
Media aritmética
x
x
n
o en caso de repetirse los valores , multiplicando cada valor por el número de repeticiones
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
Xm = ---------------------------------------------------------------------------------------
n
Media geométrica
Se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos
resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).
Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media
geométrica.
La media geométrica se suele utilizar en series de datos como tipos de interés anuales,
inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años
anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.
La ventaja de la media es que, en su cálculo se utilizan todos los valores de la serie, por lo que
no se pierde ninguna información. Sin embargo, presenta el problema de que su valor (tanto en
el caso de la media aritmética como geométrica) se puede ver muy influido por valores
extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían
condicionar en gran medida el valor de la media, perdiendo ésta representatividad.
Media cuadrática
x
2 x f i
2
i
N
Media Armónica
N
H
f
i
xi
La media armónica se utiliza cuando la variable se encuentra medida en términos relativos. Por
ejemplo la velocidad.
Mediana
md =
Y
n 2 Yn 2 1
2
Ejemplo:
Se tienen los siguientes datos ordenados de menor a mayor, 1, 3, 4, 6, y 20. Para obtener la
mediana tenemos Md = n+1/2, o sea Md = 5+1/2= 3; el número situado en la tercera posición
corresponde al valor de la mediana.
1 3 4 6 20
Md
Ejemplo:
Supongamos que tenemos las siguientes mediciones 2, 3, 4, 6, 10, 11, 11 y 17. De la misma
forma obtenemos la mediana Md = 8+1/2 = 4.5; como en la posición 4.5 está entre 6 y 10
sumamos 6 + 10/2 = 8. Entonces la mediana es 8.
2 3 4 6 10 11 11 17
8
Md
Moda
Abreviada Mo, es el valor que ocurre con mayor frecuencia en un conjunto de mediciones; si
dos valores tienen la misma frecuencia, se dice que el conjunto es bimodal; si tres valores
tienen la misma frecuencia, es trimodal, etc.
Ejemplo:
Medida Conteo
1 II
2 I
3 Moda IIII
4 III
7 II
8 I
Ejemplo:
Considérese el siguiente conjunto de datos: 22, 26, 27, 23, 23, 27, 22, 28, 22, 28, 30, 29.
Organizando estos datos en una tabla de frecuencias tendremos lo siguiente:
Medida Conteo
22 Moda III
23 II
25 I Bimodal
26 I
27 Moda III
28 II
29 I
30 I
COMPARACIÓN DE LAS MEDIDAS DE TENDENCIA CENTRAL O POSICIÒN
Amplitud
Amplitud = H –L
Ejemplo:
Amplitud = 8-3 = 5.
La amplitud señala que los cinco datos se encuentran dentro de una distancia de 5
unidades sobre la recta numérica.
Varianza
La Varianza es un valor promedio de la suma de todos los cuadrados de las distancias respecto
ala media en un conjunto de datos.
La Varianza (S2) de una muestra es el valor numérico que se obtiene de la siguiente manera:
x x
2
S
2
n 1
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y es
cuando todos los valores de la variable son iguales.
2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable es la
misma que la que tenía antes.
Ejemplo:
x
x
25
5 S
2 x x
2
18
4.5
n 5 n 1 4
Desviación estándar
Es la raíz cuadrada de la Varianza. Esta medida es muy útil para describir o medir la dispersión
de un conjunto de datos alrededor de la media.
x x
2
S S 2
n 1
(1.4)
COMPARACIÓN DE LAS MEDIDAS DE DISPERSIÓN.
ESTADÍSTICAS DE ORDEN
Se le llaman estadísticas de orden a ciertos valores en la escala de los datos ordenados. Son
estadísticas de orden el mínimo X(1), el máximo X(n), los cuartiles y los deciles. A la mediana
también se le considera estadística de orden.
Cuartiles
El cuartil primero, a veces denotado Q1, es el valor o dato abajo del cual cae el 25% de los
datos. Analógicamente, Q3, es el valor o dato abajo del cual cae el 75% de los casos.
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
Percentiles
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo
de alumnos (lección 2ª). Los deciles y centiles se calculan de igual manera, aunque haría falta
distribuciones con mayor número de datos.
1º cuartil: es el valor 1,22 cm, ya que por debajo suya se sitúa el 25% de la frecuencia (tal
como se puede ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la
frecuencia.
Coeficiente de variación de Pearson
Se calcula como cociente entre la desviación típica y la media de la muestra. En el caso del
ejercicio anterior sería de la siguiente manera:
Cv = 0,0320 / 1,253
Igual a
Cv = 0,0255
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de
dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en
las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los
alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las
desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus
coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.