You are on page 1of 10

MÓDULO 5: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DE

DISPERSIÓN

Objetivo: Describir y comparar las medidas de tendencia central, de dispersión y de


orden de una serie de datos.

MEDIDAS DE TENDENCIA CENTRAL

Las Medidas de Tendencia Central son valores numéricos que tienden a localizar, en algún
sentido, la parte central de un conjunto de datos. A menudo el término Promedio se asocia a
estas mediciones.
Media aritmética

Es el promedio aritmético de un conjunto de mediciones; representa el centro físico del conjunto


(semejante al centro de gravedad). La media se obtiene sumando todos los valores de la
variable  (simbolizada por ) y se divide entre n, el número de esos valores.

x
x
n

o en caso de repetirse los valores , multiplicando cada valor por el número de repeticiones

(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
Xm = ---------------------------------------------------------------------------------------
n

Media geométrica

Se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos
resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media
geométrica.

La media geométrica se suele utilizar en series de datos como tipos de interés anuales,
inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años
anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.

La ventaja de la media es que, en su cálculo se utilizan todos los valores de la serie, por lo que
no se pierde ninguna información. Sin embargo, presenta el problema de que su valor (tanto en
el caso de la media aritmética como geométrica) se puede ver muy influido por valores
extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían
condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

Media cuadrática

Es la media de los valores de la variable al cuadrado es decir :

x 
2 x f i
2
i

N
Media Armónica

Es la media de los valores inversos de la variable, o la inversa de la media aritmética

N
H
f
 i
xi

La media armónica se utiliza cuando la variable se encuentra medida en términos relativos. Por
ejemplo la velocidad.

Mediana

Abreviada Md, es el número a la mitad en un conjunto ordenado de mediciones. Si hay un


número impar de mediciones en el conjunto, existe un y sólo un número colocado a la mitad a la
cual nombramos mediana. Si hay un número par de mediciones en el conjunto, entonces
existen dos números a la mitad; por convenio la mediana cae a medio camino entre ellos.
Entonces los números se ordenan de menor a mayor, y la Md = (Yn/2 + Yn/2 + 1)/2, dado que n
es par.

md =
Y
n 2  Yn 2  1
2

Ejemplo:

Se tienen los siguientes datos ordenados de menor a mayor, 1, 3, 4, 6, y 20. Para obtener la
mediana tenemos Md = n+1/2, o sea Md = 5+1/2= 3; el número situado en la tercera posición
corresponde al valor de la mediana.
1 3 4 6 20

Md

Ejemplo:

Supongamos que tenemos las siguientes mediciones 2, 3, 4, 6, 10, 11, 11 y 17. De la misma
forma obtenemos la mediana Md = 8+1/2 = 4.5; como en la posición 4.5 está entre 6 y 10
sumamos 6 + 10/2 = 8. Entonces la mediana es 8.

2 3 4 6 10 11 11 17
8
Md
Moda

Abreviada Mo, es el valor que ocurre con mayor frecuencia en un conjunto de mediciones; si
dos valores tienen la misma frecuencia, se dice que el conjunto es bimodal; si tres valores
tienen la misma frecuencia, es trimodal, etc.

Ejemplo:

Supongamos que tenemos el conjunto de mediciones 1, 3, 4, 4, 7, 3, 3, 4, 2 7, 8, 3, 1.


Organizando estos datos en una tabla de frecuencias tendremos lo siguiente:

Medida Conteo
1 II
2 I
3 Moda IIII
4 III
7 II
8 I
Ejemplo:

Considérese el siguiente conjunto de datos: 22, 26, 27, 23, 23, 27, 22, 28, 22, 28, 30, 29.
Organizando estos datos en una tabla de frecuencias tendremos lo siguiente:

Medida Conteo
22 Moda III
23 II
25 I Bimodal
26 I
27 Moda III
28 II
29 I
30 I
COMPARACIÓN DE LAS MEDIDAS DE TENDENCIA CENTRAL O POSICIÒN

MEDIDAS VENTAJAS DESVENTAJAS


Media 1.- Considera cada dato. 1.- Afectada por mediciones
(peso) 2.- Estable. extremas.
3.- Válida en cálculos 2.- No se puede usar cuando la
matemáticos. distribución está incompleta.
3.- Engañosa en distribuciones
asimétricas y/o bimodales.
Mediana 1.- Válida para datos ordinales. 1.- Menos estable que el
(área) 2.- No es sensible a datos promedio.
extremos. 2.- Válida sólo para algunos
3.- Usada en distribuciones cálculos matemáticos.
incompletas.
Moda 1.- Válida para datos nominales. 1.- Medida menos estable.
(altura) 2.- Localiza la concentración 2.- No válida en cálculos
más grande de datos. matemáticos.
3.- Su cálculo es rápido.
4.- Útil para series asimétricas
y/o bimodales.
MEDIDAS DE DISPERSIÓN (Variabilidad)

Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o


menos concentrados, o más o menos dispersos
Una medida de dispersión, es solo un número que representa el desarrollo o el valor de la
dispersión misma en un conjunto de datos. La búsqueda de información se dirige
inmediatamente a las medidas de dispersión. Las medidas de dispersión amplitud(rango), la
Varianza y la desviación estándar, describen el grado de dispersión o variabilidad de los datos.
Los valores de estas medidas de dispersión serán mayores cuando los datos estén muy
disgregados, y serán menores cuando los datos estén más agrupados.

Amplitud

La amplitud (Rango), es la medida de dispersión más sencilla. Es la diferencia entre el dato de


mayor valor (H) y el dato menor (L) valor.

Amplitud = H –L

Ejemplo:

Se tienen los datos de una muestra 3, 3, 5, 6, 8.

Amplitud = 8-3 = 5.

La amplitud señala que los cinco datos se encuentran dentro de una distancia de 5
unidades sobre la recta numérica.

Varianza

La Varianza es un valor promedio de la suma de todos los cuadrados de las distancias respecto
ala media en un conjunto de datos.

La Varianza (S2) de una muestra es el valor numérico que se obtiene de la siguiente manera:

x  x
2

S 
2

n 1

Donde n es el tamaño de la muestra, o sea el número de elementos que contiene. La varianza


de una muestra es una medida de la dispersiónde los datos con respecto a la media.
Propiedades:

1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y es
cuando todos los valores de la variable son iguales.

2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable es la
misma que la que tenía antes.

Es decir si xi´= xi+K entonces S2x´= S2x

Ejemplo:

La Varianza de la muestra de la variable = (6, 3, 8, 5, 3). Se obtiene en la siguiente tabla:

Paso 1.  Paso 3.  -media Paso 4. ( - media)2


6 1 1
3 -2 4
8 3 9
5 0 0
3 -2 4
25 0 18
Paso2 Paso 5

x
 x

25
5 S 
2  x  x
2


18
 4.5
n 5 n 1 4

Desviación estándar

Es la raíz cuadrada de la Varianza. Esta medida es muy útil para describir o medir la dispersión
de un conjunto de datos alrededor de la media.

x  x
2

S S  2
 n 1
(1.4)
COMPARACIÓN DE LAS MEDIDAS DE DISPERSIÓN.

MEDIDAS VENTAJAS DESVENTAJAS


Rango 1.- Fácil de calcular. 1.- Sólo considera las dos
observaciones de los extremos.
2.- Altamente sensible a los
valores extremadamente
grandes o pequeños.
Coeficiente 1.- Útil para comparar 1.- No contiene buenas
de Variación observaciones de diferentes propiedades para ser utilizado
conjuntos. en cálculos estadísticos, porque
2.- Utilizado en la comparación de asume que la desviación típica
métodos clínicos. es proporcional a la media.
3.- Fácil lectura en porcentaje. 2.- No se promueve su eso
extenso.
Desviación 1.- Usada en cálculos 1.- No tiene una interpretación
Estándar matemáticos. en sí misma.
2.- Considera todos los datos. 2.- Difícil cálculo manual.

ESTADÍSTICAS DE ORDEN

Se le llaman estadísticas de orden a ciertos valores en la escala de los datos ordenados. Son
estadísticas de orden el mínimo X(1), el máximo X(n), los cuartiles y los deciles. A la mediana
también se le considera estadística de orden.

Cuartiles

El cuartil primero, a veces denotado Q1, es el valor o dato abajo del cual cae el 25% de los
datos. Analógicamente, Q3, es el valor o dato abajo del cual cae el 75% de los casos.

25% 25% 25% 25%


L Q1 Q2 Q3 H
Deciles

Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.

Percentiles

Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo
de alumnos (lección 2ª). Los deciles y centiles se calculan de igual manera, aunque haría falta
distribuciones con mayor número de datos.

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

1º cuartil: es el valor 1,22 cm, ya que por debajo suya se sitúa el 25% de la frecuencia (tal
como se puede ver en la columna de la frecuencia relativa acumulada).

2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la
frecuencia.
Coeficiente de variación de Pearson

Se calcula como cociente entre la desviación típica y la media de la muestra. En el caso del
ejercicio anterior sería de la siguiente manera:

Cv = 0,0320 / 1,253

Igual a

Cv = 0,0255

El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de
dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en
las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los
alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las
desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus
coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.

You might also like