You are on page 1of 39

MEDIDAS DE TENDENCIA

CENTRAL Y POSICIÓN
MEDIDAS DE TENDENCIA
CENTRAL
 DATOS NO AGRUPADOS: Se utiliza para analizar
poblaciones o muestras pequeñas generalmente
cuando tienen 30 o menos elementos.
 MEDIDAS DE TENDENCIA CENTRAL: Son medidas
que describen el centro de una distribución, que es
donde se localizan la mayor parte de los datos (caso
típico en la distribución normal)
 MEDIA ARITMÉTICA: Es el valor equidistante entre
el grupo de mayor valor y el punto de menor valor de
una serie de datos.
n

 xi
x i 1
n
MEDIDAS DE TENDENCIA CENTRAL

 EJEMPLO:
◦ 2, 10, 4, 6, 9, 7, 5, 12
◦ Sumatoria 55
◦ Número de datos 8
55
x 
8
◦ Media= 6.875
MEDIDAS DE TENDENCIA CENTRAL
 LA MEDIANA: Es el valor que divide en
dos partes iguales a una serie de datos
finitos. Para encontrar la mediana es
necesario ordenar los datos, y pueden
ocurrir dos casos:
◦ Que el número de datos sea impar, la
mediana será valor central de la serie.
3,5,8,12,25 la mediana 8.
◦ Que el número de datos sea par, la mediana
será la media aritmética de los valores
centrales. 2,4,7,25,39,47. La mediana es 16
o sea la media de 7 y 25.
MEDIDAS DE TENDENCIA CENTRAL

 LA MODA: Es el valor que ocurre con


más frecuencia en una serie de
datos. Si no existe se denomina
amodal, donde existe más de una
toma el nombre de bimodal, trimodal,
etc.
◦ 1,2,3,4,5,7,8 no existe moda “AMODAL”
◦ 1,5,6,6,7,8,9 La moda es 6
MEDIDAS DE TENDENCIA
CENTRAL
 DATOS AGRUPADOS: Cuando la
cantidad de datos es grande, es
conveniente agrupar los datos en
distribuciones de frecuencias según
tema anterior.
 MEDIA O PROMEDIO: El valor del
punto medio de la clase, como valor
de las observaciones de los datos de
la tabla de frecuencias.
1880
x  62.67
30
MEDIDAS DE TENDENCIA
CENTRAL
 MEDIANA: Para su calculo se utiliza la
siguiente formula:
(n / 2  fa )
Me  Li  c
f
Li= límite real inferior de la clase mediana.
N= numero de datos o sumatoria de
frecuencias.
fa= Frecuencias acumulada anterior a la
clase mediana.
f= frecuencia de la clase mediana.
La clase mediana se determina por n/2 y
observando la frecuencia acumulada.
MEDIDAS DE TENDENCIA
CENTRAL

(30 / 2  8)
Me  57.5  5
9

MEDIANA= 61.39
MEDIDAS DE TENDENCIA
CENTRAL
 MODA: Para su calculo se utiliza la siguiente
formula: (d1)
Mo  Li  c
(d1  d 2)
Li= limite real inferior de la clase modal.
d1= frecuencia de la clase modal menos
frecuencia anterior.
d2= frecuencia de la clase modal menos
frecuencia posterior.
c= amplitud de clase.
La clase modal es la que tiene la más alta
frecuencia.
MEDIDAS DE TENDENCIA
CENTRAL

(1)
Mo  57.5  5
(1  3)

En nuestro ejemplo la más alta frecuencia


es 9, 58-62
MODA= 58.75

D1= 9-8=1
D2= 9-6=3
MEDIDAS DE POSICIÓN
 CUANTILES: Son medidas de posición
que sitúan valores a diferentes puntos de
la distribución, los más utilizados son los
quartiles, los deciles y los percentiles.
 QUARTILES: Dividen la distribución en
cuatro partes iguales Q1, Q2, Q,3.
(nj / 4  fa )
Qj  Li  c
f
MEDIDAS DE POSICIÓN
 Qj;j=1,2,3

((30 *1) / 4)  0
Q1  52.5  5
8
Q1  57.1875
MEDIDAS DE POSICIÓN
 DECILES: Dividen la distribución en diez
partes iguales D1, D2, D3…D9
(nj / 10  fa )
Dj  Li  c
f
((30 * 8) / 10)  23
D8  67.5  5
4
D8  68.75
 Dj;j=1,2,3…9
MEDIDAS DE POSICIÓN
 PERCENTILES: Dividen la distribución en
cien partes iguales P1, P2, P3…P99
(nj / 100  fa )
Pj  Li  c
f
((30 * 85) / 100)  23
P85  67.5  5
4
P85  70.625
 Pj;j=1,2,3…99
MEDIDAS DE DISPERSIÓN
◦ INTRODUCCION
El conocimiento de la forma de
distribución y de las medidas de posición
puede servir para tener una idea bastante
clara de su conformación, pero no de la
homogeneidad de cada uno de los
valores con respecto a la medida de
tendencia central aplicada. Las medidas
de dispersión permiten apreciar el grado
de variabilidad ó propagación de los
datos.
INTRODUCCION

El conocimiento de la forma de
distribución y de las medidas de
posición puede servir para tener una
idea bastante clara de su
conformación, pero no de la
homogeneidad de cada uno de los
valores con respecto a la medida de
tendencia central aplicada.
INTRODUCCION
Las medidas de dispersión permiten
apreciar el grado de variabilidad ó
propagación de los datos y las de
forma pproporcionan un valor
numérico para saber hacia qué lado
de la distribución hay mayor
acumulación de frecuencias y si la
concentración central de frecuencias
es mayor que en los extremos o
viceversa sin tener que graficar los
datos.
EJEMPLO
Si la guía de turismo ecológico dice que el río
tiene en promedio 3 pies de profundidad,
¿querría usted cruzarlo a pie sin más
información? Quizá no.
Usted desearía saber algo sobre la variación
de la profundidad. ¿Mide 3.25 pies la máxima
profundidad y 2.75 la mínima? En dicho caso,
usted estaría de acuerdo en cruzar. ¿Qué hay
si la profundidad del río varia de 0.50 a 5.5
pies? Su decisión probablemente sería no
cruzar.
Antes de tomar una decisión, usted desea
información tanto de la profundidad típica como
de la dispersión de la profundidad del río…
CONSIDERACIONES

Una medida de dispersión pequeña indica que


los datos se acumulan con proximidad
alrededor de la media aritmética. Por
consiguiente, la media se considera
representativa de los datos. Por el contrario,
una medida grande de dispersión indica que la
media no es confiable…
EJEMPLO
Los 100 empleados de Hammond Iron Works,
Inc., una compañía que fabrica acero, se
organizan en un histograma basado en el
número de años que los empleados han
laborado en la compañía. La media es de 4.9
años, pero la dispersión de los datos es de 6
meses a 16.8 años.

Es representativa la media en la distribución?


CONSIDERACIONES
Una segunda razón de la importancia de las
medidas de dispersión en un conjunto de datos
consiste en comparar la propagación en dos o
más distribuciones

Por ejemplo:
Suponga que el nuevo monitor de computadora
Vision Quest LCD se arma en Baton Rouge y
también en Tucson. La producción media
aritmética por hora, en ambas plantas, es de 50.
Sobre la base de las dos medias, podría concluir
que las distribuciones de las producciones por
hora son idénticas
EJEMPLO
los registros de producción de 9 horas en las dos
plantas revelan que esta conclusión no es correcta.

La producción de Baton Rouge varía de 48 a 52


montajes por hora. La producción en la planta de
Tucson es más errática, ya que varía de 40 a 60 la
hora.
Por lo tanto, la producción por hora en Baton Rouge se
acumula cerca de la media de 50; la producción por
hora de Tucson es más dispersa
MEDIDAS DE DISPERSIÓN DATOS NO
AGRUPADOS
RANGO
Es la diferencia entre la mayor y la menor observación
en una serie de datos. Estos es:
Mide la propagación total en la serie de datos, es una
medición simple y de fácil cálculo pero su

Rango  xmayor  xmenor


debilidad es que no logra tomar en cuenta la forma en
que los datos se distribuyen realmente entre el mayor y
el menor valor.
Usando los datos: 2, 4, 5, 6, 7, 9, 10, 12 El Rango sería:
R= 12- 2 = 10
LA VARIANZA
Es el cuadrado medio de las desviaciones de una
serie de datos, con respecto a su media
aritmética y se calcula de la siguiente manera:
( xi )
2

 ( x 
 2
x )  xi 
2

N
s2  i

N N

Con los datos del ejemplo 1 tenemos:


Sumatoria Xi= 55
Sumatoria Xi^2 = 455

552
455 
s2  8  9.6093
8
LA DESVIACION STANDARD
El cálculo de la varianza, se hace utilizando
datos cuadráticos con el objetivo de que las
desviaciones no se cancelen entre sí, por esta
razón, es necesario trabajar con valores
originales (no elevados al cuadrado) y esto se
logra con la desviación standard. El cálculo de
la desviación standard a partir de la varianza, es
simplemente obtener la raíz cuadrada de esta
última.

s  9.6093  3.10
2
Propiedades
El 68.27% de los datos de una distribución,
están a una desviación standard de la
media.

El 95.45% de los datos de una distribución,


están a dos desviaciones estándar de la
media.

El 99.73% de los datos de una distribución,


están a tres desviaciones standard de la
media.
DATOS AGRUPADOS
Media Aritmética

Varianza

Desviación Std
EL COEFICIENTE DE VARIACION
Es una medida de dispersión relativa que
se obtiene dividiendo la desviación estándar
de la serie de datos entre su media
aritmética y se multiplica por 100 para
expresarlo en porcentaje. Es un dato
adimensional puesto que los datos con se
calcula están expresadas en sus
dimensionales originales. Es útil cuando se
quiere comparar series de datos con dos
variables diferentes, ejemplo: altura y peso.
s
C.V .   *100 C.V . 
3.10
*100  45.09
x 6.875
SESGO
Es el grado de asimetría ó falta de simetría de
una distribución. Si la curva de frecuencia tiene
una “cola” más larga a la derecha del máximo
central que a la izquierda, se dice que la
distribución esta sesgada a la derecha ó que
tiene “sesgo positivo”, si es a la izquierda se
dice que tiene “sesgo negativo”.
PRIMER COEFICIENTE DE
PEARSON
En distribuciones sesgadas, la media tiende a
situarse con respecto a la moda al mismo
lado que la cola más larga. Así una medida de
la asimetría nos da por la diferencia (Media-
Moda) y se adimensiona dividiéndola por una
medida de dispersión.


x  Mo 62.67  58.75
sesgo  sesgo   0.5766
s 6.798
SEGUNDO COEFICIENTE DE PEARSON
Para evitar el empleo de la moda, se puede
usar
la fórmula empírica así:

3( x  Me) 3(62.67  61.39)
sesgo  sesgo   0.56487
s 6.798
COEFICIENTE DE SESGO USANDO
EL MOMENTO DE ORDEN TRES
CON RESPECTO A LA MEDIA
En este momento nos va a ser útil la hoja de
cálculo que venimos usando para datos
agrupados agregando lo siguiente:
Continuación tabla peso
estudiantes.........
(x-x)^3 f(x-x)^3 (x-x)^4 f(x-x)^4
-451.217663 -3609.7413 3460.83948 27686.7158
-19.034163 -171.307467 50.8212152 457.390937
12.649337 75.896022 29.4729552 176.837731
393.832837 1575.33135 2886.7947 11547.1788
1874.51634 3749.03267 23112.7864 46225.5729
5204.69984 5204.69984 90197.4482 90197.4482
7015.44652 6823.91111 119738.163 176291.144

6823.91
m
coeficient e sesgo  a3  33  30 3  0.724
s 6.798

COEFICIENTE b1
b1  a  0.724  0.5242
2
3
2
P=0 NORMAL

P>0 DERECHA (+)

DERECHA
P=0 NORMAL

P<0 IZQUIERDA (-)

IZQUIERDA
CURTOSIS
Es el grado de apuntamiento de una
distribución, normalmente se toma en
relación a una normal. Una distribución que
presenta un apuntamiento relativo alto, se le
llama: leptocúrtica, mientras que la curva
que es más achatada se llama platicúrtica.
La distribución normal se llama: mesocúrtica.

La curtosis más utilizada es la que utiliza el


momento de cuarto orden con respecto a la
media expresado en forma adimensional, así:
m4 176291.144
curtosis  a4  4 a4  30  2.75
s 6.798 4

Al coeficiente a4 se le denomina como


b2. Para una distribución normal, b2=
3. Muchas veces la curtosis se designa
como (b2-3), el cuál es positiva para
una distribución leptocúrtica, negativa
para una platicúrtica y 0 para una
mesocúrtica.

You might also like