Medidas de TC y Dispersion

Media
• La media aritmética o simplemente promedio (también

llamada media muestral ya que generalmente se calcula con
relación a una muestra) se calcula de la siguiente forma: si las
observaciones de una muestra de tamaño n son x1, x2,…,xn
entonces
n
x
x 1  x 2  ...  x n i  1
i
X 
n n
• Es intuitiva y fácil de calcular.
• Su valor puede que no coincida con ninguno de los valores
de la muestra
• La suma de las diferencias de cada valor de la muestra con la
media su resultado es cero, es decir,
 (x  x)  0
i 1
i
Mediana
• La mediana se suele definir como el valor “más intermedio”

una vez que los datos han sido ordenados en forma creciente.
Se suele denotar por Me. La forma más general de calcular la
mediana es la siguiente:
 x  n  1 2 si n es impar

Me   x
 n 2   x  ( n 2) 1
 si n es par
 2
• La mediana es aquel valor que deja el cincuenta por ciento de
los datos por debajo y otro cincuenta por encima.
• Cabe destacar que es preferible el uso de la mediana como
medida descriptiva del centro cuando se quiere reducir o
eliminar el efecto de valores extremos en un conjunto de
datos (muy grandes o muy pequeños).
Moda
• Es una medida de tendencia central que se puede utilizar sea
cual sea el tipo de variable a estudiar. La moda de un conjunto
de observaciones es el valor que más se repite, aquel cuya
frecuencia absoluta es máxima. Puede ser única, que haya
más de una, o que no exista.
Media geométrica
• Se define como la raíz n-ésima del producto de todos los

valores numéricos, es decir,
n
X G  n x1.x2 ....xn  n ( xi )
i 1
Media armónica
• Se define como el número de observaciones de la
muestra dividido por la suma del inverso de cada una de
las observaciones, es decir,
n
XA  n
 (1 / x )
i 1
i
• La localización o tendencia central de un conjunto de datos no
necesariamente proporciona información suficiente para
describirlos adecuadamente. Debido a que no todos los
valores son semejantes, la variación entre ellos se considera
importante. Se puede decir que un conjunto de datos tiene
una dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de localización de
interés y se dice que tiene una dispersión grande si se
esparcen ampliamente alrededor de alguna medida de
localización de interés.
• Las medidas descriptivas más comunes de
dispersión son: el rango, la varianza, la
desviación estándar y el rango intercuartílico.
Rango
• El rango de la muestra es la medida de variabilidad más

sencilla entre todas las mencionadas; y se define como la
diferencia entre la observación más grande y la más pequeña
:
r  xmax  xmin
• Aunque es una medida muy fácil de calcular, ignora toda la
información de la muestra entre las observaciones más
grande y más pequeña. Sin embargo, vale la pena resaltar que
el rango se utiliza mucho en aplicaciones estadísticas al
control de calidad.
• En general, se desea una medida de variabilidad que dependa
de todas las observaciones y no sólo de unas pocas; así que
parece razonable medir la variación en términos de las
desviaciones relativas a alguna medida de localización
(generalmente esta medida es la media).
Para el conjunto de datos x1, x2,….,xn
Las diferencias ( x1  x ), ( x2  x ),....., ( xn  x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es cero,
se utiliza como medida de variabilidad el
promedio de los cuadrados de tales desviaciones.
n
 (x  x)
i
2
s 
2 i 1
n
Sin embargo, como sólo hay n-1 desviaciones

independiente se conviene en dividir entre
n-1, es decir,
Varianza
n
 (x i  x) 2
S2  i 1
n 1
Desviación estándar
• Esta medida de variabilidad se denomina varianza. Como S2

no tiene las mismas unidades que los datos, se define la
desviación estándar como la raíz cuadrada (positiva) de la
varianza a fin de tener una medida en las mismas unidades de
los datos. La desviación estándar es útil para comparar
dispersión entre dos poblaciones, pero también lo es para
calcular el porcentaje de la población que pueden localizarse
a menos de una distancia específica de la media.
Ejemplo: departamentos en renta
Abajo encontrara una muestra de los valores de renta mensuales para un
departamento de una recamara. Los datos son una muestra de 70 apartamentos
en una ciudad de los Estados Unidos. Los datos se presentan en orden
ascendente.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Datos no agrupados
• Son datos no agrupados cuando se consideran y analizan todos los valores

observados tal como se obtuvieron. Es conveniente y mas sencillo trabajar a estos
datos como no agrupados cuando la muestra no es muy grande. De preferencia
que sea una cantidad menor de 30 datos. También resulta conveniente trabajarlos
así cuando se quiere que el peso de cada observación se vea reflejado en el
resumen de los datos.
Ventajas y desventajas
VENTAJAS
• Resulta más fácil y rápido trabajar con los datos no agrupados.
DESVENTAJAS
• Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes
cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de
equivocarse.
Datos agrupados
• Son datos que están organizados (formando grupos). Podemos formar más o
menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le
llamamos clase. Rara vez se emplean menos de seis clases o más de quince.
Ventajas
• Facilidad y rapidez en el manejo de datos.

• Se notan rápidamente el valor mayor y el valor menor de los datos
• Se puede dividir fácilmente los datos en secciones.
• Se puede observar si algún valor aparece más de una vez en el ordenamiento.
• Se observa la distancia entre los valores sucesivos de los datos.
Media ponderada y manejo de datos
agrupados
• Media ponderada
• Media para datos agrupados
• Varianza para datos agrupados
• Desviación estándar para datos agrupados
Media ponderada
• Cuando la media es calculada dándole a cada valor de dato un peso
que refleja su importancia, es referido como una media ponderada.
• En el calculo de promedio de calificaciones (tipo USA), el peso es el
número de créditos obtenidos para cada grado.
• Cuando los valores de los datos varían en importancia, el analista
debe escoger el peso que refleje la importancia de cada valor.
Media ponderada
x =  wi xi
 wi
donde:
xi = valor de observación i
wi = peso de observaciòn i
Datos agrupados
• El calculo de la media pondera puede ser usado para obtener aproximaciones
al promedio, varianza, y desviación estándar de datos agrupados.
• Para calcular la media ponderada, tratamos el punto medio de cada clase
como si fuera la media de todos los elementos en la clase.
• Calculamos una media ponderada de los puntos medios utilizando las
frecuencias de la clase como pesos.
• Similarmente, al calcular la varianza y desviación estándar las frecuencias de
las clases son utilizadas como pesos.
Media para datos agrupados
• Muestra
x
 fM i i
f i
• Población
  fM i i
donde:
fi = Frecuencia de la clase i
Mi = punto medio de la clase i
Abajo está la muestra de las rentas mensuales para departamentos de una
recamara presentados aquí como datos agrupados en la forma de distribución
de frecuencias
Renta ($) Frecuencia

420-439 8
440-459 17
460-479 12
480-499 8
500-519 7
520-539 4
540-559 2
560-579 4
580-599 2
600-619 6
• Media para datos agrupados
Renta ($) fi Mi f iMi

420-439 8 429.5 3436.0 34, 525
x  493. 21
440-459 17 449.5 7641.5 Esta aproximación
70
460-479 12 469.5 5634.0
difiere en $2.41 de la
480-499 8 489.5 3916.0
media real de la muestra de
500-519 7 509.5 3566.5
$490.80.
520-539 4 529.5 2118.0
540-559 2 549.5 1099.0
560-579 4 569.5 2278.0
580-599 2 589.5 1179.0
600-619 6 609.5 3657.0
Total 70 34525.0
Varianza para datos agrupados
• Muestra
 f ( M  x ) 2
s2  i i
n 1
• Población
 f ( M   ) 2
2  i i
N
• Varianza para datos agrupados
s2  3, 017.89
• Desviación Estándar para datos agrupados
s  3, 017.89  54. 94
Esta aproximación difiere en solo $.20
de la desviación estándar de $54.74.

Medidas de TC y Dispersion

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Medidas de TC y Dispersion

Uploaded by

Copyright:

Available Formats

Media

• La media aritmética o simplemente promedio (también

• La mediana se suele definir como el valor “más intermedio”

• Se define como la raíz n-ésima del producto de todos los

• El rango de la muestra es la medida de variabilidad más

Sin embargo, como sólo hay n-1 desviaciones

• Esta medida de variabilidad se denomina varianza. Como S2

• Son datos no agrupados cuando se consideran y analizan todos los valores

• Resulta más fácil y rápido trabajar con los datos no agrupados.

• Facilidad y rapidez en el manejo de datos.

Renta ($) Frecuencia

Renta ($) fi Mi f iMi

• Desviación Estándar para datos agrupados

You might also like