You are on page 1of 31

Media

• La media aritmética o simplemente promedio (también


llamada media muestral ya que generalmente se calcula con
relación a una muestra) se calcula de la siguiente forma: si las
observaciones de una muestra de tamaño n son x1, x2,…,xn
entonces
n

x
x 1  x 2  ...  x n i  1
i

X 
n n
• Es intuitiva y fácil de calcular.
• Su valor puede que no coincida con ninguno de los valores
de la muestra
• La suma de las diferencias de cada valor de la muestra con la
media su resultado es cero, es decir,

 (x  x)  0
i 1
i
Mediana

• La mediana se suele definir como el valor “más intermedio”


una vez que los datos han sido ordenados en forma creciente.
Se suele denotar por Me. La forma más general de calcular la
mediana es la siguiente:

 x  n  1 2 si n es impar

Me   x
 n 2   x  ( n 2) 1
 si n es par
 2
• La mediana es aquel valor que deja el cincuenta por ciento de
los datos por debajo y otro cincuenta por encima.
• Cabe destacar que es preferible el uso de la mediana como
medida descriptiva del centro cuando se quiere reducir o
eliminar el efecto de valores extremos en un conjunto de
datos (muy grandes o muy pequeños).
Moda
• Es una medida de tendencia central que se puede utilizar sea
cual sea el tipo de variable a estudiar. La moda de un conjunto
de observaciones es el valor que más se repite, aquel cuya
frecuencia absoluta es máxima. Puede ser única, que haya
más de una, o que no exista.
Media geométrica

• Se define como la raíz n-ésima del producto de todos los


valores numéricos, es decir,

n
X G  n x1.x2 ....xn  n ( xi )
i 1
Media armónica
• Se define como el número de observaciones de la
muestra dividido por la suma del inverso de cada una de
las observaciones, es decir,

n
XA  n

 (1 / x )
i 1
i
• La localización o tendencia central de un conjunto de datos no
necesariamente proporciona información suficiente para
describirlos adecuadamente. Debido a que no todos los
valores son semejantes, la variación entre ellos se considera
importante. Se puede decir que un conjunto de datos tiene
una dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de localización de
interés y se dice que tiene una dispersión grande si se
esparcen ampliamente alrededor de alguna medida de
localización de interés.
• Las medidas descriptivas más comunes de
dispersión son: el rango, la varianza, la
desviación estándar y el rango intercuartílico.
Rango

• El rango de la muestra es la medida de variabilidad más


sencilla entre todas las mencionadas; y se define como la
diferencia entre la observación más grande y la más pequeña
:

r  xmax  xmin
• Aunque es una medida muy fácil de calcular, ignora toda la
información de la muestra entre las observaciones más
grande y más pequeña. Sin embargo, vale la pena resaltar que
el rango se utiliza mucho en aplicaciones estadísticas al
control de calidad.
• En general, se desea una medida de variabilidad que dependa
de todas las observaciones y no sólo de unas pocas; así que
parece razonable medir la variación en términos de las
desviaciones relativas a alguna medida de localización
(generalmente esta medida es la media).
Para el conjunto de datos x1, x2,….,xn
Las diferencias ( x1  x ), ( x2  x ),....., ( xn  x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es cero,
se utiliza como medida de variabilidad el
promedio de los cuadrados de tales desviaciones.
n

 (x  x)
i
2

s 
2 i 1
n

Sin embargo, como sólo hay n-1 desviaciones


independiente se conviene en dividir entre
n-1, es decir,
Varianza
n

 (x i  x) 2

S2  i 1
n 1
Desviación estándar

• Esta medida de variabilidad se denomina varianza. Como S2


no tiene las mismas unidades que los datos, se define la
desviación estándar como la raíz cuadrada (positiva) de la
varianza a fin de tener una medida en las mismas unidades de
los datos. La desviación estándar es útil para comparar
dispersión entre dos poblaciones, pero también lo es para
calcular el porcentaje de la población que pueden localizarse
a menos de una distancia específica de la media.
Ejemplo: departamentos en renta
Abajo encontrara una muestra de los valores de renta mensuales para un
departamento de una recamara. Los datos son una muestra de 70 apartamentos
en una ciudad de los Estados Unidos. Los datos se presentan en orden
ascendente.

425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Datos no agrupados

• Son datos no agrupados cuando se consideran y analizan todos los valores


observados tal como se obtuvieron. Es conveniente y mas sencillo trabajar a estos
datos como no agrupados cuando la muestra no es muy grande. De preferencia
que sea una cantidad menor de 30 datos. También resulta conveniente trabajarlos
así cuando se quiere que el peso de cada observación se vea reflejado en el
resumen de los datos.
Ventajas y desventajas

VENTAJAS

• Resulta más fácil y rápido trabajar con los datos no agrupados.

DESVENTAJAS
• Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes
cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de
equivocarse.
Datos agrupados

• Son datos que están organizados (formando grupos). Podemos formar más o
menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le
llamamos clase. Rara vez se emplean menos de seis clases o más de quince.
Ventajas

• Facilidad y rapidez en el manejo de datos.


• Se notan rápidamente el valor mayor y el valor menor de los datos
• Se puede dividir fácilmente los datos en secciones.
• Se puede observar si algún valor aparece más de una vez en el ordenamiento.
• Se observa la distancia entre los valores sucesivos de los datos.
Media ponderada y manejo de datos
agrupados
• Media ponderada
• Media para datos agrupados
• Varianza para datos agrupados
• Desviación estándar para datos agrupados
Media ponderada
• Cuando la media es calculada dándole a cada valor de dato un peso
que refleja su importancia, es referido como una media ponderada.
• En el calculo de promedio de calificaciones (tipo USA), el peso es el
número de créditos obtenidos para cada grado.
• Cuando los valores de los datos varían en importancia, el analista
debe escoger el peso que refleje la importancia de cada valor.
Media ponderada

x =  wi xi
 wi

donde:
xi = valor de observación i
wi = peso de observaciòn i
Datos agrupados
• El calculo de la media pondera puede ser usado para obtener aproximaciones
al promedio, varianza, y desviación estándar de datos agrupados.
• Para calcular la media ponderada, tratamos el punto medio de cada clase
como si fuera la media de todos los elementos en la clase.
• Calculamos una media ponderada de los puntos medios utilizando las
frecuencias de la clase como pesos.
• Similarmente, al calcular la varianza y desviación estándar las frecuencias de
las clases son utilizadas como pesos.
Media para datos agrupados

• Muestra
x
 fM i i

f i

• Población

  fM i i

donde:
fi = Frecuencia de la clase i
Mi = punto medio de la clase i
Ejemplo: departamentos en renta
Abajo está la muestra de las rentas mensuales para departamentos de una
recamara presentados aquí como datos agrupados en la forma de distribución
de frecuencias

Renta ($) Frecuencia


420-439 8
440-459 17
460-479 12
480-499 8
500-519 7
520-539 4
540-559 2
560-579 4
580-599 2
600-619 6
Ejemplo: departamentos en renta
• Media para datos agrupados

Renta ($) fi Mi f iMi


420-439 8 429.5 3436.0 34, 525
x  493. 21
440-459 17 449.5 7641.5 Esta aproximación
70
460-479 12 469.5 5634.0
difiere en $2.41 de la
480-499 8 489.5 3916.0
media real de la muestra de
500-519 7 509.5 3566.5
$490.80.
520-539 4 529.5 2118.0
540-559 2 549.5 1099.0
560-579 4 569.5 2278.0
580-599 2 589.5 1179.0
600-619 6 609.5 3657.0
Total 70 34525.0
Varianza para datos agrupados
• Muestra

 f ( M  x ) 2
s2  i i
n 1

• Población
 f ( M   ) 2
2  i i
N
Ejemplo: departamentos en renta
• Varianza para datos agrupados

s2  3, 017.89

• Desviación Estándar para datos agrupados

s  3, 017.89  54. 94
Esta aproximación difiere en solo $.20
de la desviación estándar de $54.74.

You might also like