You are on page 1of 4

UNIDAD 5 ESTADSTICA DESCRIPTIVA

Algunos conceptos
Dato: resultado de una evaluacin cualitativa o cuantitativa de un suceso.
Informacin: conjunto de datos interrelacionados.
Universo: conjunto de todos los elementos que sern los portadores de la informacin sobre la
caracterstica en estudio.
Poblacin: conjunto total de unidades estadsticas con determinadas caractersticas comunes.
Muestra: subconjunto del universo en estudio.
Frecuencia relativa: es la proporcin de la cantidad total de datos que pertenecen a una clase en
particular.
Frecuencia absoluta: es la cantidad de veces que ocurre A en n repeticiones de un experimento
aleatorio.
Porcentaje: es la frecuencia relativa multiplicada por 100
Histograma: grfico de barras donde bsicamente la barra tendr como ancho el intervalo de la clase.
La barra tendr mayor superficie cunto mayor sea la densidad de frecuencia.
ANLISIS DE DATOS Y GENERACIN DE RESULTADOS
A partir de la graficacin del histograma, surge la necesidad de generar medidas que representen a los
valores de la serie (que describan las caractersticas del conjunto de datos). Las caractersticas ms
relevantes para la toma de decisiones son: la tendencia central y la dispersin, y de menor relevancia
son el sesgo y la curtosis.
Las medidas de tendencia central nos indican el centro o ubicacin general de los valores de los
datos; nos posicionan en algn lugar del intervalo real que representa a aqullos; en tanto que las
medidas de dispersin nos informan sobre el grado en que las observaciones se distribuyen.
El sesgo nos informa si la distribucin de los datos es simtrica con respecto a una recta perpendicular
al eje de las abscisas y la curtosis nos da el grado de agudeza de la distribucin.
MEDIDAS DE TENDENCIA CENTRAL
1) MEDIA
Es un promedio. Hay 3 tipos: la media aritmtica, la media geomtrica y la media armnica.
a) MEDIA ARITMTICA
Es un tipo de promedio que depende de todos los valores de la serie. Se calcula:

Donde:
Xi es el punto medio de los valores del intervalo
Fi es la frecuencia (nmero de observaciones que presenta el intervalo)
N es la cantidad total de observaciones.
b) MEDIA GEOMTRICA
Est menos afectada por los valores extremos de la variable que la media aritmtica, pero cuando uno
de sus valores es cero o menor que cero ya no se puede calcular.

c) MEDIA ARMNICA
Su uso es excepcional. Se suele utilizar para comparacin de salarios reales.

2) MEDIANA
Es un valor que separa a la serie ordenada, en dos grupos que contienen la misma cantidad de datos, de
manera tal que en el primer grupo se encuentran todos aquellos valores menores o iguales a ella y en el
segundo grupo el resto de los valores.

La mediana permite dividir a los trminos de ordenados de la serie en dos grupos que contienen la
misma cantidad de elementos; pero se podra pensar en dividir a la serie en cuatro, diez o cien grupos
que contengan cada uno de ellos- la misma cantidad de elementos. Surge entonces la de idea de
cuartiles (generacin de 4 grupos), deciles (diez grupos) y percentiles (cien grupos); para los cuales la
modalidad de clculo sigue la misma lgica que para la Mediana. Tngase presente que el cuartil 2
coincide con el valor de la Mediana, lo mismo que sucede con el decil 5 y el percentil 50
a) CUARTIL

b) DECIL

c) PERCENTIL

3) MODO MODA
Es el valor de la variable que mayor cantidad de observaciones presenta.

Para elegir el intervalo, se debe seleccionar el que posee la mayor altura (clase modal).
Donde:
d1= Hi de la Clase modal Hi del intervalo anterior.
d2= Hi de la Clase modal Hi del intervalo posterior.

MEDIDAS DE DISPERSIN
1) RANGO
Es la distancia entre el mayor y el menor de los valores observados.
2) VARIANZA
Es una medida de variabilidad basada en las desviaciones respecto de la Media de la variable.

ANLISIS DE SIMETRA

ASIMTRICA A IZQUIERDA

SIMTRICA

ASIMTRICA A DERECHA

1) COMPARACIN DE LA MEDIA CON LA MEDIANA Y LA MODA.


Media < Mediana < Moda Asimtrica a izquierda o datos sesgados a izquierda.
Media = Mediana = Moda Simtrica o datos no sesgados.
Moda < Mediana < Media Asimtrica a derecha o datos sesgados a derecha.
2) COMPARACIN RELATIVA DE LA MEDIA CON LA MEDIANA RESPECTO DE LA
DESVIACIN ESTNDAR
As < 0: asimtrica a izquierda o datos sesgados a izquierda.
As = 0: simtrica o datos no sesgados.
As > 0: asimtrica a derecha o datos sesgados a derecha.
3) COEFICIENTE DE ASIMETRA
CAs < 0: asimtrica a izquierda o datos sesgados a izquierda.
CAs = 0: simtrica o datos no sesgados.
CAs > 0: asimtrica a derecha o datos sesgados a derecha.

CURTOSIS
Muestra la diferencia existente entre la altura de la curva en cuestin y la altura de la Normal (3)

K > 3: Leptocrtica
K = 3: Mesocrtica
K < 3: Platicrtica

DIAGRAMA DE CAJA Y BIGOTE


Un diagrama de caja es un grfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Est compuesto por un rectngulo, la "caja", y dos brazos, los "bigotes".
Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles q(1), q(2)
(o mediana) y q(3); y sobre la existencia de valores atpicos y la simetra de la distribucin.

valores
atpicos
severos

BIE

BII

valores
atpicos
moderados

min(x) q(1)

RIC = q (3) q (1)


P (25) = q (1)
P (50) = q (2) = Me
P (75) = q (3)
RIC: Rango intercuartlico
BIE: Barrera Inferior Externa
BII: Barrera Inferior Interna
BSI: Barrera Superior Interna
BSE: Barrera Superior Externa

valores tpicos

q(2)

valores valores
atpicos atpicos
moderados severos

q(3) mx(x) BSI

BIE = q (1) 3*RIC


BII = q (1) 1,5*RIC
BSI = q (3) + 1,5*RIC
BSE = q (3) + 3*RIC

BSE

You might also like