You are on page 1of 13

DATOS NO AGRUPADOS

EJERCICIO:
Suponga que los siguientes datos representan los ingresos mensuales en
miles de dlares de una empresa.

MESES INGRESOS MENSUALES


ENERO 12
FEBRERO 15
MARZO 10
ABRIL 7
MAYO 21
JUNIO 33
JULIO 23
AGOSTO 12
SEPTIEMBRE 8
OCTUBRE 12

MEDIDAS DE DISPERSION: segundo momento


RANGO
VARIANZA
DESVIACION ESTANDAR

RANGO:

Es la diferencia entre el valor mximo y mnimo de un grupo


de datos.
12, 15, 10, 7, 21, 33, 23, 12, 8, 12.
Ordenar en formar ascendente.
7, 8, 10, 12, 12, 12,15, 21, 23, 33.
RANGO= MAX MIN
RANGO = 33 -7 = 26

VARIANZA
Es el indicador de dispersin alrededor de la media.
n

x x
2
i
S2 i 1

n 1
DATOS: x 15.3
xi 12, 15, 10, 7, 21, 33, 23, 12, 8, 12.

xi x xi x 2
-3.3 10.89
-0.3 0.09
-5.3 28.09
-8.3 68.89
5.7 32.49
17.7 313.29
7.7 59.29
-3.3 10.89
-7.3 53.29
-3.3 10.89
total 588.10
n

x x
2
i
S2 i 1

n 1
588.10
S2
9
S 2 65.3494

DESVIACION ESTANDAR

Mide la dispersin promedio de los datos alrededor de la media.

S S2

S 65.3494
S 8.08359
n 1
Q1 PRIMER CUARTIL X
4 2
2n 1
Q2 SEGUNDO CUARTIL X
4 2
3n 1
Q3 TERCER CUARTIL X
4 2

n 1
D1 PRIMER DECIL X
10 2
2n 1
D2 SEGUNDO DECIL X
10 2
3n 1
D3 TERCER DECIL X
10 2
.
.
.
9n 1
D9 NOVENO DECIL X
10 2

n 1
P1 PRIMER PERCENTIL X
100 2
2n 1
P2 SEGUNDO PERCENTIL X
100 2
3n 1
P3 TERCER PERCENTIL X
100 2
.
.
.
99n 1
P99 NOVENO PERCENTIL X
100 2
SEGUNDO MTODO: OK
EJERCICIO:
Suponga que los siguientes datos representan los ingresos mensuales en
miles de dlares de una empresa.

MESES INGRESOS MENSUALES


ENERO 12
FEBRERO 15
MARZO 10
ABRIL 7
MAYO 21
JUNIO 33
JULIO 23
AGOSTO 12
SEPTIEMBRE 8
OCTUBRE 12

DETERMINAR LOS CUARTILES: Q1, Q2, Q3


Dados los datos : 12, 15, 10, 7, 21, 33,23,12,8,12.

1. Ordenar en forma ascendente:

7,8,10,12,12,12,15,21,23,33

CALCULAR: PRIMER MTODO

n 1 10 1
Q1 X X X 3 10
4 2 4 2
2n 1 20 1
Q2 X X X 5.5 12MEDIANA
4 2 4 2
3n 1 30 1
Q3 X X X 8 21
4 2 4 2
DIAGRAMA DE CAJA
Una medida alternativa de dispersin que puede ser ms representativa
en el caso en que la distribucin es asimtrica o en presencia de datos
atpicos, es el rango intercuartlico.

El rango intercuartlico (RIC). Hemos definido la mediana


como el punto que separa el conjunto en dos partes de mismo tamao.
Definimos de la misma manera los cuartiles como los puntos que separan
el conjunto en cuatro partes de mismo tamao. El primer cuartil Q1 deja
el 25% de los datos ordenados a su izquierda, y el otro 75% a su derecha,
mientras que el tercer cuartil Q3 deja el 75% de los datos ordenados a su
izquierda, y el otro 25% a su derecha. Por lo tanto el par (Q1,Q3) nos
proporciona informacin sobre la dispersin presente en los datos: cuanto
ms alejados estn los cuartiles, ms dispersos estn los datos. Por ello,
calculamos el rango intercuartlico RIC como la diferencia entre Q3 y Q1.
El RIC tambin se utiliza para detectar datos atpicos:
Regla: Se consideran como atpicos los datos que son menores de Q1 1,5
RIC, o mayores de Q3 + 1,5 RIC.
El diagrama de caja-bigotes es un resumen grfico que permite visualizar,
para un conjunto de datos, la tendencia central, la dispersin y la
presencia posible de datos atpicos. Para realizarlo se necesita calcular la
mediana, el primer cuartil, y el tercer cuartil de los datos.
Los segmentos 1.5 RIC (llamados bigotes) se recortan hasta el dato del
conjunto inmediatamente superior a Q1 1,5 RIC para el bigote inferior,
y el dato inmediatamente inferior a Q3 + 1,5 RIC, para el bigote superior.
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o
ms conjuntos de datos.

Boxplot of VENTAS
35

30

25
VENTAS

20

15

10

You might also like