Professional Documents
Culture Documents
= x1 x 2 .....x N
x
i 1
8 16 4 12 10 50
10
5
5
8, 16, 4, 12 y 5
8 16 4 12 5 45
9
5
5
f x f x ........f N x N
x 1 1 2 2
f1 f 2 ..........f N
fi x i
i 1
N
f
i 1
f x
i 1
5.7
3 2 4 1
10
10
2
A veces asociamos con los nmeros x1 , x 2 ,....,.x N , unas ponderaciones (o
pesos) w1 , w2 ,....., w N , dependiente de la relevancia asignada a cada nmero
(no a su frecuencia). En este caso:
N
w x w2 x 2 .....wN x N
x 1 1
w1 w2 .....wN
w x
i 1
N
w
i 1
VERIFICANDO SU COMPRENSIN
1. Calcule la media aritmtica para el conjunto de datos.
a) 6,8,3,9 y 5
b) 6,6,8,8,3,9,9,9,5 y 5
2. Calcule la media aritmtica ponderada para el conjunto de datos 3.0, 2.0,
6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30% respectivamente.
1.5.2 LA MODA
3
1.5.3 LA MEDIANA
DEFINICION: La mediana (med) de un conjunto de nmeros ordenados en
sentido creciente (decreciente) es: el valor central, si el nmero de datos es
impar; o la media de los valores centrales, si el nmero de datos es par.
EJEMPLO 8. El conjunto de nmeros 3,4,4,5,6,8,8,8 y 10 tiene mediana 6
EJEMPLO 9. El conjunto de nmeros 5,5,6,8,9 y 10 tiene mediana x
68
7
2
45
4.5 (la mediana
2
3.
4.
5.
4
e) Comparar los resultados a), b), c) y diga Cul de las medidas de
tendencia central, la media o la mediana, es mejor para evitar la
distorsin
producida por un valor extremo?.
6. Se pidi a 30 reclutas de la Academia de Polica se sometieran a una
prueba que mide la capacidad para el ejercicio. Se midi esta capacidad
de cada recluta (en minutos)
25
27
30
33
30
32
30
34
30
27
26
25
29
31
31
32
34
32
33
30
27
30
31
36
28
30
31
26
29
32
Calcular la moda, media y mediana.
MEDIDAS DE DISPERSION
La localizacin o tendencia central no necesariamente proporciona
informacin para describir datos de manera adecuada. Para el caso,
consideramos los siguientes ejemplos.
EJEMPLO 1.
Suponga que en un hospital, el nivel de azcar en la sangre de cada
paciente se mide tres veces por semana. En cierta semana los registros de
dos pacientes indican:
Paciente A: 90, 100 y 110 miligramos por decilitro
Paciente B:
40, 100 y 160 miligramos por decilitro
El promedio de ambos pacientes es 100.
En efecto:
100
3
3
40 100 160 300
100
Paciente B:
3
3
Paciente A:
5
Se va a seleccionar a un atleta para que represente a la Universidad en los
juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos
candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que
se tardan en recorrer los 100 metros en cinco ocasiones. A continuacin de
detallan:
Atleta A:
Atleta B:
3,4,5,6,11,16,17,18 y 19
3,8,9,10,11,12,13,14 y 19.
6
media
Conjunto B:
3
9 10 11 12
13
14
19
(x
i 1
x) 2
N
Si
ocurren con frecuencias
desviacin tpica puede expresarse como
f 1 , f 2 ,..... f N respectivamente, la
x1 , x 2 ,.....,.x N
f (x
i 1
x) 2
se
donde N =
f
i 1
(x
i 1
x) 2
N 1
N
f (x
i 1
x) 2
N 1
se denota
7
NOTA: Muestra es el conjunto de datos que se pueden utilizar, en forma
razonable, para hacer generalizaciones acerca de la poblacin de la cual
provienen.
ADVIERTA: Las frmulas para S
denominador de las formulas para
se obtienen escribiendo
N-1
en el
Paso 1.
3 4 5 6 11 16 17 18 19 99
11
9
9
9
Paso 2.
El clculo de
S ( xi x) 2
i 1
sigue:
Variable x
Desviacin
3
4
5
6
11
16
17
18
19
-8
-7
-6
-5
0
5
6
7
8
( xi x )
Cuadrado
de
desviacin ( xi x) 2
64
49
36
25
0
25
36
49
64
la
S ( xi x) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348
i 1
(x
i 1
x) 2
N 1
348
=
9 1
348
= 6.6
9 1
Para la muestra B
Paso 1.
3 8 9 10 11 12 13 14 19 99
11
9
9
9
Paso 2. Calculamos
(x
i 1
x) 2
8
Variable x
3
8
9
10
11
12
13
14
19
-8
-3
-2
-1
0
1
2
3
8
(x
i 1
Cuadrado de la desviacin
( xi x) 2
64
9
4
1
0
1
4
9
64
x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156
9
( xi x )
Desviacin
(x
i 1
x) 2
N 1
3156
=
9 1
3156
= 4.4
9 1
Puesto que la desviacin tpica del conjunta A es mayor que la del conjunto
B, concluimos que la muestra A es la ms dispersa.
DEFINICION: La varianza de un conjunto de datos se define como el
cuadrado de la desviacin tpica, de modo que 2 y S 2 representan la
varianza de la poblacin y la varianza de la muestra, respectivamente.
VERIFICANDO SU COMPRENSION
1. Determine cul de las siguientes muestras es la ms dispersa.
a) 6,3,12,5,8 y 9
b) 3,5,6,7,4,10 y 8
2. Determine cul de las siguientes muestras es la menos dispersa
a) 7,9,3,6,5,4 y 2
b) 8,7,4,11,2 y 5
3. Hallar, en cada caso, la desviacin tpica y la varianza
a) 3,6,2,1,7 y 5
b) 3,2,4,6,5 y 8
CASO 2: Desviacin tpica para datos agrupados
EJEMPLO 2. Supngase que en 9 grado hay 40 alumnos, cuyas edades se
resumen en la siguiente tabla de frecuencias
Edades x
14
15
16
9
17
Hallar el valor de S.
SOLUCION
Para facilitar los clculos usamos la siguiente tabla
14
15
16
17
TOTAL
6
15
16
3
40
i 1
f i xi
f (x )
84
225
256
51
616
( xi x ) 2
f ( xi x) 2
-1.4
-0.4
0.6
1.6
1.96
0.16
0.36
2.56
N
616
15.4
40
f ( xi x) 2
f ( x x)
i 1
N 1
11.76
2.40
5.76
7.68
27.60
2
27.6
0.84
39
VERIFICANDO SU COMPRENSION
1. Hallar en cada caso, la desviacin tpica y la varianza.
a) 3,2,4,6,2,8,5,2,4 y 4
b) 0,0,0,0,0,1,1 y 1
2. Hallar el valor de S para los datos agrupados en las siguientes tablas de
frecuencia
a)
x
2
3
4
5
f
4
3
5
2
EJERCICIOS
Seleccione la respuesta correcta
1. El recorrido de un conjunto de datos:
a) Se obtiene con las desviaciones promedio de los datos y la media
b) Es la diferencia entre el dato mayor y el dato menor
c) Es una medida de tendencia central
d) Es el promedio de la moda y la mediana
2. La desviacin estndar de un conjunto de datos:
a) Est cerca de cero si los datos estn dispersos.
b) Promedia las desviaciones entre cada dato y la media
10
c) No toma en consideracin todos los datos
d) Promedia las desviaciones entre cada dato y la mediana
3. Explicar que es una medida de dispersin
4. Comparar la desviacin estndar y el recorrido
5. Explicar que representa la desviacin estndar de un conjunto de datos
6. Si la desviacin estndar fuese cero qu podras decir acerca del conjunto
de datos?
En los ejercicios 7 - 10. Encontrar el recorrido, la varianza y la desviacin
estndar del conjunto de datos
7.
1,2,3,4 y 5
9.
3,5,8,13 y 21
8.
21,22,23,24 y 25
10.
79,90,95,95 y 96
11. Realizar las operaciones indicadas con los siguientes datos
3,8,5,3,10,13
a)
b)
c)
d)
Encontrar el recorrido.
Hallar la media.
Determinar la desviacin estndar poblacional.
Determinar la desviacin estndar muestral.
MEDIDAS DE POSICIN
CUANTILES
Para muchos propsitos, es importante obtener valores que dividen un
conjunto de datos ordenados, en fracciones especificas. LA mediana es un
ejemplo de ste tipo de medida; ella divide al conjunto en dos partes iguales:
La mitad de los valores son inferiores a la mediana y la otra mitad superiores.
En forma similar se pueden calcular:
- Los cuartiles, que son valores de la variable que dividen a conjunto en
cuartas partes.
As, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos
son menores que l y tres cuartas partes son mayores. Q2, es igual a la
mediana y Q3, supera a los tres cuartos de los datos y solo es superado por
un cuarto de ellos.
Adems de la mediana y los cuartiles pueden calcularse tambin lo deciles:
D1, D2, ......D9, los cuales dividen al conjunto en dcimas. Los percentiles:
P1, P2,....P99, que lo dividen en centsimos. Todos estos valores reciben el
nombre de cuantiles y pueden resultar muy apropiados para apreciar la
posicin de los datos de un conjunto y su posicin.
11
Tanto la mediana como los cuartiles y los deciles constituyen casos
particulares de los percentiles y pueden expresarse como percentiles.
Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc.
Resulta entonces que tenindose una frmula para el clculo de la posicin
de los percentiles, puede obtenerse con ella, la posicin de cualquier cuantil.
Para el clculo de la posicin de los percentiles se debe, en primer lugar,
ordenar los datos.
Una vez hecho esto, puede aplicarse la frmula siguiente:
La posicin de k-simo percentil se encuentra calculando (
n
)k, donde n
100
42
43
43
44
45
45
46
46
47
47
48
49
49
50
51
51
52
53
53
54
55
56
57
59
60
60
62
66
67
68
70
74
12
La posicin de Q2 es igual a la posicin de P 50, la cual se obtiene as:
=
Q2 =
X 20 X 21 50 53
2
2
40
x 50
100
51.5
f
8
12
18
10
6
2
Calcule:
a) El valor del cuartil uno.
b) El valor del cuartil dos.
c) El valor del cuartil tres.
d) El valor del decil cinco.
e) El valor del decil cinco.
f) El valor del percentil ochenta.
g) El valor del percentil cincuenta.
h) El salario que limita el 20% superior de la distribucin.
i) El salario que se deja sobre s, el 70% de los casos.
j) Entre qu salarios est el 60% central de la distribucin.
3. Determine la escala percentilar de la siguiente serie de puntajes de un
examen.
____Xi
f____
30
1
25
5
38
10
40
4
45
2
13
4. Calcule el percentil del punto medio de la clase 700-799 de la distribucin
del ejercicio 2. Luego comprubelo.