You are on page 1of 54

ESTADIGRAFOS DE

POSICION
Y DISPERSION

Los captulos anteriores estn referidos, con cierto detalle, a la clasificacin de


variables, recoleccin de datos, construccin de tablas de frecuencia y a la
representacin grfica, como fase preliminar en la descripcin y anlisis
estadstico. El objetivo principal de esta primera etapa, ha sido determinar la
naturaleza y formas de la distribucin de frecuencias, como base para la
reduccin de los datos a travs de ciertas caractersticas descriptivas y
medidas de resumen.
En el problema de comparar dos o ms distribuciones de frecuencias, puede
resultar fcil hacer una comparacin grfica de las frecuencias, sin embargo,
existen dificultades para hacer comparaciones cuantitativas. Estadsticamente
para facilitar este anlisis comparativo es necesario disponer de algunos
indicadores o medidas de resumen. An cuando la comparacin de los
histogramas (o grficos) puede proporcionar valiosa informacin general,
siempre es posible obtener informacin ms precisa y til, como la comparacin
directa de los datos tabulados (tablas de frecuencia) y mucho mejor si se dispone
de elementos o valores representativos (medidas de resumen) del conjunto de
observaciones.

Como respuesta, la Estadstica plantea reducir los datos y


sustituir toda la tabla de frecuencias por unos pocos
valores representativos del conjunto, es decir, reemplazar
la distribucin de frecuencias por unas pocas
caractersticas descriptivas de los aspectos fundamentales
de la distribucin considerada.
Estas caractersticas descriptivas (cantidad), constituyen
los llamados ESTADGRAFOS, que son indicadores o
medidas de resumen estadstico. Por tanto, en vez de
comparar totalmente dos distribuciones de frecuencia o
grficos, slo bastar comparar los estadgrafos de ambas
distribuciones.

Estadgrafo
Es la medida que en Estadstica se aplica sobre una
muestra. En general se utilizan dos tipos:
Estadgrafos de Posicin o de Tendencia Central y los
Estadgrafos de Dispersin.

Estadgrafos de Posicin o Medidas de Posicin


Tenemos:
a. Las medidas denominadas promedios, sea aquellas
que tratan de localizarse hacia el centro de la
serie; MODA, MEDIA Y MEDIANA.

b. Los cuartiles y deciles, o cuartas y dcimas partes


de las observaciones; esto slo se aplican en los
datos agrupados.

Estadgrafos de Dispersin
Tenemos:
a. El rango, la varianza, la desviacin estndar, el
coeficiente de variacin, las medidas de forma;
dentro de ellas estn el coeficiente de correlacin y
la regresin lineal.

ESTADIGRAFOS DE POSICION O MEDIDAS DE


TENDENCIA CENTRAL
Los Estadgrafos, son indicadores medidas de resumen
estadstico. Describen la posicin que ocupa una distribucin
de frecuencia alrededor de un valor de la variable. Los
estadgrafos no son valores determinantes, ni menos valores
exactos, pero si los mas representativos de una variable.
Las medidas de tendencia central mas utilizadas son 3:
MEDIANA
MEDIA ARITMETICA
MODA

MEDIANA
En el mbito de la estadstica, la mediana representa el valor de
la variable de posicin central en un conjunto de datos
ordenados. De acuerdo con esta definicin el conjunto de datos
menores o iguales que la mediana representarn el 50% de los
datos, y los que sean mayores que la mediana representarn el
otro 50% del total de datos de la muestra.
En otras palabras es un indicador, dicho valor de la serie de
datos se sita justamente en el centro de la muestra, luego de
ordenarlos (un 50% de valores son inferiores y otro 50% son
superiores).
Para calcular la mediana debemos tener en cuenta:

Calculo de la mediana para datos no agrupados:


Cuando el nmero de DATOS ES IMPAR:
Si tenemos un nmero de datos impar, primero se debe
ordenar los datos, luego ubicar la posicin central de los
datos, este valor en la posicin central ser la mediana del
conjunto de datos.
Si N es impar, hay un termino central, el termino que ser el
valor de la mediana.
Me = (N + 1) /2
Cuando el nmero de DATOS ES PAR:
Si tenemos un nmero de datos Par, primero se debe ordenar
los datos, luego ubicar los dos nmeros en la posicin central
de los datos, y enseguida realizar el promedio de ellos, el
resultado ser la mediana del conjunto de datos.
y

Ejemplos:
1. Sean los datos: 6, 4, 5, 6, 3, 6, 4, 7, 6.
Paso 1: Primero ordenamos los datos: 3, 4, 4, 5, 6, 6, 6, 6, 7.
Paso 2: Tenemos 9 datos, entonces N = 9.
Aplicamos la formula:
Me = (N + 1) / 2
Me = (9 + 1) / 2
Me = 5
El valor 5 indica la posicin que ocupa la mediana en los
datos. Entonces la mediana correspondiente a estos datos
ser igual a 6.

2. Sean los datos: 14, 47, 36, 19, 70, 32, 59.
Paso 1: Primero ordenamos los datos: 14, 19, 32, 36, 47, 59, 70.
Paso 2: Tenemos 7 datos, entonces N = 7.
Aplicamos la formula:
Me = (N + 1) / 2
Me = (7 + 1) / 2
Me = 4
El valor 4 indica la posicin que ocupa la mediana en los
datos. Entonces la mediana correspondiente a estos datos ser
igual a 36.

3. Sean los datos: 6, 1, 4, 3, 9, 1, 2, 7, 3, 5.


Paso 1: Primero ordenamos los datos: 1, 1, 2, 3, 3, 4, 5, 6, 7, 9.

Paso 2: Tenemos 10 datos, entonces N = 10.


Por tener 10 datos la mediana ser calculada como
una media aritmtica de los dos datos centrales,en
este caso se asume los valores 3 y 4.

Aplicamos la formula:
Me = (N + 1) / 2

Me = X

Me = (10 + 1) / 2

Me = (3 + 4) / 2

Me = 5.5

Me = 3.5

El valor 5.5 indica la posicin que ocupa la mediana en los


datos. Entonces la mediana correspondiente a estos datos ser
igual a 3.5.

4. Sean los datos: 60, 15, 48, 36, 90, 17, 24, 72, 38, 50, 23, 72.
Paso 1: Primero ordenamos los datos: 15, 17, 22, 24, 36, 38, 48, 50, 60,
72, 72, 90.
Paso 2: Tenemos 12 datos, entonces N = 12.
Por tener 12 datos la mediana ser calculada como una
media aritmtica de los dos nmeros centrales, en este
caso se asume los valores 38 y 48.

Aplicamos la formula:
Me = (N + 1) / 2

Me = X

Me = (12 + 1) / 2

Me = (38 + 48) / 2

Me = 6.5

Me = 43

El valor 6.5 indica la posicin que ocupa la mediana en los datos.


Entonces la mediana correspondiente a estos datos ser igual a 43.

Calculo de la mediana en distribuciones agrupadas:


Si los datos son presentados en tablas de frecuencia, se pueden dar dos
casos: calculo de la mediana para variables cuantitativas discretas y
variables cuantitativas continuas. Veamos:
PARA VARIABLES CUANTITATIVAS DISCRETAS:

Caso1. Si la mitad de los datos (N/2), se encuentra entre dos frecuencias


acumuladas, as: [ Li-1,Li ); hay que determinar el intervalo mediano, la
forma de hacerlo ser, calculando el valor de la mitad de n y observar que
intervalo tiene una frecuencia absoluta acumulada que cumpla N i-1 < N/2 <
Ni.
Despus de saberlo haremos el siguiente clculo:
Me = Li-1 +

N/2 Ni 1

ni

ai

Siendo:
[ Li-1,Li )

intervalo que contiene a la frecuencia acumulada N/2

ai

amplitud de dicho intervalo

Ejemplos:
Dados los siguientes datos, calcular el intervalo mediano (mediana):
[ Li-1, Li )
[20 , 30)
[40 , 50)
[60 , 70)
[80 , 90)
[100 , 110)

ni
150
200
250
230
91
N = 921

Ni
150
350
600
830
921

Paso 1: Calculamos N/2 = 921/2 = 460.5. Este valor nos indica que la
mediana (Me) estar en el intervalo [ 60 , 70 ).
Paso 2: Calculamos la mediana aplicando la formula:
Me = Li-1 +

N/2 Ni 1

ni

ai = 60 +

460.5 350
250

x 10 = 64.42

MEDIA ARITMETICA
Es un indicador, que representa al conjunto de datos. Es el valor medio
ponderado de la serie de datos. Se pueden calcular diversos tipos de
media, siendo las ms utilizadas:
MEDIA
PARA
DATOS
ORIGINALES
O
NO
AGRUPADOS:
a) Media aritmtica: es la ms utilizada, es la suma de los valores entre

el nmero total de datos. La media aritmtica o simplemente media es el


promedio aritmtico de las observaciones, es decir, el cociente entre la
suma de todos los datos y el numero de ellos. Dados los n nmeros X1,
X2, ..., Xn, la media aritmetica se define simplemente como:
n

X=

X1 + X2 + X3 + .....+ Xn-1 + Xn
n

i =1

El smbolo (mu) es usado para la media aritmtica de una


poblacin. Usamos X, con una barra horizontal sobre el smbolo
para medias de una muestra. X

Ejemplos:
1. Se tiene las calificaciones finales de 20 estudiantes de la
asignatura de Psicologa de la personalidad, hallar la Media
Aritmtica.
12, 18, 14, 15, 20, 11, 10, 08, 15, 17, 05, 20, 19, 14, 10, 17,
16, 17, 05, 00

X=
X=

12+18+14+15+20+11+10+08+15+17+05+20+19+14+10+17+16+17+05+00
20
263
20

= 13.15

2. Se tiene las edades de 50 estudiantes del tercer semestre de la Facultad de


Psicologa de la Universidad Peruana los Andes. Calcular la media aritmtica.
18, 18, 17, 17, 17, 20, 21, 17, 19, 23, 23, 35, 22, 21, 17, 16, 17, 20, 23, 26,
17, 18, 25, 26, 19, 17, 18, 21, 21, 20, 26, 17, 18, 19, 23, 22, 19, 21, 18, 18,
19, 21, 33, 29, 20, 19, 17, 28, 39, 41

X = 1076/50 = 21.52
La media aritmtica en general no divide a la distribucin en dos partes iguales.
MEDIA PARA DATOS EN TABLAS O AGRUPADOS

a) Media aritmtica: se calcula multiplicando cada valor por el nmero de


veces que se repite. La suma de todos estos productos se divide por el total
de datos de la muestra. La media aritmtica de una variable se define como la
suma ponderada de los valores de la variable por sus frecuencias relativas y
lo denotaremos por X y se calcula mediante la expresin:

i =1

X.f i

i =1

X i.ni

Xi

representa el valor de la variable o en su caso la marca de

clase.
Propiedades:
Si multriplicamos o dividimos todas las observaciones por un
mismo numero, la media queda multiplicada o dividida por dicho
numero.
Si le sumamos a todas las observaciones un mismo numero, la
media aumentara en dicha cantidad.

Ademas de la media aritmetica existen otros conceptos de media


como son: la media geometrica y la media armonica.

Ejemplo :
De la siguiente tabla de distribucin de frecuencias calcular la
media.

IC
17 - 21
22 - 26
27 - 31
32 - 36
37 - 41
TOTAL
X=

MC
19
24
29
34
39

f
37
8
2
2
1
50

fr
0.740
0.160
0.040
0.040
0.020
1.000

frA
0.740
0.900
0.940
0.980
1.000

(19x37) + (24x8) + (29x2) + (34x2) + (39x1)


50

F%
74
16
4
4
2
100%
1060

50

FA%
74
90
94
98
100

= 21.2

CALCULO DE LA MEDIA ARITMETICA PONDERADA


Se denomina media (aritmtica) ponderada de un conjunto de nmeros al resultado
de multiplicar cada uno de los nmeros por un valor particular para cada uno de
ellos, llamado su peso, obteniendo a continuacin la suma de estos productos, y
dividiendo el resultado de esta suma de productos entre la suma de los pesos mas la
masa segn la caracterstica de cada numero inicial. Este peso depende de la
importancia o significancia de cada uno de los valores. O dicho de otro modo es un
promedio en el que cada valor de observacin se pondera con algn ndice de su
importancia. Crdova (2003).

Para una serie de datos X = {x1,

x2, , xn}, a la que corresponde los pesos W =

{w1, w2, , wn}, la media ponderada se calcula como:

x=

in= 1

Xi . wi

in= 1 wi

x=

X1 . W1 + X2 . W2

+ X13. W3 + ... + Xn. Wn

W1 + W2 + W3 + ... + Wn

Un ejemplo es la obtencin de la media ponderada de las notas de una


oposicion en la que se asigna distinta importancia (peso) a cada una de las
pruebas de que consta el examen)
Ejemplo:
Se tiene las notas obtenidas en las diferentes asignaturas que llevo un
estudiante durante el semestre 2007 II con sus respectivos creditos, obtener
la media ponderada correspondiente.
N

1
2
3
4
5
6
7

Asignatura

Elocucin y redaccin
Administracin II
Metodologa Cientfica
Realidad Peruana
Matemtica bsica
Anlisis matemtico
Contabilidad bsica

N de crditos

Promedio final

3
3
3
3
4
5
3

15
13
16
18
11
10
15

x=
x=

(15x3) + (13x3) + (16x3) + (18x3) + (11x4) + (10x5) + (15x3)


(3+3+3+3+4+5+3)
(325)
(24)

= 13.54

MODA (M0)
Es el valor de la variable que mas veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica. Y si no hay ningn valor que se repite se dice
que es amodal.

La moda es el valor que se presenta con mayor frecuencia en una distribucin. Se


representa Mo. Es importante observar si la representacin grfica de los datos presenta un
solo modo (unimodal), dos modos (bimodal) o ms de dos (multimodal).
Por ejemplo, en el caso en que se analiza el desarrollo de una epidemia segn la fecha de
aparicin de los primeros sntomas de los afectados y, en la representacin grfica se
observa un solo modo, significa que todos los casos estuvieron expuestos a una fuente
nica de infeccin. Si los modos fueran dos, las fuentes de infeccin tambin seran dos y
en el caso de un grfico multimodal, la exposicin a la infeccin sera mltiple.

Ejemplo:
1. Determine la moda de los datos que se muestran a continuacin, se refieren a la

estatura de un grupo de jvenes: 1.60, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70,
1.93, 1.87, 1.85 m.
Solucin:

Estatura
1.60
1.65
1.70
1.71
1.85
1.87
1.93

Frecuencia
1
1
5*
2
1
1
1

La tabla muestra la distribucin de frecuencias de los datos o el numero de veces


que estos se repiten, la mayor frecuencia que es 5 corresponde a una estatura de
1.70 m, por lo que esta seria la MODA. Xmod = 1.70 m.

2.

Determine la moda de los siguientes datos que se refieren a la edad de alumnos


de primer semestre de la carrera profesional de Psicologa: 18, 17, 19, 21, 19, 18,
22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18, 19, 22, 35.
Solucion:
Edad de alumnos
17
18
19
20
21
22
35

Frecuencia
2
8*
8*
2
2
3
1

En este caso se observa que las edades que mas frecuencia tienen son las de 18
y 19 aos, por lo que concluimos que existen dos modas por lo tanto es
BIMODAL. Xmod1 = 18 aos, Xmod2 = 19 aos.

CUANTILES
Este termino es usado en la Estadstica Descriptiva y se refiere a las medidas de
posicin no central que nos permiten reconocer otros puntos caractersticos de la
distribucin que no son centrales. Son medidas de localizacin similares a las
anteriores. Se las denomina cuantiles (Q). Su funcin es informar del valor de la
variable que ocupara la posicin (en tanto por cien) que nos interese respecto de
todo el conjunto de variables.
Podemos decir que los cuantiles son unas medidas de posicin que dividen a la
distribucin en un cierto numero de partes de manera que en cada una de ellas hay
el mismo numero de valores de la variable.
Las ms importantes son:
a. Cuartiles: Dividen a la distribucin en cuatro partes iguales (tres divisiones).
C1, C2, C3, correspondientes a 25%, 50%, 75%.
b. Deciles: Dividen a la distribucion en 10 partes iguales (nueve divisiones).
D1, D2, D3, D4, , D10, correspondiente a 10%, 20%, 30%, 40%, , 90%.

c. Percentiles: Dividen a la distribucin en 100 partes iguales (99 divisiones).


P1, P2, P3, P4, , P100, correspondientes a 1%, 2%, 3%, 4%, , 99%.
Existe un valor en el cual coinciden los cuartiles, los deciles y percentiles, esto
sucede cuando son iguales a la Mediana y as veremos:
2
4

5
10

50
100

Distinguiremos a los cuantiles entre distribuciones agrupadas y las que no lo estn:

CUANTILES EN LAS DISTRIBUCIONES SIN AGRUPAR:


Primero hallaremos el lugar que ocupa. Entonces tendremos que:
Ni=1 < (%) . n < Ni Q = Xi

En el supuesto que (%) . n = Ni Q =

Xi + xi+1
2

Primero encontraremos el intervalo donde estar el cuartil:

Lugar:

Ni=1 < (%) . n < Ni Intervalo [Li-1, Li), en este caso:


Q = Li-1 + (%) N Ni-1 ai
ni

Ejemplo de Distribuciones NO AGRUPADAS:


xi
ni
Ni
5
10
15
20
25

3
7
5
3
2
n = 20

3
10
15
18
20

Calcular la mediana (Me); el primer y tercer cuartil (C1, C3); el 4 decil (D4) y el 90
percentil (P90).

Solucin:
Calculando la Mediana (Me):
Aplicamos la formula Me = N / 2 = (20 ) / 2 = 10, esto significa que la mediana se
ubica en la posicin 10, como es un valor de la frecuencia absoluta acumulada,
realizaremos el calculo y este valor corresponde a,
Me = (Xi + Xi+1) / 2 = (10+15)/ 2 = 12.5
Calculando el Primer cuartil (C1):
Lugar que ocupa en la distribucin (1/4) . 20 = 20/4 = 5, como Ni-1< (25%).n< Ni, es
decir 3 < 5 < 10, esto implica que C1 = xi = 10
Calculando el Tercer cuartil (C3):
Lugar que ocupa en la distribucin (3/4) . 20 = 60/4 = 15, que coincide con un valor
de la frecuencia absoluta acumulada, por tanto realizamos el calculo:
C3 = (Xi + Xi-1) / 2 = (15 + 20) / 2 = 17.5
Calculando el cuarto decil (C4):
Lugar que ocupa en la distribucin (4/10) . 20 = 80/10 = 8, como Ni-1< (%).n< Ni, es decir 3
< 8 < 10, esto implica que D4 = xi = 10

Nonagsimo percentil (P90):


Lugar que ocupa en la distribucin (90/100) . 20 = 1800/100 = 18, que coincide con un
valor de la frecuencia absoluta acumulada, por tanto realizamos el calculo:
P90 = Xi + xi-1 =
2

20 + 25
25

22,5

CUANTILES EN LAS DISTRIBUCIONES AGRUPADAS:


Ejemplo de Distribuciones AGRUPADAS:
Hallar el primer cuartil, el cuartodecil y el 90 percentil de la siguiente distribucin:
[Li-1, Li)
[ 0 , 100 )
[ 100 , 200 )
[ 200 , 300 )
[ 300 , 800 )

ni
90
140
150
120
n = 20

Ni
90
230
380
500

Solucin:
Calculando el Primer cuartil (C4):
Lugar que ocupa el intervalo del primer cuartil: (1/4) . 500 = 500/4 = 125, por lo tanto
C4 estar situado en el intervalo [ 100 , 200 ), aplicando la expresin directamente
tendremos:
C4 = 100 +

125 - 90
140

100 = 125

Calculando el cuarto decil (D4):


Lugar que ocupa en la distribucin (4/10) . 500 = 2000/10 = 200, por tanto D4 estar
situado en el intervalo [100 200). Aplicando la expresin tendremos:
D4 = 100 +

200 - 90
140

100 = 178, 57

Calculando el Nonagsimo Percentil (P90):


Lugar que ocupa el intervalo: (90/100) . 500 = 45000/100 = 450, por lo tanto P90
estar situado en el intervalo [ 300 , 800 ), aplicando la expresin directamente
tendremos:
C4 = 300 +

450 - 380
120

100 = 358.33

Estadgrafos de Dispersin o Medidas de Dispersin


Las medidas de tendencia central nos proporcionan informacin sobre el
comportamiento de un conjunto de observaciones a travs de un dato que tiende
a ubicarse en un punto central, pero no nos proporciona informacin sobre las
variaciones o dispersiones que pueden tener los datos en su conjunto, es decir
sobre la homogeneidad o heterogeneidad de los datos.
Para poder determinar esta variacin en un grupo de datos respecto a una
variable determinada. Se recurre a medidas de desviacin o variacin cuyo
objetivo principal es Medir el grado de dispersin o concentracin de los valores
o datos, alrededor de las medidas de tendencia central.
AMPLITUD O RANGO PARA DATOS NO AGRUPADOS Y DATOS
AGRUPADOS
Rango viene a ser la diferencia entre el dato mayor y el dato menor :
R = Xmx Xmin
Donde :
Xmx = dato mximo ; Xmin = dato mnimo

RANGO INTERCUARTILICO
En estadstica descriptiva, se le llama rango intercuartlico o rango
intercuartil, a la diferencia entre el tercer y el primer cuartil de una
distribucin. Es una medida de dispersin estadstica.
A diferencia del rango, se trata de un estadstico robusto.
El rango intercuartlico es una medida de variabilidad adecuada
cuando la medida de posicin central empleada ha sido la mediana.
Se define como la diferencia entre el tercer cuartil (Q3) y el primer
cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se
le conoce como desviacin cuartil (DQ): DQ = RQ/2= (Q3 - Q1)/2.
Se usa para construir los diagramas de caja y bigote (box plots) que
sirven para visualizar la variabilidad de una variable y
comparar distribuciones de la misma variable; adems de ubicar
valores extremos.

PARA DATOS NO AGRUPADOS

Ejemplo:
1. Tenemos los siguientes datos originales, las edades de los
alumnos del 4 semestre del curso de Psicologa a distancia
: 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Calculamos el primer cuartil (Q1):
Q1 = (1/4).n = 1/4.12= 3

Calculamos el tercer cuartil (Q3):


Q3 = (3/4).n = 3/4.12= 9

Ordenamos los datos:


18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63

Q1 = 20+24/2
Q1 = 22

Q3 = 49+53/2
Q3 = 51

Interpretacin:
A partir de los 22 aos hasta los 51 se ubica el 50 % de la distribucin.
Calculamos el rango intercuartilico:

RQ = Q3 - Q 1 = 51 22 = 29
29 aos es la distancia existente en el 50% central de la distribucin.

PARA DATOS AGRUPADOS

Ejemplo:
1.

Tenemos los datos de distribucin de pases segn porcentaje de la poblacin de


15 y ms aos de edad analfabtica.
[Li-1, Li)
MC
fi
fr
fA
F%
ai
0-5
5 - 10
10 20
20 - 42
n = total

2,5
7,5
15
31

14
8
3
3
28

50
28
11
11

Calculamos el primer cuartil (Q1):


Q1 = Li-1 + ().N Fi-1
fi

. ai

14
22
25
28

50
78
89
100

5
5
10
22

Q1 = 0 +

Q3 = 5 +

(1/4.28) 0
14

(3/4.28) 14
8

RQ = 9,42,5 = 6,9

. 5 = 2.5

. 5 = 9.4

VARIANZA PARA DATOS NO AGRUPADOS


La varianza representa la media aritmtica de las desviaciones de la media
elevadas al cuadrado. Si atendemos a la coleccin completa de datos (la
poblacin en su totalidad) obtenemos la varianza poblacional; y si por el
contrario prestamos atencin solo a una muestra de la poblacin, obtenemos
en su lugar la varianza muestral. Las expresiones de estas medidas son las
que aparecen a continuacin.
Expresin de la varianza muestral:
2
Sx

i n= 1

Xi 2

( Xi X )
n-1

N
i = 1 ( Xi )

- X

n-1

Expresin de la varianza poblacional :

Xi

Ejemplo:
La siguiente muestra representa las edades de 25 personas sometidas a un anlisis de
preferencias para un estudio de mercado.
25

19

21

35

44

20

27

32

38

33

18

30

19

29

33

26

24

28

39

31

31

18

17

30

27

Determinar la Varianza.
Solucin:

Paso 1: Calculamos la media aritmtica


X = 25+19+21+35+44+20+27+ + 27/ 25 = 694/25 = 27.76

Paso 2: Calculamos la varianza.


Edades

Xi - X

(Xi - X)2

17
18
18
19
19
20
21
24
25
26
27
27
28
29
30
30
31
31
32
33
33
35
38
39
44
xi = 694
X = 694/25 = 27.76

17- 27.76 = 10.76


18- 27.76 = 9.76
18- 27.76 = 9.76
19- 27.76 = 8.76
19- 27.76 = 8.76
20- 27.76 =7.76
21- 27.76 = 6.76
24- 27.76 = 3.76
25- 27.76 = 2.76
26- 27.76 = 1.76
27- 27.76 = 0.76
27- 27.76 = 0.76
28- 27.76 = 0.24
29- 27.76 = 1.24
30- 27.76 = 2.24
30- 27.76 = 2.24
31- 27.76 = 3.24
31- 27.76 = 3.24
32- 27.76 = 4.24
33- 27.76 = 5.24
33- 27.76 = 5.24
35- 27.76 = 7.24
38- 27.76 = 10.24
39- 27.76 = 11.24
44- 27.76 = 16.24

115.778
95.258
95.258
76.738
76.738
60.218
45.698
14.138
7.618
3.098
0.578
0.578
0.058
1.538
5.018
5.018
10.498
10.498
17.978
27.458
27.458
52.418
104.858
126.338
236.738
(xi x)2 = 1217.57

Aplicando la formula: S2 = 1217.57/25-1 = 50.73

VARIANZA PARA DATOS AGRUPADOS

Para calcular la varianza de una tabla de frecuencias, es necesario utilizar la


siguiente frmula:

Donde:

Ejemplo:
Calcular la varianza de la distribucin de la tabla:

DESVIACION ESTANDAR O DESVIACION TIPICA DE DATOS NO


AGRUPADOS
La desviacin estndar es una medida del grado de dispersin de los datos del
valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el
promedio o variacin esperada con respecto de la media aritmtica.
Una desviacin estndar grande indica que los puntos estn lejos de la media y
una desviacin pequea indica que los datos estn agrupados cerca de la
media.
Expresin de la Desviacin Estndar muestral:

ni = 1 (xi x)2

n-1

Expresin de la Desviacin Estndar poblacional:

in= 1 (xi ) 2

Ejemplo:
1. Calcular la desviacin estndar de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18
Paso1: Calculamos la media aritmtica.

Paso2: Calculamos la desviacin estndar.

DESVIACION ESTANDAR O DESVIACION TIPICA DE DATOS


AGRUPADOS
Expresin de la Desviacin Estndar:

Ejemplo:
1. Calcular la desviacin tpica de la distribucin de la tabla:

xi

fi

xi fi

x i2 f i

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

COEFICIENTE DE VARIACION PARA DATOS NO AGRUPADOS


El coeficiente de variacin o dispersin es til para comparar dispersiones
a escalas distintas pues es una medida invariante ante cambios de escala
. Por otro lado presenta problemas ya que a diferencia de la desviacin
tpica este coeficiente es variable ante cambios de origen . Por ellos es
importante que todos los valores sean positivos y su media es por tanto
un valor positivo

Exigimos que: X > 0


Se calcula: CV =

S
X

Donde S es la desviacin tpica. Se puede dar en tanto por ciento.

Calculando:
CV =

S
X

. 100

COEFICIENTE DE VARIACION PARA DATOS AGRUPADOS

Se calcula:

Ejemplo:
1. Matas, un estudiante universitario, tiene las siguientes calificaciones en

las 10 asignaturas que recibe en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10.


Josu, un compaero de Matas, tiene las siguientes calificaciones: 8, 9, 8,
7, 8, 9, 10, 7, 8 y 10. Cul estudiante tiene menor variabilidad en sus
calificaciones?

a) Se agrupa las calificaciones y se realiza el clculo de la media


aritmtica.

b) Se calcula la desviacin estndar.

c) Se calcula el coeficiente de variacin.


Para Matas se obtiene:

Para Josu se obtiene:

You might also like