You are on page 1of 10

EJERCICIO DE BONDAD DE AJUSTE

24 de enero de 2014
Segundo Semestre de 2013
Probabilidad y Estadstica

BONDAD DE AJUSTE
La prueba de bondad de ajuste se aplica en diseos de investigacin en los que se estudia un nico
grupo para determinar si esta poblacin sigue determinada distribucin de probabilidad, donde se
desea saber las diferencias entre lo observado y lo esperado, que sern las discrepancias entre la
teora y la realidad.
Si no hay diferencias, la realidad coincidir perfectamente con la teora y por el contrario, si las
diferencias son grandes indica que la realidad y la teora no se parecen.
Sea, X: Variable aleatoria poblacional; f
0
(x): la distribucin (o densidad) de probabilidad
especificada o supuesta para X.
Se desea probar la hiptesis propuesta:
H
o
: f(x) = f
0
(x)
En contraste con la hiptesis alterna:
H
a
: f(x) no= f
0
(x) (negacin de H
o
)
El procedimiento para esta prueba incluye el clculo de la medida de resumen llamada chi
cuadrada (X
2
). En el cual se tienen las frecuencias observadas (o
1
, o
2
,, o
k
) que se esperan que
ocurran con frecuencia e
1
, e
2
,, e
k
, llamadas frecuencias tericas o esperadas. La frmula es,

=

=
k
i i
e
i
e
i
o
X
1
2
) (
2

Si X
2
= 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que si X
2
>0,
no coinciden exactamente. A valores mayores de X
2
, mayores son las discrepancias entre las
frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora para valores
superiores.
Y el nmero de grados de libertad (v) est dado por:
m k v = 1
En donde:
- K: Nmero de clasificaciones en el problema.
- m: Nmero de parmetros estimados a partir de los datos mustrales para obtener los
valores esperados.


EJERCICIO

1. Si los autos llegan a un supermercado siguiendo un proceso de Poisson, el tiempo entre
llegadas sucesivas es una variable aleatoria con distribucin exponencial. Se registraron las
horas de llegada para todos los automviles durante 2 horas y los tiempos entre llegadas (en
segundos y minutos). Pruebe si el tiempo entre llegadas tiene distribucin exponencial:
Observaciones Tiempo (seg) Tiempo (minutos)
1 100 1.667
2 84 1.400
3 23 0.383
4 58 0.967
5 76 1.267
6 95 1.583
7 40 0.667
8 22 0.367
9 167 2.783
10 120 2.000
11 28 0.467
12 193 3.217
13 143 2.383
14 39 0.650
15 200 3.333
16 56 0.933
17 60 1.000
18 150 2.500
19 49 0.817
20 155 2.583
21 177 2.950
22 51 0.850
23 43 0.717
24 99 1.650
25 59 0.983
26 94 1.567
27 80 1.333
28 42 0.700
29 200 3.333
30 110 1.833
1. Tabla de observaciones (Tiempo en minutos)
Resumiendo los datos en frecuencias observadas (o
i
) y en minutos, se obtiene:
i
Tiempo de
llegada
Frecuencia Observada (o
i
)
1 < 1 13
2 1-2 9
3 2-3 5
4 3 > 3
Total= 30
Conociendo la funcin distribucin de la exponencial:
x
e x X P x F

= s = 1 ) ( ) (
Donde, el valor esperado, que se obtiene por un promedio, est dado por:
) ( 1
1
) ( X E X E = =

Calculando el valor esperado que es de 1.563 y reemplazando en la


ecuacin anterior, se obtiene que 64 . 0 = autos por minuto.
As las probabilidades para cada intervalo, son:
473 . 0
64 . 0
1 ) 1 (
1
=

= s = e X P p
249 . 0
) 1 )( 64 . 0 (
1
) 2 )( 64 . 0 (
1 ) 1 ( ) 2 ( ) 2 1 (
2
=

= s s = s s =
(

e e X P X P X P p
131 . 0
) 2 )( 64 . 0 (
1
) 3 )( 64 . 0 (
1 ) 2 ( ) 3 ( ) 3 2 (
3
=

= s s = s s =
(

e e X P X P X P p

147 . 0
) 3 )( 64 . 0 (
1 1 ) 3 ( 1 ) 3 (
4
=

= s = > =
(

e X P X P p

Para calcular las frecuencias esperada (e
i
):
19 . 14 30 * 473 . 0 *
1 1
= = = n p e
47 . 7 30 * 249 . 0 *
2 2
= = = n p e
93 . 3 131 . 0 *
3 3
= = = n p e

41 . 4 147 . 0 *
4 4
= = = n p e



Se organizan los datos en la siguiente tabla:
i
Tiempo de
llegada
Frecuencia Terica (e
i
)
1 < 1 14.19
2 1-2 7.47
3 2-3 3.93
4 3 > 4.41
Total= 30

Es necesario que se cumpla la condicin
i
, e
i
5, por lo que debe adjuntarse en clases adyacentes.
Como resultado se obtienen tres clases, k=3.
i
Tiempo de
llegada
Frecuencia Terica (e
i
)
1 < 1 14.19
2 1-2 7.47
3 2 > 8.34
Total= 30

Para calcular el valor de chi-cuadrada calculada, se organizan en la siguiente tabla:
< 1 1-2 2-3 3 > Total
o 13 9 5 3 30
e 14.19 7.47 3.93 4.41 30
(o e) -1.19 1.53 1.07 -1.41 30
(o e)
2
1.4161 2.3409 1.1449 1.9881
(o e)
2
/e 0.09979563 0.31337349 0.29132316 0.45081633 1.15530861

Se calculan los grados de libertad (v) teniendo en cuenta que k (nmero de muestras del
problema) es igual a 4 y el nmero de estimadores obtenidos a partir de la muestra es m=1:
2 1 1 4 1 = = = m k v

2. Distribucin Chi-cuadrada.
Definiendo la regin de rechazo de la hiptesis y un nivel de significancia de 0.05, se lee en la tabla
anterior el valor de chi cuadrado con los grados de libertad establecidos:
9915 . 5
2
05 . 0
= x

Al comparar los dos valores de chi-cuadrada, se obtiene que
2
05 . 0
2
x x s
Esto quiere decir que el
valor de la estadstica de trabajo no est en la zona de rechazo de la hiptesis propuesta (Ho). Por
lo tanto, con una confiabilidad del 95 por ciento, no se rechaza que el tiempo entre llegadas de los
autos tiene una distribucin exponencial.



















2. Se contabiliz el nmero de clientes que visitaron la oficina de un joven abogado durante sus
primeros 30 das de prctica.


Observaciones # de clientes
1 3
2 0
3 2
4 4
5 5
6 1
7 2
8 0
9 3
10 1
11 2
12 3
13 0
14 3
15 2
16 1
17 3
18 4
19 2
20 1
21 3
22 0
23 3
24 2
25 1
26 2
27 3
28 1
29 2
30 3
3. Tabla de observaciones (Nmero de clientes)


Organizando los datos en frecuencias observadas (o
i
), y calculando algunos valores necesarios para
obtener el valor , se tiene:
i
# de
clientes
Frecuencia Observada (o
i
) xi*oi
1 0 4 0
2 1 6 6
3 2 8 16
4 3 9 27
5 4 2 8
6 5 1 5
Total= 30 62

07 . 2 0667 . 2
30
62
*
~ = =

=
n
i
o
i
x

As, la hiptesis propuesta (H
o
), sera:
H
o
: X ~ Poisson (2.07)
Calculando la probabilidad correspondiente a cada intervalo:
!
) (
) (
c
e
c
c X P
c
p


= = =
126 . 0
! 0
07 . 2 0
) 07 . 2 (
) 0 (
0
=

= = =
e
X P p
;
261 . 0
! 1
07 . 2 1
) 07 . 2 (
) 1 (
1
=

= = =
e
X P p

270 . 0
! 2
07 . 2 2
) 07 . 2 (
) 2 (
2
=

= = =
e
X P p
;
186 . 0
! 3
07 . 2 3
) 07 . 2 (
) 3 (
3
=

= = =
e
X P p

096 . 0
! 4
07 . 2 4
) 07 . 2 (
) 4 (
4
=

= = =
e
X P p
;
04 . 0
! 5
07 . 2 5
) 07 . 2 (
) 5 (
5
=

= = =
e
X P p


Calculando las frecuencias esperadas (e
i
) y resumindolas en una tabla, se obtiene:
9 . 3 30 * 126 . 0 *
0 1
= = = n p e

8 30 * 261 . 0 *
1 2
= = = n p e

2 . 8 30 * 270 . 0 *
2 3
= = = n p e
7 . 5 30 * 186 . 0 *
3 4
= = = n p e

3 88 . 2 30 * 096 . 0 *
4 5
~ = = = n p e

2 . 1 30 * 04 . 0 *
5 6
= = = n p e



i
# de
clientes
Frecuencia Terica (e
i
)
1 0 3.9
2 1 8
3 2 8.2
4 3 5.7
5 4 3
6 5 1.2
Total= 30

Es necesario que se cumpla la condicin
i
, e
i
5, por lo que debe adjuntarse en clases adyacentes.
Como resultado se obtienen tres clases, k=3.
i
# de
clientes
Frecuencia Terica (e
i
)
1 0-1 11.9
2 2 8.2
3 3 9.9
Total= 30

Definiendo la regin de rechazo de la hiptesis, usando un nivel de significancia de 0.05 y con r=1,
ya que el parmetro se calcul as, se obtiene los grados de libertad, v:
2 1 3 1 = = =k v

Y obteniendo el valor de chi-cuadrada en la tabla de Distribucin de Chi-cuadrada: 9915 . 5
2
05 . 0
= x
para comprobar la hiptesis se debe comprobar que x
2
>5.9915 para rechazar H
o
.

Para calcular el valor de chi-cuadrada calculada, se organizan en la siguiente tabla:
i 1 2 3 4 5 6 Total
o 4 6 8 9 2 1 30
e 3.9 8 8.2 5.7 3 1.2 30
(o e) 0.1 -2 -0.2 3.3 -1 -0.2
(o e)
2
0.01 4 0.04 10.89 1 0.04
(o e)
2
/e 0.0025641 0.5 0.00487805 1.91052632 0.33333333 0.03333333 2.784635134

Comparando los dos resultados se tiene que
2
05 . 0
2
x x s , esto quiere decir que el valor de la
estadstica de trabajo est en la zona de no rechazo de la hiptesis propuesta (H
o
); por lo tanto con
una confiabilidad del 95 por ciento, se concluye que el nmero de clientes que llegan a la oficina
del joven abogado tiene una distribucin Poisson.

Bibliografa:
Tabla 3. de distribucin de Chi cuadrado. PDF. sameens.dia.uned.es
3.8. Prueba Chi-cuadrado o bondad de ajuste. Estadstica II. Hermelinda Ordoez Pinzn.
Universidad Nacional de Colombia Manizales. www.virtual.unal.edu.co.
Unidad VI, Pruebas Chi-cuadrada y estadstica no paramtrica. Instituto tecnolgico de
Chihuahua. www.itch.edu.mx.

You might also like