You are on page 1of 3

2.6 Pruebas de la bondad de ajuste.

En la construccin del modelo de simulacin es importante decidir si un conjunto de datos se ajusta


apropiadamente a una distribucin especfica de probabilidad. Al probar la bondad del ajuste de un conjunto de
datos, se comparan las frecuencias observadas FO realmente en cada categora o intervalo de clase con las
frecuencias esperadas tericamente FE .

Prueba Ji cuadrada

La prueba Ji cuadrada hace uso de la distribucin del mismo nombre para probar la bondad del ajuste al
comparar el estadstico de prueba Xo2 con el valor en tablas de la mencionada distribucin Ji cuadrada con v
grados de libertad y un nivel de significancia alfa. En la siguiente seccin aplicaremos esta prueba para probar la
hiptesis nula de que los nmeros aleatorios (provenientes de un generador) se ajustan a la distribucin terica
uniforme continua.

Sea X una variable aleatoria discreta con valores x1, x2,......., xn Se propone la hiptesis nula H0, de que la
distribucin de donde proviene la muestra se comporta segn un modelo terico especfico tal como la uniforme,
la exponencial, la normal, etc. Entonces FOi, representa el nmero de veces que ocurre el valor xi mientras que
FEi, es la frecuencia esperada proporcionada por el modelo terico propuesto. A menudo ocurre que muchas de
las frecuencias FEi, (y tambin las FOi) son muy pequeas, entonces, como regla prctica adoptamos el criterio
de agrupar los valores consecutivos de estas frecuencias esperadas hasta que su suma sea de al menos cinco.
La medida estadstica de prueba para la hiptesis nula es

Para n grande este estadstico de prueba tiene una distribucin X2 aproximada con V grados de libertad dados
por

V = (k 1) (nmero de parmetros estimados)

As, si se estiman dos parmetros como la media y la varianza, la medida estadstica tendr (k 3) grados de
libertad.

Se puede aplicar esta prueba a variables continuas agrupando adecuadamente los valores en un nmero
adecuado de subintervalos o clases k. Una regla emprica para seleccionar el nmero de clases es:

Forma 1:

Forma 2: k = n
EJEMPLO. La siguiente muestra de tamao 50 ha sido obtenida de una poblacin que registra la vida til (en
unidades de tiempo) de bateras alcalinas tipo AAA. Prubese la hiptesis nula de que la variable aleatoria vida
til de las bateras sigue una distribucin exponencial negativa. Considrese un nivel de significancia alpha de
5%.

8.223 0.836 2.634 4.778 0.406 0.517 2.330 2.563 0.511 6.426
2.230 3.810 1.624 1.507 2.343 1.458 0.774 0.023 0.225 3.214
2.920 0.968 0.333 4.025 0.538 0.234 3.323 3.334 2.325 7.514
0.761 4.490 1.514 1.064 5.088 1.401 0.294 3.491 2.921 0.334
1.064 0.186 2.782 3.246 5.587 0.685 1.725 1.267 1.702 1.849

SOLUCIN. Calculamos los valores min = 0.023 y max = 8.223. Resultando ser el rango o recorrido igual a 8.2.
El valor promedio es de 2.3. A continuacin ordenamos los valores de manera ascendente y construimos el
histograma de frecuencias relativas con seis clases cada una de longitud 1.5. (esto es debido a que 8.2 / 6 = 1.3)

R = Ls Li = 8.223 0.023 = 8.2

k = 1 + (3.22) log20(n) =1 + (3.22) log20(50) = 5.2 6

c = R/k = 8.2/6 = 1.36 1.3

k Clase FO absoluta, f o FO relativa, f e


1 0.0 - 1.15 21 0.42
2 1.15 - 3.0 15 0.30
3 3.0 - 4.5 8 0.16
4 4.5 - 6.0 3 0.06
5 6.0 - 7.5 1 0.02
6 7.5 - 9.0 2 0.04

O sea, que dado un = 5% = 0.05 se debe tener que las f e sean mayores o iguales a 0.05. Por tanto,
se reagrupan en un nico intervalo las f es menores a 0.05. As,

Re agrupamos las clases de modo que la FO sea de al menos 5.

k Clase FO absoluta, f o FO relativa, f e


1 0.0 - 1.15 21 0.42
2 1.15 - 3.0 15 0.30
3 3.0 - 4.5 8 0.16
4 4.5 - 9.0 6 0.12
Como nuestra hiptesis nula es que los datos se ajustan a la funcin de probabilidad exponencial negativa,
emplearemos tal funcin para calcular mediante integracin el porcentaje de probabilidad esperado para cada
subintervalo. Ya vimos que el valor promedio es de 2.3, sin embargo para fines prcticos lo consideraremos como
2.0. El clculo de la integral para la primer clase es:

k Clase FO relativa FE terica, p(x) (FO-FE) 2 / FE


1 0.0 - 1.5 0.42 0.528 0.022
2 1.5 - 3.0 0.30 0.249 0.010
3 3.0 - 4.5 0.16 0.118 0.015
4 4.5 - 9.0 0.12 0.105 0.002

Entonces se tiene el valor

Ahora compararemos este valor calculado contra el valor tabulado de la distribucin Ji cuadrada con un nivel de
significancia alpha de 5% y el nmero de grados de libertad
V = (k 1) 1 = (4 1) 1 = 2. (Obsrvese que se estimo el parmetro promedio ?). Entonces

Como vemos el valor calculado es menor que el valor tabulado, por tanto la conclusin es que no se puede
rechazar la hiptesis nula de que la muestra proviene de una distribucin exponencial con media 2.0.

You might also like