Professional Documents
Culture Documents
TALLER DE SIMULACION
UNIDAD IV
Test de bondad de ajuste
31/03/2015
Objetivo de la Unidad IV
Reconocer y aplicar:
Tets Chi- Cuadrado.
Test Kolmogorov Smirnov.
Anderson Darling
UNIDAD IV
Chi-Cuadrado
31/03/2015
PRUEBAS
DE BONDAD DE AJUSTE
Cualquier aplicacin de test de bondad de
ajuste responde al mismo principio:
Si el valor Calculado > Valor Tabla (valor
crtico), entonces se rechaza la hiptesis.
Esto es equivalente a decir que el error
acumulado de los datos con respecto a la
distribucin terica supera lo permitido.
PRUEBAS
DE BONDAD DE AJUSTE
2 Calculado.
2 =
=1
( )2
Tabla (Crtico)
31/03/2015
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
Sea X una variables aleatoria discreta con
valores x1,x2,xn. Se propone una hiptesis H0,
de que la distribucin donde proviene la
muestra se comporta segn un modelo
terico especifico.(Ej; Exponencial negativa).
FOi, representa el numero de veces que ocurre
el valor xi.
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
FEi, frecuencia esperada proporcionada por el
modelo terico.
La prueba X2 hace uso de distribuciones del
mismo nombre para probar la bondad del
ajuste.
31/03/2015
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
Usualmente ocurre que FEi (y tambin FOi)
son muy pequeas, entonces, se adopta el
criterio de agrupar los valores consecutivos
de k intervalos adyacentes de estas
frecuencias esperadas, hasta que su suma sea
de al menos 5 observaciones
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:
02
=
=1
( )2
31/03/2015
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:
El valor de k lo determina la cantidad de
valores diferentes de la variable.
Supongamos que los parmetros estimados
son la media y la varianza, esto es, 2
parmetros estimados. Por lo tanto los grados
de libertad sern:
=(k-1)-2=(k-3) grados de libertad
PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:
Para calcular k, se emplea la Regla de Sturges.
k=1+3.322 log10(N)
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Se dispone de 50 datos obtenidos de una
poblacin que registra la vida til (en
unidades de tiempo) de acumuladores
automotrices de catorce celdas.
Prubese que la hiptesis nula de que la
variable aleatoria vida til de los
acumuladores
sigue
una
distribucin
exponencial negativa, considrese un nivel
significativo de alfa igual al 5%:
:
PRUEBA JI-CUADRADO,X2
EJEMPLO
DATOS:
8.22
2.23
2.92
0.76
1.06
0.84
3.81
0.97
4.49
0.19
2.63
1.62
0.33
1.51
2.78
4.78
1.51
4.03
1.07
3.25
0.41
2.34
0.54
5.09
5.59
0.52
1.46
0.23
1.4
0.69
2.33
0.77
3.32
0.29
1.73
2.56
0.02
3.33
3.49
1.27
0.51
0.23
2.33
2.92
1.7
6.43
3.21
7.51
0.33
1.85
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:
10
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
A continuacin se arreglan los valores de
forma ascendente y, se calculan las
frecuencias.
Promedio de la muestra = 2.3
k
1
2
3
4
5
6
Li
0.0
1.5
3.0
4.5
6.0
7.5
Ls
1.5
3.0
4.5
6.0
7.5
9.0
FO
21
15
8
3
1
2
FO relat.
0.42
0.3
0.16
0.06
0.02
0.04
PRUEBA JI-CUADRADO,X2
EJEMPLO
A continuacin se arreglan los valores de
forma ascendente y, se calculan las
frecuencias.
Promedio de la muestra = 2.3
k
1
2
3
4
5
6
Li
0.0
1.5
3.0
4.5
6.0
7.5
Ls
1.5
3.0
4.5
6.0
7.5
9.0
FO
21
15
8
3
1
2
FO relat.
0.42
0.3
0.16
0.06
0.02
0.04
11
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Los ltimos tres intervalos de clase no
alcanzan a contener las muestras mnimas
requeridas (5), se debe corregir.
k
1
2
3
4
Li
0.0
1.5
3.0
4.5
Ls
1.5
3.0
4.5
9.0
FO
21
15
8
6
PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando FE terica.
Se asume beta = 2
1.5
1
1 1
0.75
2 = [ 2 ]1.5
1) = 0.528
0 = (
2
12
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando FE terica.
Se asume beta = 2
1.5
1
1 1
0.75
2 = [ 2 ]1.5
1) = 0.528
0 = (
2
PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando.
k
1
2
3
4
Li
0.0
1.5
3.0
4.5
Ls
1.5
3.0
4.5
9.0
FO
21
15
8
6
FO relat.
0.42
0.3
0.16
0.12
1.000
FE . Terorica ((FO-FE)2)/FE
0.528
0.022
0.249
0.010
0.118
0.015
0.094
0.007
0.989
0.054
13
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
k=4
Grados de Libertad son = (4- 1) 1 = 2
Nmero parmetros estimados: 1 (beta =
media)
PRUEBA JI-CUADRADO,X2
EJEMPLO
Valor de X2 TABULADO= 5.99.
Como X2 calculado = 0.054 < X2 TABULADO =
5.99
Se concluye que no se puede rechazar la
hiptesis nula.
La muestra viene de una distribucin
exponencial negativa con media 2.
14
31/03/2015
PRUEBA JI-CUADRADO,X2
EJEMPLO
PRUEBAS DE BONDAD
DE AJUSTE
TEST
KOLMOGOROV SMIRNOV
Jos Rodrguez l.
Docente Simulacin
15
31/03/2015
TEST
KOLMOGOROV SMIRNOV
El test de Chi-Cuadrado puede considerarse como una
comparacin entre la forma del histograma y la funcin
acumulada de probabilidad (estimada). Pero este test
evidencia una dificultad para el caso de distribuciones
continuas debido a que se debe decidir cmo especificar los
intervalos.
El test de bondad de ajuste K-S, a diferencia del ChiCuadrado, compara una distribucin emprica con una
funcin estimador () de la distribucin subyacente.
TEST
KOLMOGOROV SMIRNOV
Se aplica a variables continuas y su rango de aplicacin
es ms limitado que el de Chi - Cuadrado.
Sea F(y) funcin de distribucin acumulada, de una
poblacin que se toma una muestra y1, y2,yn.
Supngase que Y es una variable aleatoria continua
que tiene una funcin de distribucin acumulada F(y).
Consideremos una muestra de n observaciones de Y:
y1, y2,yn
16
31/03/2015
TEST
KOLMOGOROV - SMIRNOV
TEST
KOLMOGOROV SMIRNOV
Reordenemos estos valores en forma ascendente, as,
y1 y2, yn
Definamos la funcin acumulada emprica Fn(y) =
fraccin de la muestra menor o igual a y .
Con ecuacin:
1)
(
,
() = (
1,
0
(1) () = 1, ,
()
17
31/03/2015
TEST
KOLMOGOROV SMIRNOV
La medida estadstica D de K-S se basa en la distancia
mxima entre F(y) y Fn(y):
= () ()
Como F(y) y Fn(y) no son decrecientes y Fn(y) es constante
entre observaciones de muestra.
La desviacin mxima se presentara ya sea en una de los
puntos de observaciones y1, y2, , yn , o inmediatamente a la
izquierda de uno de ellos.
TEST
KOLMOGOROV SMIRNOV
Para determinar el valor observado de D slo se necesita
determinar el valor de la siguiente manera:
+ = max
( ) ;
y tambin.
= max ()
1
;
Ya que:
= (D+, D)
18
31/03/2015
TEST
KOLMOGOROV SMIRNOV
Si H0 se supone de la forma F(y), pero se dejan sin especificar
algunos de los parmetros, entonces estos se deben estimar
TEST
KOLMOGOROV SMIRNOV
Estos casos son para las hiptesis nulas de una F(y)
completamente especificada; Normal con promedio y
varianza desconocido y exponencial negativa con promedio
desconocido:
Para F(y) en general:
= (D)
0.12 +
0.11
19
31/03/2015
TEST
KOLMOGOROV SMIRNOV
Para F(y) Normal con media y varianza desconocida:
= (D)
0.01 +
0.85
= (D
0.2
)
n
+ 0.26 +
0.5
TEST
KOLMOGOROV SMIRNOV
Forma modificada de D
(kolmogorov - Smirnov)
F(y)
Especificada
F(y) Normal
media,
Varianza
desconocidas
F(y)
Exponencial
beta
desconocidas
= (D)
= (D)
= (D
+ 0.12 +
0.11
0.01 +
0.2
)
n
0.85
0.9
1 - alfa
0.95
0.975
0.99
0.85
+ 0.26 +
0.5
1.3
20
31/03/2015
TEST
KOLMOGOROV SMIRNOV
Caso de una distribucin WEIBULL.
Supngase que la distribucin subyacente inferida es Weibull, con
TEST
KOLMOGOROV SMIRNOV
Entonces Ho se rechaza si el estadstico de ajuste K-S
es
21
31/03/2015
TEST
KOLMOGOROV SMIRNOV
Valores modificados para test K-S, distribuciones WEIBULL
(Ref.: Law and Kelton 4 edicin)
n
10
20
0.900
0.760
0.779
0.950
0.819
0.843
0.975
0.880
0.907
0.990
0.944
0.973
50
infinito
0.790
0.803
0.856
0.874
0.922
0.939
0.988
1.007
TEST
KOLMOGOROV SMIRNOV
Caso de una distribucin Log-logstica.
Supngase que la distribucin subyacente inferida es Log-logstica,
con parmetros de forma () y de escala () ambos desconocidos.
Todos los , datos bsicos logartmicos, estimar los parmetros
de su respectiva mxima verosimilitud (MLE - maximum likelihood
estimation) basados en los , , tambin es tomada
de una distribucin logstica.
() = (1 +
, < <
22
31/03/2015
TEST
KOLMOGOROV SMIRNOV
Donde D se calcula de la misma forma,
Entonces Ho se rechaza si el estadstico de ajuste K-S
es
TEST
KOLMOGOROV SMIRNOV
Valores modificados
para test K-S, distribuciones Log-Logstica
(Ref.: Law and Kelton 4 edicin)
n
10
20
50
infinito
0.900
0.679
0.698
0.708
0.715
0.950
0.730
0.755
0.770
0.780
0.975
0.774
0.800
0.817
0.827
0.990
0.823
0.854
0.873
0.886
23
31/03/2015
TEST
KOLMOGOROV SMIRNOV
EJEMPLO:
Las diez observaciones siguientes son muestras aleatoria de
una distribucin continua. Pruebe que la hiptesis que esos
datos provienen de una distribucin exponencial con media
2, en el nivel de significancia de 0.05
TEST
KOLMOGOROV - SMIRNOV
EJEMPLO:
0.023
0.406
0.538
1.267
2.343
2.563
3.334
3.491
5.088
5.587
( ) = 1 eyi /2
24
31/03/2015
TEST
KOLMOGOROV - SMIRNOV
i
1
2
3
4
5
6
7
8
9
10
y(i)
0.023
0.406
0.538
1.267
2.343
2.563
3.334
3.491
5.088
5.587
F(yi)
0.0114
0.1837
0.2359
0.4693
0.6901
0.7224
0.8112
0.8254
0.9214
0.9388
( ) = 1 eyi /2
TEST
KOLMOGOROV SMIRNOV
D+= 0.0886
D-= 0.2901
Solucin: Dm= Max (D-, D+) = 0.2901
= (0,2901)
10 0.12 +
0.11
= 0.9623
10
Para alfa = 0.05, el valor de D calculado = 0.9623 < D
modificado 1.358.
No se rechaza la hiptesis nula.
25
31/03/2015
TEST
KOLMOGOROV - SMIRNOV
F(yi)
1.0000
0.9000
0.8000
0.7000
Probabilidad
0.6000
0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
F(yi)
Fn(y)= (i-1)/n
10
0.0114
0.1837
0.2359
0.4693
0.6901
0.7224
0.8112
0.8254
0.9214
0.9388
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
PRUEBAS DE BONDAD
DE AJUSTE
TEST
ANDERSON DARLING
Jos Rodrguez l.
Docente Simulacin
26
31/03/2015
TEST
ANDERSON DARLING
Un posible inconveniente del test K-S es que asignan una
misma importancia a la diferencia () para cada
valor de x, mientras varias distribuciones de inters difieren
principalmente en sus colas. El test de Anderson-Darling (AD), por otra parte, fue diseado para detectar discrepancias
en las colas y tiene mayor poder que el test de K-S contra
muchas distribuciones alternativas.
TEST
ANDERSON DARLING
El estadstico A-D, 2 es definido por:
2 =
donde
()
[1 ]}
es la funcin de pesos.
27
31/03/2015
TEST
ANDERSON DARLING
Si hacemos = = 1,2, entonces se puede
demostrar:
2 = ({
=1
2 1 [ + ln(1 +1 )]/})
TEST
ANDERSON DARLING
28
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
Asumamos que debemos confirmar que la distribucin de
probabilidad
subyacente
de
datos
sigue
0.399
una
distribucin
, y que el nivel
0.6
219
2219 = 0.560
TEST
ANDERSON DARLING
Ejemplo.
Datos
35.620
33.828
28.335
37.058
35.891
36.606
38.969
37.410
30.726
38.014
33.317
34.270
33.155
32.650
35.319
36.636
35.078
32.798
33.106
33.569
29
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
Estadstica descriptiva.
Columna1
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(95.0%)
34.618
0.574
34.674
#N/A
2.568
6.597
0.530
-0.530
10.634
28.335
38.969
692.356
20.000
1.202
TEST
ANDERSON DARLING
Ejemplo.
Histograma.
30
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
TEST
ANDERSON DARLING
Ejemplo.
31
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
TEST
ANDERSON DARLING
Ejemplo.
32
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D
33
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D
TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D
34
31/03/2015
TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D
TEST
ANDERSON DARLING
Ejemplo.
Respuesta:
Como el valor de 2 = 0.24423726 <0.751 = Valor crtico A-D.
Se concluye que no existe evidencia estadstica para rechazar la
hiptesis nula que los valores del ejemplo tienen una distribucin
normal con parmetros:
Media
34.61778027
Desv Std.
2.568381159
35
31/03/2015
TEST
ANDERSON DARLING
FIN
Jos Rodrguez l.
Docente Simulacin
36