You are on page 1of 21

BONDAD DE

AJUSTE
Integrantes:
Fresia Lpez
Jenny Reyes
Natalia Ramos

TEMAS

LA PRUEBA DE BONDAD DE AJUSTE


- EJEMPLOS

PRUEBA CHICUADRADO PARA LA BONDAD DE AJ


USTE
- EJEMPLOS

LA PRUEBA DE BONDAD DE
AJUSTE

Es considerada como una prueba no paramtrica


que mide la discrepancia entre una distribucin
observada y otra terica, indicando en qu
medida las diferencias existentes entre ambas, de
haberlas, se deben al azar.
La frmula que da el estadstico
es la siguiente:

i 1

oi

f ei
f ei

Donde:
Oi = Valor observado en
la i-simo dato.
Ei = Valor esperado en
la i-simo dato.
K =Categoras o celdas.
m = Parmetros
estimados sobre la base de
los datos de la muestra

Los grados de libertad vienen dados por:


gl= K-m-1.
Criterio de decisin es el siguiente:
- Se rechaza H0 cuando 2 t2; K m 1 . En caso
contrario se acepta.
- Cuanto ms se aproxima a cero el valor de chicuadrado,
ms
ajustadas
estn
ambas
distribuciones.

EJEMPLOS:
1- Si un ingeniero de control de calidad toma una muestra de 10
neumticos que salen de una lnea de ensamblaje y l desea verificar
sobre la base de los datos que siguen, los nmeros de llantas con
defectos observadas en 200 das, si es cierto que el 5% de todos los
neumticos tienen defecto; es decir, si el muestrea una poblacin
binomial con n = 10 y p = 0.05
Nmero de unidades
con defecto.

Nmero de muestras.
0

138

53

2 o ms

Establecer la hiptesis
Ho: La poblacin es binomial
Ha: La poblacin no es binomial

oi

ei

f ei

i 1

2
Establecer lak estadstica
f f de prueba-

Donde:

Oi = Valor observado en la i-simo


dato.
Ei = Valor esperado en la i-simo
dato.
K = Categoras o celdas.
m = Parmetros

Definir el nivel de significancia y la zona de rechazo


g,l = k- m 1 = (3 0- 1) =2
5.99

Nivel de significancia = 0.05

Zona de rechazo = { 5.9

m = 0 porque no se necesito estimar ningn parmetro.

Calculamos el estadstico de prueba

i 1

oi

f ei

f ei

Para poder calcular las frecuencias esperadas tenemos que calcular las
probabilidades utilizaremos la formula de la binomial.

n
f ( x) P( x) p x (1 p ) n x
x

- Donde:

n = 10 p = 0.05

0
10 0
f (0) 10
=0.599
0 0.05 ( 1 0.05)

1
10 1
f (1) 10
= 0.315
1 0.05 ( 1 0.05)
y la probabilidad de 2 ms
= 1.0 -0.599 -0 .315 = 0.086

Nmero de
unidades con
defecto

Total

0
1
2 ms

Nmero de
muestras

Observadas 138

Valor
Esperado
119,8
63
17,2
200

53
9
200

Ahora ya podemos encontrar las frecuencias esperadas:


200 (0.599) = 119.8
200(0.315) = 63
200 (0.086) = 17.2
Al aplicar la siguiente frmula se tiene:
2
2
2
(
138

119
.
8
)
(
53

63
.
0
)
(
9

17
.
2
)
2

119 .8
63
17.2

= 8.26

Como 8.26 es mayor que 5.99, se rechaza la hiptesis nula con un nivel de
significancia de 0.05.

Conclusin :
- Se concluye que el porcentaje verdadero de neumticos con defecto no es
el 5%.

Si el nmero de errores que comete una secretaria al transcribir


un documento es una variable aleatoria que tiene una distribucin
de Poisson. Se reviso 440 transcripciones hechas por ella y arrojo
los siguientes resultados:
Variable = nmero de errores.
Nmero de
errores

Frecuencia
0
1
2
3
4
5
6
7
8
9

18
53
103
107
82
46
18
10
2
1

Probar si los datos de los


errores se ajustan a una
distribucin de Poisson.
Use = 0.05.

Establecer las hiptesis:


H0: La poblacin se comporta como una distribucin de Poisson.
Ha: La poblacin no se comporta como una distribucin de
Poisson.

El estadstico de prueba que usaremos es:



2

( f Oi f Ei ) 2
f Ei

Nivel de significacin = 0,05


gl. = 9-1-1=7

02, 05;7 14,067

Regin de rechazo =

| 2 14,067

Para poder calcular las frecuencias esperadas tenemos que


calcular las probabilidades utilizaremos la formula de la
distribucin de Poisson:

x e
p ( x; )
x!

Como no se conoce la media de la distribucin de Poisson la


estimamos con la media de los datos, que es 3,04 luego, = 3,04
Errores
0
1
2
3
4
5
6
7 mas
Total

Frecuencia
observada
18
53
103
107
82
46
18
13
440

Prob.
0,0478
0,1454
0,2210
0,2239
0,1702
0,1034
0,0524
0,0359
1

Frecuencia
esperada
21,032
63,976
97,240
98,516
74,888
45,496
23,056
15,796
440

Aplicamos los datos al estadstico de prueba


(18 21,032) 2 (53 63,976) 2
(13 15,796) 2

....
5,6766
21,032
63,976
15,796
2

Como 5,7566 es menor 14,076 no se rechaza la hiptesis nula.


Conclusin:
- La poblacin se comporta como una distribucin de Poisson con
media 3,04

El Departamento de Psicologa, basndose en informaciones


anteriores, al final del semestre antepasado, el 80% de los
alumnos aprobaron todas las materias inscritas, un 10% aprob la
mitad, un 6% reprob todas las materias y un 4% se retiro. Al
final del semestre pasado el departamento selecciono a 400
alumnos, resultado 287 aprobaron todas las asignaturas, 49
aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se
retiraron. Podemos concluir, a raz de los resultados, que la
informacin del semestre antepasado se ha vuelto a repetir el
semestre pasado?
Hiptesis nula: de que los porcentajes del semestre pasado son los
mismos que en el semestre antepasado.
Atributos
Aprob todo
Aprob la mitad
Reprob todo
Se retir
Total

Datos
observados
287
49
30
34
400

Probabilidad
0,80
0,10
0,06
0,04
1

Datos
esperados
320
40
24
16
400

2 = 27,178

Como tenemos 4 categoras y ningn parmetro estimado los


grados
de libertad sern: 4-0-1= 3
2

0, 05;3 12,84

Como 27,178 es mayor que 12,84 se rechaza la hiptesis nula.


Conclusin:
- Los porcentajes no se repitieron el semestre pasado

TEMAS

PRUEBA CHI-CUADRADO PARA LA


BONDAD DE AJUSTE

Esta prueba es aplicable para variables aleatorias discretas o


continuas
Sea una muestra aleatoria de tamao n tomada de una poblacin
con una distribucin especificada f0(x) que es de inters verificar.
Suponer que las observaciones de la muestra estn agrupadas en
k clases, siendo ni la cantidad de observaciones en cada clase i =
1, 2, ..., k
Con el modelo especificado f0(x) se puede calcular la probabilidad
pi que un dato cualquiera pertenezca a una clase i.

Con este valor de probabilidad se puede encontrar la frecuencia


esperada ei para la clase i, es decir, la cantidad de datos que segn el
modelo especificado deberan estar incluidos en la clase i: ei = pi n,
i = 1, 2, ..., n
Tenemos entonces dos valores de frecuencia para cada clase i
ni:

frecuencia observada (corresponde a los datos de la muestra)

ei:

frecuencia esperada (corresponde al modelo propuesto)

La teora estadstica demuestra que la siguiente variable es apropiada


para realizar una prueba de bondad de ajuste:

Definicin:
Estadstico para la prueba de bondad de ajuste

Ji-cuadrado

2 = , distribucin Ji-cuadrado con =k1 grados de libertad


.

Es una condicin necesaria para aplicar esta prueba que i(ei5)

Dado un nivel de significancia se define un valor crtico para el


rechazo de la hiptesis propuesta Ho: f(x) = f0(x).
Si el las frecuencias observadas no difieren significativamente de las
frecuencias esperadas calculadas con el modelo propuesto, entonces
el valor de estadstico de prueba 2 ser cercano a cero, pero si estas
diferencias son significativas, entonces el valor del estadstico 2
estar en la regin de rechazo de Ho:
2 > 2

Regin de rechazo de Ho

EJEMPLOS:
1-

Se ha tomado una muestra aleatoria de 40 bateras y se ha


registrado su duracin en aos. Estos resultados se los ha
agrupado en 7 clases en el siguiente cuadro:
i

Clase
1

Frecuencia

(duracin)
observada (ni)
1.45 - 1.95
2

1.95 - 2.45

2.45 - 2.95

2.95 - 3.45

15

3.45 - 3.95

10

3-95 - 4.45

4.45 - 4.95

Solucin:

Sea X: duracin en aos (variable aleatoria continua)


1.
2.

Ho:

f(x) = N(3.5, 0.7) (distribucin normal, =3.5, =0.7)

Ha: H0

= 0.05

Clculo de la probabilidad correspondiente a cada intervalo


p1 = P(X1.95) = P(Z(1.95 3.5)/0.7) = 0.0136
p2 = P(1.95X2.45) = P((1.95 3.5)/0.7 Z (2.45 3.5)/0.7) = 0.0532
p3 = P(2.45X2.95) = P((2.45 3.5)/0.7 Z (2.95 3.5)/0.7) = 0.135

Clculo de las frecuencias esperadas


e1 = p1 n = 0.0136 (40) 0.5
e2 = p2 n = 0.0532 (40) 2.1
e3 = p3 n = 0.135 (40) 5.4
... (etc)

... (etc)

Resumen de resultados:
Es necesario que se cumpla la condicin i(ei5) por lo que se deben
agrupar clases adyacentes. Como resultado se tienen cuatro clases
k=4
Duracin

Frecuencia

Frecuencia

(aos)
1.45 - 2.95

observada (ni)
7

esperada (ei)
8.5

2.95 - 3.45

15

10.3

3.45 - 3.95

10

10.7

3.95 - 4.95

10.5

02.05

Ahora se puede definir la regin de rechazo de Ho


= 0.05, = k 1 = 3,
Rechazar Ho si 2 > 7.815

= 7.815

Tabla 2

Clculo del estadstico de prueba

= (ni ei ) 2

ei
i1
k

(7 8.5) 2 (15 10.3) 2 (10 10.7) 2 (8 10.5) 2


=

8
.
5
10
.
3
10
.
7
10.5

= 3.05

Decisin
Como 3.05 no es mayor a 7.815, se dice que no hay evidencia
suficiente
para rechazar el modelo propuesto para la
poblacin.

TEMAS

You might also like