You are on page 1of 32

REPUBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA


DEFENSA
UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA
FUERZA ARMADA (UNEFA)
NUCLEO ZULIA

Prueba para la Bondad de


ajuste Validacin de Modelo
Integrantes
LERBY ARTEAGA
FREDDY ARENAS
CARLOS ARIZA
LUIS MORENO

Prueba para la Bondad de


ajuste

Las pruebas de bondad de ajuste tienen por


objetivo determinar si los datos se ajustan a una
determinada distribucin, esta distribucin puede
estar completamente especificada (hiptesis
simple) o perteneciente a una clase paramtrica
(hiptesis compuesta).

La prueba de bondad de ajuste se aplica en diseos


de investigacin en los que se estudia a un nico
grupo.
La prueba compara la distribucin de frecuencias
observada (Fo) de una variable usualmente
cualitativa, pero que tambin puede ser
cuantitativa, con la distribucin de frecuencias de la
misma variable medida en un grupo de referencia.

Prueba para la Bondad de ajuste

Hiptesis estadstica nula: Ho: Fo = Fe


Hiptesis estadstica alterna: Ha: Fo Fe
El procedimiento de la prueba incluye el clculo
de la medida de resumen llamada Chi cuadrada.
El rechazo del Ho ocurre cuando el valor
calculado con los datos resulta mayor que el valor
crtico de dicha medida contenido en una tabla
llamada Valores Crticos de Chi cuadrada.

Prueba para la Bondad de ajuste


En el caso de que el valor de Chi cuadrada
calculada sea igual o menor al de Chi cuadrada
crtica se dice que no se rechaza al Ho y, por
tanto, se concluye que la Fo es semejante a la Fe.
En otras palabras, se dice que ambas
distribuciones se ajustan bien; de ah el nombre
de la prueba: bondad de ajuste.
Se propone que el nmero de defectos en las
tarjetas de circuito impreso sigue una distribucin
Poisson.
Se rene una muestra aleatoria de 60 tarjetas de
circuito impreso y se observa el nmero de

Prueba para la Bondad de


ajuste
Una moneda fue lanzada al aire 1000 series, de 5 veces cada
serie y se observ el nmero de caras de cada serie. El
nmero de series en los que se presentaron 0, 1, 1, 3, 4 y 5
caras se muestra en la siguiente tabla.

Nmero
de
caras

Nmero de
series
(frecuencia
observada)

38

144

342

287

164

25

Prueba para la Bondad de


ajuste

Prueba para la Bondad de ajuste


Nmero de
defectos
0

Frecuencia
observada

15

3 ms

32

Prueba para la Bondad de


ajuste

Validacin de modelos
Validacin es el proceso de comprobar que los resultados
aportados por el modelo para las variables de salida y de
estado no son muy diferentes a los medidos en la realidad.
Existen diferentes ndices que permiten cuantificar el
grado de ajuste entre los datos medidos y los resultados
del modelo. Coeficiente de determinacin r2, es decir el
cuadrado del Coeficiente de correlacin
El problema estadstico se convierte en que dado un
conjunto de datos hipotticamente relacionados entre s
cmo evidenciar esa relacin?

Desarrollar un modelo que permita ser posible validar con


determinada certeza el valor de una variable dependiente
con respecto a otra relacionada
Y=f(x)

Diagrama de Dispersin
Es la representacin grfica de las observaciones de las
variables aparente o hipotticamente relacionadas, con el
objeto de evidenciar tal relacin.

Por ejemplo

El ajuste de la curva es el procedimiento de hallar una


curva que represente lo ms eficazmente posible la
distribucin de los datos
El objeto es determinar la ecuacin de la curva que
represente la menos desviacin posible del conjunto de
datos considerado.
A estos efectos el procedimiento de mnimos cuadrados,
es la tcnica matemtica de anlisis numrico que
permite encontrar la funcin que mejor se aproxime al
conjunto de datos siguiendo el criterio del menor error
cuadrtico. Se trata de minimizar la suma de los
cuadrados entre los puntos generados por la funcin y
los correspondientes en los datos

Regresin y regresin lineal simple


Se llama Regresin a la media de la distribucin de una variable
(dependiente) con respecto a un valor determinado de otra
(independiente).
Es el proceso de ajustar una recta a un conjunto de datos cuya
dispersin sugiere este tipo de sntesis matemtica.
El modelo puede representarse como:
Donde:
Y= variable dependiente
0=interseccin con el eje de las ordenadas
1=pendiente real de la poblacin
X=la variable independiente
=error aleatorio en Y para la observacin
El mtodo de mnimos cuadrados nos permite determinar, dentro de
estas premisas, la ecuacin bajo el siguiente modelo general:

Las ecuaciones normales de la regresin lineal

Resolviendo el sistema se obtiene

Donde ambas medias son las correspondientes al conjunto de


datos dado.
Si obtenemos la razn de la variacin explicada a la variacin
total podremos calcular el porcentaje de la variacin explicada por
el modelo de regresin y por tanto una medida de cun confiable
es el modelo. Esta medida se define como:

La variacin explicada representa la diferencia entre la media de Y y


Yest;. La variacin no explicada representa la parte de la variacin no
explicada por la regresin y est basada en la diferencia entre el valor
observado Yi y el valor de Yest; el valor predicho por la recta de regresin
para un Xi dado. Es claro que:

Vtotal=Vexp - Vnexp
Vtotal=variacin total
Considerando:
Vexp=Variacin explicada
Vnexp=Variacin no explicada

Expresadas matemticamente con los siguientes


ecuaciones
Variacin total

Variacin no explicada

Variacin explicada

Ejercicio I
A partir de esta
data, se construye
un grfico de
dispersin con el
objeto de
determinar a
grandes rasgos si
su hiptesis es
vlida:

1
2
3
4
5
6
7
8
9
10
11
12

rea de la
Costo
parcela
construcci
(mts)2
n (bs)
500
31,60
700
32,40
1000
41,70
1000
50,20
1200
46,20
2000
58,50
2200
59,30
1500
48,40
3000
63,70
4000
85,30
1200
53,40
1500
54,50

Ejercicio I

El contador de costos de una empresa de


construccin tiene el problema de estimar
los costos de construccin para viviendas
unifamiliares en el prximo ao, para
asignar los posibles precios. Tiene a mano
los registros de todas las viviendas
construidas en el ltimo ao. Por
experiencia supone como razonable la
hiptesis que el costo de la construccin
est relacionado con el tamao de la
parcela: (Y) decide tomar una muestra
aleatoria de 12 casas, segn tabla a

El grfico demuestra que la hiptesis es ms


que razonablemente valida, por lo proceda a
construir una recta de regresin y obtener
as su modelo.

Costo
construcc
in (bs)

X.Y

X2

Y2

1
2
3

rea de
la
parcela
(mts)2
500
700
1.000

31,6
32,4
41,7

15.800
22.680
41.700

998,56
1.049,76
1.738,89

1.000

50,2

50.200

1.200

46,2

55.440

2.000

58,5

117.000

2.200

59,3

130.460

1.500

48,4

72.600

3.000

63,7

191.100

10

4.000

85,3

341.200

250.000
490.000
1.000.00
0
1.000.00
0
1.440.00
0
4.000.00
0
4.840.00
0
2.250.00
0
9.000.00
0
16.000.0

2.520,04
2.134,44
3.422,25
3.516,49
2.342,56
4.057,69
7.276,09

Ya que aplicando esta formula obtenemos


b1

b1=0,90

b0=50.610
Ya aplicada esta formula se
obtiene los siguiente resultados

b1=0,90
b0=50.610

Ya habiendo obtenido b1 y b0 procedemos a buscar a Y


estimada utilizando la siguiente formula
i= b0+ b1* X i

i=50.6+(0.90*500)=500.6
i=50.6+(0.90*700)=680.6
i=50.6+(0.901000)=950.6
i=50.6+(0.90*1000)=950.6
i=50.6+(0.90*1200)=1130.6
i=50.6+(0.90*2000)=1850.6
i=50.6+(0.90*2200)=2030.6
i=50.6+(0.90*1500)=1400.6
i=50.6+(0.90*3000)=2750.6
i=50.6+(0.90*4000)=3650.6
i=50.6+(0.90*1200)=1130.6
i=50.6+(0.90*1500)=1400.6

Aria de la
parcela(mt
s)2

Costo
Construcci
n

2
Y

X.Y

1
2
3
4
5

500
700
1000
1000
1200

31.60
32.4
41.7
50.2
46.2

15.800
22.680
41.700
50.200
55.440

250.000
490.000
1.000.000
1.000.000
1.440.000

998,56 5000.6
1.049,76
680.6
1.738,89
950.6
2.520,04
950.6
2.134,44 1130.6

2000

58.5

117.000

4.000.000

3.422,25

1850.6

2200

59.3

130.460

4.840.000

3.516,49

2030.6

1500

48.4

72.600

2.250.000

2.342,56

1400.6

3000

63.7

191.100

9.000.000

4.057,69

2750.6

10

4000

85.3

341.200

7.276,09

3650.6

11

1200

53.4

64.080

16.000.00
0
1.440.000

2.851,56

1130.6

12

1500

54.5

81.750

2.250.000

2.970,25

1400.6

sumatori
a

19.800

625.2

1.184.0
1

43.960.00
0

34.878,5
8

22927.
2

Yest

Y-Yest

-4969
-648.2
-908.9
-900.4
1084.4
1792.1
1971.3
1352.2
2686.9
3565.3
1077.2
1346.1
-22302

Variacin total

Vtotal = 2305.66

Variacin no
explicada
Ojo: Esta no se hace solo nos piden r2 =
Vexp/Vtotal

Variacin explicada
Vexp = - 30944.63

= r2=

- 30944.63
2305.66

= - 13.42 r2 = - 13.42

Ejercicio II

Se desea estimar los


costos para la
construccin de un
apartamento, para
determinar los
posibles precios,
tomando en cuenta la
relacin costo-tamao
se decide tomar una
muestra aleatoria de 7
expresada segn la
tabla a continuacin

1
2
3
4
5
6
7

rea de
la
terre
no
(mts)
2
2000
1500
4000
3000
5000
2500
4500

Costo
construcci
n (bs)

41.20
45.50
54.10
50,05
63.40
90.40
85.70

Ejercicio II
El

grfico demuestra que la hiptesis


es ms que razonablemente valida,
por lo proceda a construir una recta
de regresin y obtener as su modelo.

Luego

se obtienen los valores de la


tabla de acuerdo a cada uno de ellos

Ejercicio II
rea del
terren
o
(mts)2

Costo
constr
uccin
(bs)

X.Y

X2

Y2

Yest

Y-Yest

2000

41.20

82.400

4.000.00
0

1.697,44 55.4

-14.2

1500

45.50

68.250

2.250.00
0

2.070,25 54.0

-8.5

4000

54.10

216.40
0

16.000.0
00

2.926,81 56.0

-1.9

3000

50.05

150.15
0

9.000.00
0

2.505,00 56.2
25

-6.6

5000

63.40

317.00
0

25.000.0
00

4.019,56 57.8

5.6

2500

90.40

226.00
0

6.250.00
0

8.172,16 55.8

34.6

4500

85.70

385.65

20.250.0

7.344,49 57.4

28.3

Ejercicio II

Ojo: No da el resultado hubo un


error en la media se toma con N=7

Al momento de aplicar la formula se obtiene los siguiente resultados:


b1=0.0008
b0=53.79
Ya habiendo obtenido b1 y b0 procedemos a buscar a Y estimada
utilizando la siguiente formula

Ejercicio II
Ya habiendo obtenido b1 y b0 procedemos a buscar
a Y estimada utilizando la siguiente formula:
i= b0+ b1* X I

i=53.79+(0.0008*2000)=55.4
i=53.79+(0.0008*1500)=54.0
i=53.79+(0.0008*4000)=56.0
i=53.79+(0.0008*3000)=56.2
i=53.79+(0.0008*5000)=57.8
i=53.79+(0.0008*2500)=55.8
i=53.79+(0.0008*4500)=57.4

Ejercicio II
Igualmente puede observarse que en la estimacin la mitad de los datos
calculados estn muy cercanos al dato observado

Datos original

Estimacin

rea de la terreno
(mts)2

Costo construccin
(bs)

Yest

Y-Yest

2000

41.20

55.4

-14.1

1500

45.50

54.0

-8.5

4000

54.10

56.0

-1.9

3000

50.05

56.2

-6.6

5000

63.40

57.8

5.6

2500

90.40

55.8

34.6

4500

85.70

57.4

28.3

Ejercicio II
Vtotal=143013.223

Vnexp=30920.61

Vexp= 90264.91

90264.91
= r2 = 143013.23 =0.631

r2=0.631

Gracias

You might also like