You are on page 1of 14

Problema 2- se desea estimar los gastos en alimentacin de una familia en

base a la informacin que proporcionan las variables regresoras X =ingresos


1

mensuales y X = nmero de miembros de la familia. Para ello se recoge una


2

muestra aleatoria simple de 15 familias cuyos resultados son los de la tabla


adjunta

Gasto Ingreso Tamao Gasto Ingreso Tamao


0 43
'
21'
3 1 29
'
89 '
3
0 31
'
11'
4 0 35
'
24 '
2
0 32
'
09'
5 0 35
'
12 '
4
0 46
'
16'
4 0 78
'
47 '
3
1 25
'
62'
4 0 43
'
35 '
2
0 44
'
23'
3 0 47
'
29 '
3
0 52
'
18'
6 0 38
'
14 '
4

Los datos en forma matricial:

Con estos datos se obtiene


Por tanto

De donde

El modelo de regresin lineal que se obtiene es:

A partir de esta ecuacin se obtienen las predicciones y los residuos asociados


a las observaciones muestrales. Para la primera
observacin se obtiene

Razonando as en todos los puntos muestrales se obtiene

Calculo de scR

Tambin se puede calcular la scR de la siguiente forma


t
= t
Y - XY =
t t
yi2 - 0 y -
i 1 yx -i 1i 2 yx = i 2i

. . .
= 5 7733 -
'
8 070 - 0 149 32 063 - 0 077 28 960
' ' ' ' '

Se calculan los intervalos de confianza de los parmetros del modelo al 90%,


Para la varianza, 2

~ 12
2

5 2253
'

< < 21 0298 '

0 0034 <
' 2
< 0 0138'

La varianza de los estimadores del modelo es

de donde se deduce que

V ar = 0 00816
'
= 0 0903 '

V ar = 0 000099
'
= 0 0099 '

= 0 00040
'
= 0 0201 '

V ar

Intervalo de confianza para 0

. .
t 12 0 0903 <-0 160 -
' '
0 <t 12 0 0903
'

< < 0 001 '

- 0 321
0
'

Intervalo de confianza para 1 (ingreso)


. .
t 12 0 0099 < 0 149 -
' '
1 <t 12 0 0099
'

< < 0 1666 '

0 1314
1
'

Contrate H 0 1 = 0,la variable ingreso no inflye

Intervalo de confianza para 2 (tamao)


. .
t 12 0 0201 < 0 077 -
' '
2 <t 12 0 0201
'

0 0412 < < 0 1128


'
2
'

Contrate H 0 2 = 0,la variable tamao no influye


Tabla Anova,

de donde

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variacin Cuadrados libertad

scE (por el modelo) 1 3595


'
2 e
2 = 0 6797
'

scR (Residual) 0 0721


'
12 R
2 = 0 0060
'

scG (Global) 1 4316


'
14 y
2 = 0 1023
'

Con estos datos se obtiene el siguiente contraste conjunto de la F

El contraste conjunto de la F indica claramente la influencia del modelo en la


variable respuesta. Por tanto, de los contrastes individuales y del conjunto se
deduce la influencia de cada una de las dos variables regresoras y la influencia
conjunta del modelo.

Ahora se calcula el contraste individual de la F respecto a la variable x =tamao,


2

contraste que es equivalente al contraste individual de la t. Para ello, se obtiene


la regresin de la variable gasto respecto a la variable ingreso,
la tabla ANOVA de este modelo es

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variacin Cuadrados libertad

scE (ingreso) 1 2716


'
1 e
2 = 1 2716
'

scR (Residual) 0 1600


'
13 R
2 = 0 0123
'

scG (Global) 1 4316


'
14 y
2 = 0 1022
'

La variabilidad incremental debida a la variable dimetro es

Este valor indica lo que aumenta la variabilidad explicada por el modelo al


introducir la variable tamao.

Para contrastar la influencia o no de esta variable se utiliza el estadstico

Que da el mismo p-valor que en el contraste individual de la t (hay pequeas


diferencias por los redondeos).

Clculo de los coeficientes de correlacin:

El coeficiente de determinacin,

El coeficiente de correlacin mltiple

El coeficiente de determinacin corregido por el nmero de grados de libertad.

El coeficiente de correlacin simple entre las variables gasto e ingreso,


Este coeficiente es una medida de la relacin lineal existente entre los variables
gasto e ingreso. Tambin se puede calcular a partir del coeficiente de
determinacin de la siguiente regresin

La tabla ANOVA del modelo es

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variacin Cuadrados libertad

scE (ingreso) 1 2716


'
1 e
2 = 1 2716
'

scR (Residual) 0 1600


'
13 R
2 = 0 0123
'

scG (Global) 1 4316


'
14 y
2 = 0 1022
'

Anlogamente, el coeficiente de correlacin simple entre las variables gasto y


tamao es,

Coeficiente de correlacin parcial entre las variables gasto e ingreso.

r2

= =

= 0 9496
'

r = 0 974.
'

Estimacin de la media condicionada.

Estimar el gasto medio en alimentacin de una familia con unos ingresos de x = 1

3 0 y un tamao de x = 4. Esto es
'
2 .

Aplicando el modelo de regresin


Se calcula el valor de influencia asociado al dato h = =

hh
= h
t -1
h

= = 0 07649
'

n = h = 13 073'

La varianza del estimador es

Y un intervalo de confianza para m al 90% es


h

Prediccin de una observacin.

La familia que tiene unos ingresos de x = 3 0 y un tamao de x = 4. Esto


1
'
2

es qu gasto en alimentacin tendr?.

Aplicando el modelo de regresin estimado

La varianza de la prediccin es

.
V ar = R
2 = 0 0060
'
= 0 0065
'

= 0 0803
'

Y un intervalo de prdiccin al 90% es

Grficos
Grficos de residuos,
EJERCICIO 3- desarrollaremos un pronstico a travs de una regresin lineal
mltiple que en trminos generales se puede representar
por donde es la variable
dependiente, las variables independientes y
los coeficientes de la regresin. En particular consideraremos en el siguiente
ejemplo una variable dependiente (Ganancias en Millones de $) y 2 variables
explicativas o independientes (Nmero de Vendedores y Precio del Producto $), es
decir, , donde es el N de Vendedores y el Precio del
Producto ($). La informacin se presenta en la tabla a continuacin:
POROBLEMA 4

La siguiente tabla presenta el rendimiento de gasolina por milla en 25 automviles


Indice Automovil y x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1 Apollo 18,9 350 165 260 8 2,56 4 3 200,3 69,9 3910
2 Nova 20 250 105 185 8,25 2,73 1 3 196,7 72,2 3510
3 Monarch 18,25 351 143 255 8 3 2 3 199,9 74 3890
4 Duster 20,07 225 95 170 8,4 2,76 1 3 194,1 71,8 3365
5 Jenson 11,2 440 215 330 8,2 2,88 4 3 184,5 69 4215
6 Skyhawk 22,12 231 110 175 8 2,56 2 3 179,3 65,4 3020
7 Scirocco 34,7 89,7 70 81 8,2 3,9 2 4 155,7 64 1905
8 CorollaS 30,4 96,9 75 83 9 4,3 2 5 165,2 65 2320
9 Camaro 16,5 350 155 250 8,5 3,08 4 3 195,4 74,4 3885
10 Datsun 36,5 85,3 80 83 8,5 3,89 2 4 160,6 62,2 2009
11 Capri 21,5 171 109 146 8,2 3,22 2 4 170,4 66,9 2655
12 Pacer 19,7 258 110 195 8 3,08 1 3 171,5 77 3375
13 Granada 17,8 302 129 220 8 3 2 3 199,9 74 3890
14 ElDorado 14,39 500 190 360 8,5 2,73 4 3 224,1 79,8 5290
15 Imperial 14,89 440 215 330 8,2 2,71 4 3 231 79,7 5185
16 NovaLN 17,8 350 155 250 8,5 3,08 4 3 196,7 72,2 3910
17 Starfire 23,54 231 110 175 8 2,56 2 3 179,3 65,4 3050
18 Cordoba 21,47 360 180 290 8,4 2,45 2 3 214,2 76,3 4250
19 TransAM 16,59 400 185 205 7,6 3,08 4 3 196 73 3850
20 CorollaE 31,9 96,9 75 83 9 4,3 2 5 165,2 61,8 2275
21 MarkIV 13,27 460 223 366 8 3 4 3 228 79,8 5430
22 CelicaGT 23,9 133,6 96 120 8,4 3,91 2 5 171,5 63,4 2535
23 ChargerS 19,73 318 140 255 8,5 2,71 2 3 215,3 76,3 4370
24 Cougar 13,9 351 148 243 8 3,25 2 3 215,5 78,5 4540
25 Corvette 16,5 350 165 255 8,5 2,73 4 3 185,2 69 3660

Donde
Y=Millas/galn
X1: Cilindraje (pulgadas cubicas) X8: Longitud total
(pulgadas)
X2: Caballos de fuerza (pie-lb) X9: Ancho (pulgadas)
X3: Torca (pie-lb) X10: Peso (lb)
X4: Razn de Compresin
X5: Razn del eje trasero
X6: Carburador (gargantas)
X7: Nm. de velocidad de transmisin

Coeficientesa

Coeficientes

Coeficientes no estandarizados tipificados

Modelo B Error tp. Beta t Sig.

1 (Constante) -17,315 30,977 -,559 ,585

x1 -,050 ,035 -,935 -1,412 ,180

x2 ,028 ,066 ,196 ,422 ,680

x3 ,056 ,051 ,727 1,089 ,295

x4 1,607 2,977 ,079 ,540 ,598

x5 4,979 3,447 ,411 1,445 ,171

x6 ,498 1,334 ,085 ,374 ,714

x7 -3,301 2,897 -,352 -1,139 ,274

x8 ,285 ,143 ,938 1,987 ,067

x9 ,095 ,366 ,084 ,260 ,798

x10 -,012 ,007 -1,818 -1,739 ,104


Coeficientesa

Coeficientes

Coeficientes no estandarizados tipificados

Modelo B Error tp. Beta t Sig.

1 (Constante) -17,315 30,977 -,559 ,585

x1 -,050 ,035 -,935 -1,412 ,180

x2 ,028 ,066 ,196 ,422 ,680

x3 ,056 ,051 ,727 1,089 ,295

x4 1,607 2,977 ,079 ,540 ,598

x5 4,979 3,447 ,411 1,445 ,171

x6 ,498 1,334 ,085 ,374 ,714

x7 -3,301 2,897 -,352 -1,139 ,274

x8 ,285 ,143 ,938 1,987 ,067

x9 ,095 ,366 ,084 ,260 ,798

x10 -,012 ,007 -1,818 -1,739 ,104

a. Variable dependiente: y

El modelo es el siguiente
Y=-17,315 - 0,05X1 + 0,028X2 +0,056X3 + 1,607X4 + 4,979X5 + 0,498X6 -
3,301X7+0,285X8 + 0,095X9 - 0,012X10
Donde
Y=Millas/galn
X1: Cilindraje (pulgadas cubicas) X8: Longitud total
(pulgadas)
X2: Caballos de fuerza (pie-lb) X9: Ancho (pulgadas)
X3: Torca (pie-lb) X10: Peso (lb)
X4: Razn de Compresin
X5: Razn del eje trasero
X6: Carburador (gargantas)
X7: Nm. de velocidad de transmisin
Minitab nos muestra los siguientes grficos de residuales

Residual Plots for C2


Normal Probability Plot Versus Fits
99
4
90
2

Residual
Percent

50
0

10 -2

1 -4
-5,0 -2,5 0,0 2,5 5,0 10 15 20 25 30
Residual Fitted Value

Histogram Versus Order


4,8 4

3,6 2
Frequency

Residual

2,4 0

1,2 -2

0,0 -4
-4 -2 0 2 4 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order

De acuerdo a la grfica de probabilidad normal podramos decir que

Los residuales siguen una distribucin normal. Lo cual se comprueba con la


prueba de Kolgomorov smirnov contrastando la hiptesis nula de que los
residuales se distribuyen normalmente dado que el p valu 0,867 es mayor que
0,05.

No est muy clara la homocedasticidad de los residuales en el grafico 2.

Se observa en la cuarta grafica que los puntos estn dispersos de manera


aleatoria y que no hay presencia de rachas con lo que se podra decir que son
independientes.

You might also like