You are on page 1of 11

3.

REGRESION SIMPLE

Los diseadores de mochilas usan materiales exticos como supe nailon Derlin, polietileno de alta
densidad, aluminio para aviones o espumas termo-moldeadas para hacer que las mochilas sean
ms confortables y que el peso se distribuya uniformemente eliminndose as los puntos de mayor
presin. En los datos siguientes se proporciona capacidad (en pulgadas cbicas), evaluacin del
confort, y precio de 10 mochilas probadas por Outside Magazine. El confort est medido con una
escala del 1 al 5, en la que 1 denota un confort mnimo y 5 un confort excelente. (Outside Buyers
Guide, 2001).

Fabricante y modelo Capacidad Confort Precio


(3 )
Camp Trails Paragon II 4330 2 $190
EMS 5500 5500 3 $219
Lowe Alpomayo 90+20 5500 4 $249
Marmot Muir 4700 3 $249
Kelly Bigfoot 5200 5200 4 $250
Gregory Whitney 5500 4 $340
Osprey 75 4700 4 $389
Arc Terys Bora 95 5500 5 $395
Dana Design Terraplane LTW 5800 5 $439
The Works @ Mystery Ranch Jazz 5000 5 $525

a) Elabore un diagrama de dispersin para un modelo de regresin lineal simple y explique la


relacin

Diagrama de dispersin para la capacidad y el precio

Grfica de lnea ajustada


Precio = 8,9 + 0,06101 Capacidad
$550,00 S 112,567
R-cuad. 6,9%
$500,00 R-cuad.(ajustado) 0,0%

$450,00

$400,00
Precio

$350,00

$300,00

$250,00

$200,00

4500 5000 5500 6000


Capacidad
En el diagrama se observa una regresin lineal positiva entre la capacidad en 3 y el precio de
las mochilas.

Diagrama de dispersin para el confort y el precio

En el diagrama se observa una regresin lineal positiva entre el confort y el precio de las mochilas.

b) Obtener una ecuacin estimada de regresin lineal simple.

Anlisis de regresin: Precio vs. Capacidad


La ecuacin de regresin es
Precio = 8,9 + 0,06101 Capacidad

Anlisis de regresin: Precio vs. Confort


La ecuacin de regresin es
Precio = - 41,62 + 93,88 Confort

c) Interprete los estimadores bo y b1 y su pendiente

Capacidad vs Precio

Bo= origen de la recta de regresin = 8.9

B1= pendiente de la recta de regresin = 0.06101

El precio aumenta en $0,06101 por cada 3


Confort vs Precio

Bo= origen de la recta de regresin = -41.62

B1= pendiente de la lnea de regresin = 93.88

El precio aumenta $ 93,88 por cada punto de confort

d) Determine las pruebas de hiptesis sobre la significancia del modelo. Utilice un nivel de
significancia del 5%.

Prueba t de significancia

Ho: 1=0

H1: 10
R.D. rechazar Ho si valor-p 0.05

Coeficientes
EE del
Trmino Coef Coef. Valor T Valor p FIV
Constante 9 412 0,02 0,983
Capacidad 0,0610 0,0794 0,77 0,464 1,00

Como valor-p= 0.983 >0,05 No se rechaza Ho.


A un nivel de significancia del 5% se observa que No hay evidencia significativa para
concluir que existe una relacin significante entre la capacidad y el precio.
9
Valor del estadstico T = 412 = 0,02

Prueba F de significancia

Ho: 1=0

H1: 10

R.D. rechazar Ho si valor-p 0.05

Anlisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 7481 7481 0,59 0,464
Capacidad 1 7481 7481 0,59 0,464
Error 8 101371 12671
Falta de ajuste 4 71786 17947 2,43 0,206
Error puro 4 29585 7396
Total 9 108853

GL: Grados de libertad


SC: Suma de cuadrados
MC: Cuadrado de medio

Como valor-p>0,05 No se rechaza Ho.


A un nivel de significancia del 5% se observa que No hay evidencia significativa para
concluir que existe una relacin significante entre la capacidad y el precio.

e) Proporciona la ecuacin de regresin estimada un buen ajuste? Explique

R-cuad. = 6.9% = R

Se concluye que el 6.9% de la variabilidad del precio se explica por la relacin lineal que
existe entre la capacidad y el precio de las mochilas. El modelo presenta un mal ajuste.

f) Validar las suposiciones del modelo de regresin mediante un anlisis residual en cuanto a
Linealidad, Homocedasticidad, Independencia, Normalidad. Presente las grficas y cuadros con
su respectivo anlisis.
1. Validacin de la normalidad de los errores

H0: Los datos analizados siguen una distribucin normal


H1: Los datos analizados no siguen una distribucin normal
Si valor-p Aceptar H0
Si valor-p < Rechazar H0

Como valor p>0.150 no se rechaza Ho, por lo tanto se puede afirmar que los errores provienen
de una distribucin normal

2. Validacion de otros supuestos


Linealidad

Existe linealidad si se presenta una relacin significativa entre la variable que se quiere predecir
y las otras variables. Puede usarse el coeficiente "R cuadrado ajustado", para saber si existe
linealidad (mayor o igual a 0.7 suele ser "indicio" de linealidad)

R-cuad. = 6.9% = R

Como R. cuad <0.7 se determina que no existe linealidad entre el confort y el precio de las
mochilas

Homocedasticidad

Hiptesis nula: Todas las varianzas son iguales

Hiptesis alterna: Por lo menos una varianza es diferente

Pruebas
Estadstica
Mtodo de prueba Valor p
Comparaciones mltiples 0,731
Levene 0,03 0,878

Como valor-p>0.05 No hay evidencia significativa para rechazar la hiptesis nula

Independencia

La independencia entre los residuos mediante el estadstico de Durbin-Watson que toma valor 2

cuando los residuos son completamente independientes (entre 1.5 y 2.5 se considera que

existe independencia), DW<2 indica auto correlacin positiva y DW>2 auto correlacin

negativa.

Estadstico de Durbin-Watson
Estadstico de Durbin-Watson = 0,407655

Dado que el estadstico DW < 2 se dice que hay una auto correlacin positiva

a. Elabore un diagrama de dispersin para un modelo de regresin lineal simple y explique la


relacin (Confort Vs Precio)

a) Obtener una ecuacin estimada de regresin lineal simple.

b) Interprete los estimadores bo y b1 y su pendiente

c) Determine las pruebas de hiptesis sobre la significancia del modelo. Utilice un nivel de
significancia del 5%.

Prueba t de significancia

Ho: 1=0
H1: 10
R.D. rechazar Ho si valor-p 0.05

Coeficientes
EE del
Trmino Coef Coef. Valor T Valor p FIV
Constante -41,6 82,9 -0,50 0,629
Confort 93,9 20,7 4,54 0,002 1,00

Como valor-p<0,05 se rechaza Ho.

A un nivel de significancia del 5% se observa que hay evidencia significativa para concluir que
existe una relacin significante entre el confort y el precio.
41.6
Valor del estadstico T = 82.9
= -0.50

Prueba F de significancia

Ho: 1=0

H1: 10

R.D. rechazar Ho si valor-p 0.05

Anlisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 78434 78434 20,63 0,002
Confort 1 78434 78434 20,63 0,002
Error 8 30419 3802
Falta de ajuste 2 6799 3399 0,86 0,468
Error puro 6 23620 3937
Total 9 108852
GL: Grados de libertad
SC: Suma de cuadrados
MC: Cuadrado de medio

Como valor-p<0,05 se rechaza Ho.


A un nivel de significancia del 5% se observa que hay evidencia significativa para concluir
que existe una relacin significante entre el confort y el precio.

d) Proporciona la ecuacin de regresin estimada un buen ajuste? Explique

R-cuad. = 72.1% = R

Se concluye que el 72.1% de la variabilidad del precio se explica por la relacin lineal que
existe entre el confort y el precio de las mochilas. El modelo presenta un buen ajuste.

e) Validar las suposiciones del modelo de regresin mediante un anlisis residual en cuanto a
Linealidad, Homocedasticidad, Independencia, Normalidad. Presente las grficas y cuadros
con su respectivo anlisis.

1. Validacin de la normalidad de los errores

H0: Los datos analizados siguen una distribucin normal


H1: Los datos analizados no siguen una distribucin normal
Si valor-p Aceptar H0
Si valor-p < Rechazar H0

Como valor p>0.150 no se rechaza Ho, por lo tanto se puede afirmar que los errores
provienen de una distribucin normal

Linealidad

Existe linealidad si se presenta una relacin significativa entre la variable que se quiere predecir
y las otras variables. Puede usarse el coeficiente "R cuadrado ajustado", para saber si existe
linealidad (mayor o igual a 0.7 suele ser "indicio" de linealidad)

R-cuad. = 72.1% = R

Como R. cuad > 0.7 existe linealidad entre el confort y el precio de las mochilas

Homocedasticidad

Mtodo
Hiptesis nula Todas las varianzas son iguales
Hiptesis alterna Por lo menos una varianza es diferente
Nivel de significancia = 0,05

Pruebas
Estadstica
Mtodo de prueba Valor p
Comparaciones mltiples 0,508
Levene 1,32 0,335

Como valor-p>0.05 No hay evidencia significativa para rechazar la hiptesis nula

Independencia

La independencia entre los residuos mediante el estadstico de Durbin-Watson que toma valor 2

cuando los residuos son completamente independientes (entre 1.5 y 2.5 se considera que

existe independencia), DW<2 indica auto correlacin positiva y DW>2 auto correlacin

negativa

Estadstico de Durbin-Watson
Estadstico de Durbin-Watson = 1,75166
Dado que el estadstico DW < 2 se dice que hay una auto correlacin positiva

You might also like