You are on page 1of 12

Regresion Lineal

Curso: Introduccin a la Regresin Lineal


TAREA SOBRE REGRESION LINEAL
Regresion Lineal
Se tiene la siguiente tabla con datos de los equipos de bisbol de Los Estados Unidos.
Las variables Valor y Utilidad estn correlacionadas!Es el "odelo de regresin lineal
# $ y x = + +
el "s adecuado para este con%unto de datos! &o"probar los
supuestos del "odelo.
Equipo Valor(x) Ingresos Utilidad(y)
New York Yankees 730 215 18,7
New York Mets 482 169 14,3
Los Angeles Dodgers 435 143 -29,6
oston !ed "o# 426 152 -11,4
Atlanta ra$es 424 160 9,5
"eattle Mar%ners 373 166 14,1
&le$eland 'nd%ans 360 150 -3,6
(e#as !angers 356 134 -6,5
"an )ran*%s*o +%ants 355 142 16,8
&olorado !o*k%es 347 129 6,7
,o-ston Astros 337 125 4,1
alt%.ore /r%oles 319 133 3,2
&0%*ago &-1s 287 131 7,9
Ar%2ona D%a.ond1a*ks 280 127 -3,9
"t3 Lo-s% &ard%nals 271 123 -5,1
Detro%t (%gers 262 114 12,3
4%tts1-rg0 4%rates 242 108 9,5
M%lwa-kee rewers 238 108 18,8
40%ladel50%a 40%ll%es 231 94 2,6
&0%*ago 60%te "o# 223 101 -3,8
"and D%ego 4adres 207 92 5,7
&%n*%nnat% !eds 204 87 4,3
Ana0e%. Angels 195 103 5,7
(oronto l-e 7a8s 182 91 -20,6
/akland At0let%*s 157 90 6,8
9ansas &%t8 !o8als 152 85 2,2
(a.5a a8 De$%l !a8s 142 92 -6,1
)lor%da Marl%ns 137 81 1,4
M%nnesota (w%ns 127 75 3,6
Montreal :#5os 108 63 -3,4
'abla $
Supuestos del "odelo:
$. La relacin entre la respuesta ( y los regresores ) es lineal* al "enos en +or"a
apro,i"ada
-. El tr"ino de error

tiene "edia cero.


.. El tr"ino de error

tiene varian/a
-
es constante.
0. Los errores no estn correlacionados.
1. Los errores tienen distribucin nor"al
Respuesta:
Regresion Lineal
Anlisis Exploratorio:
Se Ingresan los datos a E,cel y se e+ect2a un anlisis de regresin del cual se obtienen
los siguientes datos:
Estadsticas de la regresin
&oe;%*%ente de *orrela*%<n .=lt%5le 0,28
&oe;%*%ente de deter.%na*%<n !>2 0,08
!>2 a?-stado 0,04
:rror t@5%*o 10,70
/1ser$a*%ones 30,00
'abla -
ANAL'"'" D: BA!'ANCA

Grados de
libertad
Suma de
cuadrados
Promedio de
los cuadrados
F
Valor crtico
de F
!egres%<n 1,00 282,93 282,93 2,47 0,13
!es%d-os 29,00 3318,23 114,42
(otal 30,00 3601,16
'abla .
Coef.
Error
tpico
t Probabilidad
Inferior
95%
Superior
95%
Inferior
95,0%
Superior
95,0%
'nter*e5*%<n 0 DNEA DNEA DNEA DNEA DNEA DNEA DNEA
Bal-e 0,01 0,01 1,57 0,13 0,00 0,02 0,00 0,02
'abla 0
AnFl%s%s de los res%d-ales
!es-ltados de
datos de
5ro1a1%l%dad
Observacin
Pronstico
Utilidad
Residuos
Residuos
estndares
Percentil Utilidad
1 7,13 11,57 1,10 1,66667 -29,6
2 4,71 9,59 0,91 5 -20,6
3 4,25 -33,85 -3,22 8,33333 -11,4
4 4,16 -15,56 -1,48 11,6667 -6,5
5 4,14 5,36 0,51 15 -6,1
6 3,64 10,46 0,99 18,3333 -5,1
7 3,52 -7,12 -0,68 21,6667 -3,9
8 3,48 -9,98 -0,95 25 -3,8
9 3,47 13,33 1,27 28,3333 -3,6
10 3,39 3,31 0,31 31,6667 -3,4
11 3,29 0,81 0,08 35 1,4
12 3,12 0,08 0,01 38,3333 2,2
13 2,80 5,10 0,48 41,6667 2,6
14 2,74 -6,64 -0,63 45 3,2
15 2,65 -7,75 -0,74 48,3333 3,6
16 2,56 9,74 0,93 51,6667 4,1
17 2,36 7,14 0,68 55 4,3
18 2,33 16,47 1,57 58,3333 5,7
19 2,26 0,34 0,03 61,6667 5,7
Regresion Lineal
20 2,18 -5,98 -0,57 65 6,7
21 2,02 3,68 0,35 68,3333 6,8
22 1,99 2,31 0,22 71,6667 7,9
23 1,91 3,79 0,36 75 9,5
24 1,78 -22,38 -2,13 78,3333 9,5
25 1,53 5,27 0,50 81,6667 12,3
26 1,49 0,71 0,07 85 14,1
27 1,39 -7,49 -0,71 88,3333 14,3
28 1,34 0,06 0,01 91,6667 16,8
29 1,24 2,36 0,22 95 18,7
30 1,06 -4,46 -0,42 98,3333 18,8
Promedio -0,32 -0,03
'abla 1
3ig. $
3ig. -
Regresion Lineal
3ig ..
3ig. 0
Regresion Lineal

Grfco de probabilidad normal
-40
-20
0
20
40
0 20 40 60 80 100 120
Muestra percentil
I
n
c
o
m
e
3ig. 1
3ig. 4
Regresion Lineal
30 20 10 0 -10 -20 -30 -40
99
95
90
80
70
60
50
40
30
20
10
5
1
Residuo
P
o
r
c
e
n
t
a
j
e
Grfica de probabilidad normal
(la respuesta es Income)
3ig. 5
10 0 -10 -20 -30
9
8
7
6
5
4
3
2
1
0
Residuo
F
r
e
c
u
e
n
c
i
a
Histograma
(la respuesta es Income)
3ig. 6
Regresion Lineal
3ig. 7
3ig. $#
3ig. $$
Regresion Lineal
3ig. $-
3ig. $.
3ig. $0
Regresion Lineal
Resultados del anlisis:
13 E,iste cierta correlacin entre las variables Valor y Utilidad. Su correlacin es
positiva pero la relacin en dbil.
23 &oe+iciente de deter"inacin R8- 9o R a%ustado: es bastante peque;a con
respecto a $.
33 Es un "odelo que no se e,plica* lo que produce "uc<a incertidu"bre en su
eleccin.
43 En la tabla .* el valor cr=tico 3 es de 0,13 es .a8or del 5G de s%gn%;%*an*%a, 5or lo
H-e no se re*0a2a la 0%5<tes%s n-la de H-e el *oe;%*%ente $ # = 3
53 Se encuentran grandes di+erencias * co"o por e%e"plo* el caso de M%lwa-kee
rewers 8 New York YankeesI
Equipo Valor(x) Ingresos Utilidad(y)
M%lwa-kee rewers 238 108 18,8
New York Yankees 730 215 18,7
'abla 4
En donde* a"bos obtienen una utilidad si"ilar* pero al di+erencia entre el valor
de cada equipo es "uy grande.
63 Las 3ig. $* - * .* 5 y 6 "uestran que los errores siguen una distribucin >or"al.
La 3ig. 1 "uestra una tendencia a la nor"alidad con respecto a la utilidad
73 La tabla 1 "uestra que el pro"edio de los errores tienden a cero.
83 Las 3ig. 0 y 1 nos indican que a "edida que van creciendo los valores de los
datos de la variable Valor del Equipo los errores tienden a au"entar*
indicndonos que nos e,iste una varian/a constantes* siendo <eterognea.
93 Las 3ig. $# y $$ nos "uestran la dispersin de los errores vs. los valores
pronosticados* tienen una variabilidad "ayor a "edida que au"entan los valores
de la variable regresora.
103 Las 3ig. $- y $. relacionan los valores pronosticados y los errores* a los cuales
se le <an aplicado una prueba de Levene* en donde el p?valor es "enor que el
1@ esti"ado para el nivel de signi+icancia* rec<a/ando la <iptesis nula de que
las varian/as son constantes.
113 La 3ig. $0 "uestra una relacin entre los errores y los errores estandari/ados*
del cual no se esperan tendencias para una varian/a constante* y el gr+ico
"uestra lo contrario.
Regresion Lineal
Estudio de Valores atpicosOutliers!
En la 3ig. $0* observa"os que el rango A?- puede ser considerado co"o outliers* los
cuales corresponden a:
Equipo Valor(x) Ingresos Utilidad(y)
Los Angeles
Dodgers 435 143 -29,6
(oronto l-e 7a8s 182 91 -20,6
'abla 5
>tese que estos puntos son los que se encuentran en el e,tre"o i/quierdo de la 3ig.
1* que ta"bin ro"pen con la linealidad en la relacin de nor"alidad entre las
variables de este gr+ico.
Bl eli"inar estos datos de la 'abla $* se observa que la correlacin de las variables
"e%ora* pasando de un #*-6 9tabla -: a un #*15
'abla 6
En la 3ig. $1* ta"bin observa"os* que el punto e,tre"o de la i/quierda provoca que se
ro"pa la nor"alidad de los datos.
3ig. $1
este punto corresponde a
Regresion Lineal
Equipo Valor(x) Ingresos Utilidad(y)
oston !ed "o# 426 152 -11,4
Si eli"ina"os ta"bin este registro de la tabla $* obtene"os los siguientes resultados:
3ig. $4
&on lo cual el coe+iciente de correlacin de las variables "e%ora* pasando de un #*-6
9tabla -: a un #*46* considerndose "oderada* aunque no e,celente. Cor otro lado* se
observa que la tendencia en la 3ig. $5* es si"ilar a la de la 3ig. $0.
3ig. $5
La 3ig. $6* sin e"bargo* nos "uestra que el valor cr=tico para 3 es "enor del 1@* por lo
que este ca"bio* aunque "e%ora la correlacin* no <ace que la varian/a sea constante.
3ig. $6
&on la in+or"acin su"inistrada* <asta el "o"ento* se concluye que el "odelo lineal
de regresin no se a%usta a los datos su"inistrados porque nose est cu"pliendo con los
supuestos que lo sustentan.

You might also like