Professional Documents
Culture Documents
Y = f(X)
Como Y depende de X,
Y: Es la variable dependiente, y
X: Es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable dependiente
y cul es la variable independiente.
La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama
REGRESANDO VARIABLE DE RESPUESTA.
La variable Independiente X se le denomina VARIABLE EXPLICATIVA REGRESOR y se le
utiliza para EXPLICAR a Y.
Ing. Wilmer J. Bermdez Pino
Variable independiente
variable explicativa
Predicha
Predictora
Regresada
Regresora
Respuesta
Estmulo
Endgena
Exgena
Resultado
Covariante
Variable controlada
Variable control
Datos. Las variables dependientes e independientes deben ser cuantitativas. Las variables
categricas, como la religin, estudios principales o el lugar de residencia, han de
decodificarse como variables binarias (dummy) o como otros tipos de variables de
contraste.
Los supuestos para el modelo de regresin lineal simple son:
a) Igualdad de varianzas (homoscedasticidad).
Para cada valor xi de la variable independiente X, la distribucin de la variable
aleatoria dependiente Yi tiene media
, y varianza
. Se supone que cada una
de estas varianzas son iguales a la varianza comn , denominado varianza de la
regresin. Es decir las distribuciones de Yi tienen medias diferentes, pero tienen la
misma varianza .
b) Independencia
Se supone que las Yi son variables aleatorias estadsticamente independientes.
c) Linealidad.
Se supone que la relacin de Y con X es lineal, es decir todas las medias
deben
estar en una lnea recta denominada lnea de regresin poblacional, cuya ecuacin es:
(Y/Xi) =
son
1. Diagrama de dispersin: grfica que describe la relacin entre las dos variables de
inters.
Variable dependiente: la variable que se pronostica o estima.
Variable independiente: la variable que proporciona la base para la estimacin. Es la
variable predictora.
2. Modelo de regresin lineal simple
Propsito: determinar la ecuacin de regresin; se usa para predecir el valor de la
variable dependiente (Y) basado en la variable independiente (X). El modelo es:
=
+
+
Donde:
b1 =
xy
x
x y
n
( x ) 2
Suma de productos XY
SP. XY
=
SC . X
suma de cuadrados de X
n
b0 =
y b x
1
: Nivel de significacin
(
) =
SCT
SCE
) +
+
SCR
Grficamente.
SCT = y
2
SCR = 1 (
( y ) 2
n
x y )
xy
n
SCR = ( x
2
1
( x ) 2
n
Fuente de
variacin
Debido a la regresin
Debido al error
Total
Suma de
cuadrados
SCR
Grados de
libertad
P-1
Cuadrados
medios
CMR=SCR/1
SCE
n-P
CME=SCE/(n-2)
SCT
n-1
F calculado
(Fc)
CMR/CME
(Y Y )
n2
b 0 y b1 xy
n2
S y.x =
SCE
= CME
n2
CME
SCX
( x 2 ) CME
Var ( b 0 ) =
CME
SCX
s b1 =
nSCX
s b1 =
( x 2 ) CME
nSCX
b 0 t n 2 ; s b 0
b 1 t n 2 ; s b 1
0
1
b 0 + t n 2 ; s b 0
b 1 + t n 2 ; s b 1
H 0 : 0 = 0
H1 : 0 0
Nivel de significac in :
b0
t n 2;
s b0
Estadistic a de prueba : t c =
PARA
si t c t n 2;
si t c +t n 2;
Hiptesis
H 0 : 1 = 0
H 1 : 1 0
Nivel de significac in :
Estadistic a de prueba : t c =
b1
t n 2;
sb1
si t c +t n 2;
5. Anlisis de correlacin
Correlacin cero
Frmula para r
r=
x y
xy n
( x )
( y )
( x
)( y
n
n
2
r=
SCR
SCE
= 1
SCT
SCT
r n2
t n 2;
1 r2
Decisn : Re chazar H 0 si t c t n 2; prueba bilateral
si t c t n 2;
si t c +t n 2;
6. Prediccin.
y t
n2;1
1 ( X X )2
1 ( X X )2
CME( +
Y y + t
CME( +
n2;1
n
SCX
n
SCX
2
y t
n2;1
1 ( X X )2
1 ( X X )2
CME(1 + +
Y y + t
+
CME(1 +
n2;1
n
SCX
n
SCX
2
10
t = 1.9055,
Se rechaza H0 si t > 3.143 o si t< -3.143, gl = 6, =0.02. No se rechaza H0
v) Use la informacin del primer ejemplo: calcule el error estndar de la estimacin:
11
160
140
120
100
80
60
40
20
0
0
50
100
150
200
250
300
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0.98084737
Coeficiente de determinacin R^2
0.96206156
R^2 ajustado
0.95731926
Error tpico
6.49300323
Observaciones
10
ANLISIS DE VARIANZA
Fuente de
Grados de
Suma de
Cuadrados Medios
F
Valor crtico de F
variacin
libertad
cuadrados
Regresin
1
8552.72727
8552.72727
202.867925
5.7527E-07
Residuos
8
337.272727
42.1590909
Total
9
8890
Modelo de regresin lineal
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 24.4545455 6.4138173 3.81279109 0.00514217
Variable X 1 0.50909091 0.03574281 14.2431712 5.7527E-07
Ing. Wilmer J. Bermdez Pino
12
Residuos
4.81818182
-10.3636364
4.45454545
-0.72727273
4.09090909
-1.09090909
-6.27272727
3.54545455
8.36363636
-6.81818182
Y(Peso
medio %)
X2
Y2
XY
100
10000
92
8464
184
95
16
9025
380
90
64
8100
720
12
98
144
9604
1176
16
85
256
7225
1360
30
67
900
4489
2010
SUMA
72
627
1384
56907
5830
REGRESIN LINEAL:
1 =
XY
X
X Y
n
( X )2
7
1 = -0.9622557
72 627
7
=
(72)2
1384
7
5830
13
Y X = 627 ( 0.96225577) 72
0 = 99.4689165
n
Ecuacin
Y = 0 + 1 X Y = 99.4689165 - 0.96225577 X
Comportamiento:
CORRELACIN:
XY
( X )
X2
X Y
Y 2 ( Y )
n
72 627
7
=
2
1384
7
7
5830
= -0.8938290 5
Coeficiente de determinacin:
Nota
2 = (- 0.89382905 )2 2 = 0.79893037
:
El 80% de Y depende de X
ANLISIS DE VARIANZA:
(Y )
= Y
n
SCTOTAL
SC REGRESIN
627 2
= 56907
= 745.714286
7
( X )2
72 2
2
= 1 X
= -0.9622557 71384
n
7
= -619.14285 7
14
S.C.
G.L.
C.M.
Regresin
619.14
619.14
Error
126.57
745.714
2
25.31
TOTAL
F.C.
24.4582
Sig.
**
124.28
22
20.8
484
432.64
457.6
22
22.3
484
497.29
490.6
24
24.1
576
580.81
578.4
24
25.6
576
655.36
614.4
26
25.7
676
660.49
668.2
26
27.2
676
739.84
707.2
28
27.3
784
745.29
764.4
28
28.8
784
829.44
806.4
30
29.4
900
864.36
882
15
30
31.9
900
1017.61
957
11
32
32.4
1024
1049.76 1036.8
12
32
33.8
1024
1142.44 1081.6
13
34
32.8
1156
1075.84 1115.2
14
34
34.1
1156
1162.81 1159.4
15
36
32.4
1296
1049.76 1166.4
16
36
37.9
1296
1436.41 1364.4
17
38
38
1444
1444
1444
18
38
36.5
1444
1332.25
1387
19
40
39
1600
1521
1560
20
40
41
1600
1681
1640
SUMA
620
621
19880
19918.4
19881
REGRESIN LINEAL:
1 =
XY
X
X Y
n
( X )2
1 = 0.95454545
0 =
620 621
20
=
2
(
620)
19880
20
19881
0 = 1.45909091
Ecuacin
n
20
20
Y = 0 + 1 X Y = 1.45909091 + 0.95454545 X
Comportamiento:
16
XY
( X )
X2
X Y
Y 2 ( Y )
n
620 621
20
2
20
20
19881
= 0.97212152
Coeficiente de determinacin:
Nota
2 = (0.97212152 )2 2 = 0.94502025
:
El 95% de Y depende de X
ANLISIS DE VARIANZA:
(Y )
= Y
n
6212
= 19918.4
= 636.35
SCTOTAL
20
2
(
X )
620 2
SC REGRESIN = 1 X
= 0.95454545 19880
n
20
Hiptesis
H0 : No existe regresin lineal entre x e y
Ha : Si existe regresin lineal entre x e y
Cuadro ANVA:
F.V.
S.C.
G.L.
C.M.
Regresin
1
630
630
Error
18
6.35
0.3528
TOTAL
19
636.35
Ft = F(1,630) 0.05 = 3.84
Decisin:
Como Fc > Ft entonces se rechaza H0.
Conclusin:
F.C.
1785.8268
= 630
Sig.
**
17
respuesta
utilizaramos
un
modelo
de
tercer
orden:
Estos modelos e denominan modelos lineales generales porque E(y) es funcin lineal de
los PARMETROS desconocidos 0, 1, 2...
18
E(y) =
+ 1X
+ 2X
+ 3X
+ 4X
+ 5X
+ 6X
Las variables ficticias introducen al parmetro apropiado ( de que puede ser positivo o
negativo) dependiendo del da de la semana. As: En domingo X1= 1, X2 = X3, ...., = X6 = 0 y
el valor medio de Y es:
En lunes
En martes
En mircoles
En jueves
En viernes
E(y) =0 + 1(1)
E(y) =0 + 1
E(y) =0 + 2
E(y) =0 + 3
E(y) =0 + 4
E(y) =0 + 5
E(y) =0 + 6
En sbado se asigna 0 a todas las variables ficticias y el valor medio de Y es: E(y) =0
Se recomienda seleccionar el modelo de regresin apropiado para una situacin en
particular. Ningn mtodo estadstico puede compensar una mala seleccin del modelo.
Propondremos un anlisis ms profundo al respecto en una prxima sesin. En el presente
su pondremos que se ha seleccionado un modelo razonable para la situacin y nos
concentraremos en el procedimiento de ajuste del modelo a un conjunto de datos y en los
mtodos asociados de inferencia estadstica.
19
Componente
Deterministico
El componente aleatorio debe obedecer los supuestos del modelo de regresin lineal:
Tenga distribucin normal con media 0 y varianza 2. Esto implica que la media de Y
equivale al componente deterministico
E(y) = 0 + 1 X 1 + ... + k X k
Para todos los valores de las variables independientes X1, X2, X3,..., Xk la varianza de
es constante.
Los errores aleatorios asociados a cualquier par de Y son independientes (en sentido
probabilstico).
DESCRIPCIN DE LOS DATOS Y DEL MODELO:
X1
X2
X3
...
Xk
Y1
X11
X12
X13
Y2
X21
X22
X23
Y3
X31
X32
X33
...
X3K
...
...
...
Yn
Xn3
Xnk
Xn1
Xn2
...
X1K
...
X2K
20
Yi = 0 + 1 X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik + i
Cada modelo describe un hiperplano en el espacio k-dimensional formado por {Xi }
Donde:
Yi:
X1, X2, X3, ..., Xk: variables independientes. Podran en realidad representar los
cuadrados
cubos
productos
cruzados
otras
i:
Los coeficientes j : 0,k son estimados por el mtodo de mnimos cuadrados, as:
El modelo:
Yi = 0 + 1 X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik + i
Despejando i y elevando al cuadrado ambos miembros:
(i)2= (Yi
( 0 + 1 X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik )) 2
i =1
i2
= (Yi ( 0 + 1 X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik )) 2
i =1
21
i =1
i2
= (Yi Yi ) 2 = SSE
i =1
SSE
=0
0
SSE
=0
1
SSE
=0
2
.
.
.
SSE
=0
k
Examinemos la primera ecuacin:
Si tomamos la primera derivada parcial de SSE con respecto a 0
obtenemos:
n
SSE
= 2 (Yi ( 0 + 1 X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik ))( 1)
0
i =1
Introduciendo el operador SUMATORIA e Igualando a cero, queda:
Yi ( n 0 + 1X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik ) = 0
Osea: (despejando e intercambiado miembros):
Ing. Wilmer J. Bermdez Pino
22
n 0 + 1X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik = Yi
Esta es una ecuacin lineal en los parmetros. Las ecuaciones de
mnimos cuadrados restantes todas lineales en los parmetros son:
0 X ik + 1X ik X i1 + 2 X ik X i 2 + ... + k X ik2 = X ik Yi
Luego el sistema es:
n 0 + 1X i1 + 2 X i 2 + 3 X i 3 + ... + k X ik = Yi
0 X ik + 1X ik X i1 + 2 X ik X i 2 + ... + k X ik2 = X ik Yi
El sistema tiene p = k +1 ecuaciones e incgnitas
Como puede verse, escribir k+1 ecuaciones lineales de mnimos
cuadrados ya cuesta trabajo, resolverlos simultneamente a mano es
todava ms difcil. Una forma fcil de expresar las ecuaciones y
resolverlos es mediante el lgebra de Matrices y obtener frmulas
para las estimaciones de los coeficientes de regresin lineal de mnimos
Ing. Wilmer J. Bermdez Pino
23
Donde:
X1 X2 X3 Xk:
Variables de prediccin
error aleatorio
p = k +1: nmero de parmetros del modelo
k: Nmero de variables de prediccin
Supongamos que se tiene una muestra de tamao n
( n k ) que se
denota as:
Valor
de
Variables explicatorias
Datos
X1
X2
Y1
X11
X12
Y2
X21
X22
X3... Xk
X13...X1K
X23...X2K
Y3
. ....
. ....
. ....
Yn
Xn1
Xn2
X31
X32
X33...X3K
Xn3 Xnk
Error
aleatorio
1
2
3
En notacin matricial:
En forma desarrollada puede verse as:
24
Y1
Y
2
Y3
.
.
.
Y
n
.
=
nx1 1
nx1
X11
X12
X21
X22
X31
X32
.
.
.
.
.
Xn1
.
Xn2
= X
.
.
. . .
.
. . .
.
Xn3 Xnp k px1 n nx1
nxp
nxp .
px1
nx1
Matriz de error
Matriz de parmetros coeficientes
De regresin
k: nde variables Xs
p= k +1 n de parmetros
Matriz de datos xs
Matriz de los datos Ys
OBSERVACIONES:
La primera columna de X es una columna de unos, es decir
estamos insertando un valor de X, especficamente X 0 como
coeficiente de o donde X0 es una variable que siempre toma
valores iguales a 1.
25
= ( 0 1 2 3 ) '
y
y = X + , donde
y = Y
el
modelo
de
estimacin
es
Ahora bien:
ESTIMACIN DE LOS PARMETROS
Utilizamos las matrices de datos Y y X, sus transpuestas y la matriz
= ( 0 1 2 3 ) ' ,
cuadrados, as:
El modelo:
Despejando
y = X +
= y X
' = ( y X )' ( y X )
' = ( y X )( y ' ( X )' )
' = y ' y y ' ( X ) ( X )' y + ( X )' X
y ' ( X ) = ( X )' y
'
= 2 X ' y + 2 X ' X
Igualando a cero:
2 X ' y + 2 X ' X = 0
Ing. Wilmer J. Bermdez Pino
26
Obtenemos:
X ' X = X ' y
= (XX)
XY
Y1
Y
2
Y3
.
.
.
Y
n
.
=
nx1 1
X11
X12
X21
X22
X31
X32
.
.
.
.
Xn1
Xn2
1
2
.
.
. . .
.
. . .
.
Xn3 Xnp k px1 n nx1
nxp
SE ESCRIBE:
27
X11
X12
X' X =X13
X1k
X21
X31 Xn1
X22
X32 Xn2
X23
X33 Xn3
X2k
1
1
1
.
.
.
1
pxn
X3k
Xnk
.
.
.
.
Xn1 Xn2
.
. .
.
. .
.
. .
Xn3 Xnk nxp
...
X11 X12
X21 X22
X31 X32
.
El producto resulta:
Xi1
Xi2
X ' X = Xi3
Xik
Xi1
Xi2
Xi3
2
Xi1
Xi1 Xi2
Xi1 Xi3
...
Xi1Xi2
2
Xi2
Xi2 Xi3
...
Xi1Xi3
Xi2Xi3
2
Xi3
Xi1Xik
Xi2 Xik
Xi3Xik
Xik
Xi1 Xik
Xi2 Xik
Xi3Xik
XinXik pxp
X11
X12
X ' Y = X13
X1k
X21
X 31 Xn1
X22
X32
Xn2
X23
X33
Xn3
X2k
X3k
Xnk
Y1
Y2
Y3
.
.
.
Y
pxn n
Yi1
X Y
i1 1
Xi2Y2
= Xi3Y3
0
1
1
= ( X ' X ) X ' Y = 2
K
Y el modelo de regresin estimado es:
Yi = 0 +
j X ij ;
i = 1, n
j =1
j = 1, k
Y = X
CARACTERSTICAS
DE
LOS
ESTIMADORES
DE MINIMOS
CUADRADOS
a.
ESPERANZA MATEMTICA DE
E( ) =
Demostracin:
E( )= E ( X ' X )
E( )= E (( X ' X )
E( )= E ( ) + ( X ' X )
X ' E ( )
E( ) =
b. VARIANZA Y COVARIANZA DE
Var-cov( )=
2 ( X ' X ) 1
Demostracin:
Var-cov( )=E( -E( ))( -E( ))
Var-cov( )=E( - )( - )
Ing. Wilmer J. Bermdez Pino
29
= ( X ' X ) 1 X ' Y
donde Y = X +
= ( X ' X ) 1 X ' ( X + )
= ( X ' X ) 1 X ' X + ( X ' X ) 1 X '
= + ( X ' X ) 1 X '
= ( X ' X ) 1 X '
Var-cov( )=E[( ( X ' X )
Var-cov( )=E[ ( X ' X )
Var-cov( )= ( X ' X )
Observe: E ( ' ) = I n
2
Var-cov( )= ( X ' X )
X ' 2 I n X ( X ' X ) 1
Var-cov( )= ( X ' X )
X ' X 2 I n ( X ' X ) 1
Var-cov( )= ( X ' X )
2
c.
se
c00
c
10
1
( X ' X ) = c20
ck 0
ck1 ck 2 ck3 ckk pxp
30
SE ( j ) = c jj ,
Donde
j son:
j , i
Donde
i j
cov( i j )= 2 c ij = 2 c ji
ESTIMADOR DE
2 . VARIANZA DE
EN EL MODELO
DE
REGRESIN MLTIPLE
Las varianzas de los estimadores de los parmetros y de Y dependen
del valor de
2 =
31
SCT = Y ' Y nY
SCR = X ' Y nY 2
Fuente de
variacin
Debido a la regresin
Debido al error
Total
Suma de
cuadrados
SCR
Grados de
libertad
P-1
Cuadrados
medios
CMR=SCR/1
SCE
n-P
CME=SCE/(n-2)
SCT
n-1
F calculado
(Fc)
CMR/CME
32
SOBRE
LOS
COEFICIENTES
INDIVIDUALES
DE
REGRESIN
Estas pruebas son tiles para determinar el valor potencial de cada una
de las variables de regresin del modelo, as el modelo puede ser mas
eficaz con la inclusin de variables adicionales o quiz con la eliminacin
de una o ms regresoras presentes en el modelo
Hiptesis
H0 : j =0
H1 : j 0
ESTADSTICA DE PRUEBA
TO =
j
2 c jj
DECISIN:
Rechazar H0 si |To|> tn-p para un
% de significacin
CONCLUSIN
Si no se rechaza la hiptesis H0 indica que el regresor Xj puede
eliminarse del modelo
MEDIDAS DE ADECUACION DEL MODELO
a.
33
R2 =
SSR
SSE
=1
,
SCT
SCT
0 R2 1
+ R2 = R
Ejercicio resuelto:
El consumo de un producto x de la empresa Agraroindustrial Naranjillo Ltda. de
la ciudad de Tingo Mara, se ha venido observando que a travs del tiempo ha
tenido una demanda permanente que se muestra en el siguiente cuadro :
INGRESO
FAMILIAR
AO
CONSUMO/VENTAS
PRECIO
2002
45
2003
50
2004
60
2005
55
2006
64
11
2007
68
10
2008
70
12
2009
72
11
2010
75
15
2011
80
14
34
Dado que:
35
PRECIO
INGRESO
FAMILIAR
Yt
X1t
X2t
2002
45
2003
50
2004
Yt2
X1t2
2025
49
14
315
90
2500
64
24
400
150
60
3600
81
36
16
540
240
2005
55
3025
81
27
495
165
2006
64
11
4096
121
55
25
704
320
2007
68
10
4624
100
50
25
680
340
2008
70
12
4900
144
72
36
840
420
2009
72
11
5184
121
55
25
792
360
2010
75
15
5625
225
105
49
1125
525
2011
80
14
6400
196
84
36
1120
480
TOTAL
639
106
46
41979
1182
522
234
7011
3090
106
522
+ (46)
46
234
1182
522
AO
X2t*Yt
Reemplazando en la frmula:
10
= 106
46
Hallamos la inversa de
1182
522
Det(A)= 1248
Cof(A):
1182 522
A11= (1)
= 4104
522 234
A13 =(1) =
46
522
234
639
7011
3090
A-1:
Det(A)= (10)
A12 = (1) =
106
1182
522
522
106
(106)
234
46
106 522
= 792
46 234
106 1182
= 960
46
522
36
106 46
= 792
522 234
10
46
10
46
46
= 224
234
106
= 344
522
106
46
= 960
1182 522
10
46
= 344
106 522
10
106
= 584
106 1182
Adjunta(A)
4104 792 960
Adj(A) = 792 224 344
960 344 584
Det( )
( )
344
584
639
7011
3090
28.96
1.13
4.98
37
Y = + X + X t
Y = 28.96 + 1.13X + 4.98X
Efectos:
= 1.13
= 4.98
Y nY
( )
( )
28.96
639
639
1.13
7011 (10) 10
3090
= 4.98
639
41979 (10) 10
= 0.88908228 88.91 %
38
=1
=1
28.96
639
41979 1.13
7011
4.98
3090
=1
639
41979 (10) 10
10 1
10 3
= 1 0.1426085
= 0.8573915 85.74 %
Interpretacin:
Los precios y el ingreso familiar tienen mucha influencia en el consumo del
producto X, por lo tanto no es necesario incorporar otra variable independiente
en el modelo
Anlisis de Varianza (ANVA)
FUENTE DE
VARIACION
GRADOS DE
LIBERTAD
SUMA DE
CUADRADOS
CUADRADO
MEDIO
COCIENTE
F
DEBIDO A LA
REGRESION (E)
SCE =1019.69
= 509.84
=14.13
k-1=3-1=2
DEBIDO AL
ERROR DELA
MUESTRA (R)
n-k=10-3=7
SCR = 127.21
TOTAL(T)
n-1=10-1=9
SCT = 1146.90
= 36.07
.
.
39
= Y nY
28.96
639
= 1.13
7011 (10)
4.98
3090
= 1019.69
=
= 41979 (10)
= 1146.90
= 1146.90 1019.69
= 127.21
= 509.84
= 14.13
=
= 36.07
.
.
Planteamiento de hiptesis
:
:
Nivel de significancia
= 5 % 0.05
2)
Punto critico
gl1 = k-1 3-1=2
gl2 =n-k 10-3= 7
Fgl1;gl2; F2;7;0.05 = 4.7374
3)
40
4)
=
=
41979
= 18.17
28.96
1.13
4.98
10 3
639
7011
3090
41
=1
=1
=1
1,
=1
=1
0)
=1
2
1
2
=1
0,
=1
10 106 46
= 18.17 106 1182 522
46 522 234
( ,
( ,
)
)
1,
0)
2,
1)
1)
2
1
2
2
2
(
(
0,
1,
1)
2)
2)
( )
( , )
( , )
59.76 11.53 13.98
3.26
5.01
( , ) = 11.53
13.98
5.01
8.50
( )
2) Nivel de significancia
= 5 % 0.05
3) Punto critico
gl = n-k 10-3 = 7
tgl; /2 t7;0.025 = 2.3646
42
1.13
3.26
( )
0.6282
= 0.6282
5) Conclusiones
tc < t7;0.025 ( 0.6282 < 2.36 ).Entonces AHo, es decir el efecto del
precio no explica significativamente el comportamiento del
consumo/ventas del producto X de la empresa Agraroindustrial
Naranjillo Ltda.
Para
1) Planteamiento de hiptesis
= 0 (El efecto del ingreso familiar no explica significativamente en el C/Vtas)
0 (El efecto del ingreso familiar explica significativamente en el C/Vtas)
2) Nivel de significancia
= 5 % 0.05
3) Punto critico
gl = n-k 10-3 = 7
4.98
8.50
( )
= 1.7079
43
AO
2012
2013
PRECIO
15
16
Y
Y
Y
Y
INGRESO
FAMILIAR
7
8
CONSUMO/VENTAS
81
87
44
45
variables independientes.
Independientes se trasladan las variables utilizadas para predecir el valor de la
variable dependiente. Tambin se denominan variables predictoras o variables
explicativas. Para poder ejecutar este procedimiento, la lista debe contener al menos
una variable.
Mtodo: Permite seleccionar el mtodo por el cual se introducen las
variables independientes en el anlisis. Nos vale para elegir la mejor
ecuacin de regresin. Permite construir una variedad de modelos de
regresin a partir del mismo conjunto de variables:
Introducir (Entry): Procedimiento para la seleccin de variables en el
que todas las variables un bloque se introducen en un solo paso. Es el
mtodo por defecto.
46
la primera
Hacia
delante
(Forward):
Procedimiento
de
seleccin
de
47
Coeficientes
estimaciones
de regresin.
de
En este recuadro
las
48
49
valores
mayores
de
los
residuos
estandarizados
(ZRESID),
los
residuos
50
de
la
independientes.
2.3.- Guardar
El botn Guardar nos permite guardar los valores pronosticados, los residuos y
medidas relacionadas como nuevas variables que se aaden al archivo de datos de
trabajo. En los resultados una tabla muestra el nombre de cada nueva variable y su
contenido.
2.4.- Opciones
El botn Opcionesnos permite controlar los criterios por los que se eligen las
variables para su inclusin o exclusin del modelo de regresin, suprimir el
trmino constante y controlar la manipulacin de los valores perdidos.
Aplicacin.
Vamos a realizar un anlisis de regresin lineal simple para estudiar la posible relacin
entre
Las ventas de un determinado producto (variable dependiente) y los gastos en
publicidad (variable independiente) en una muestra de 15 productos. La figura muestra
la matriz de datos q se va a analizar.
Editor de datos SPSS vista de variables.
Ing. Wilmer J. Bermdez Pino
51
52
53
54
H is to g ra m a
V a ria b le d e p e n d ie n te : V E N T A S
8
F re c u e n c ia
M e d ia = -6 ,9 4 E -1 6
D e s v ia c i n tp ic a = 0 ,9 6 4
N =15
0
-3
-2
-1
R e g re s i n R e s id u o tip ific a d o
55
1,0
0,8
0,6
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
1,0
56
a)
b)
c)
d)
3) Como analista de Coca - Cola, su trabajo es utilizar los datos proporcionados aqu para
saber si los cambios en los precios son efectivos para promover las ventas. Estos datos se
tomaron en los mercados de prueba seleccionados en toda la regin para el precio de
cada botella y las respectivas ventas realizadas. Las ventas estn dadas en miles de soles.
Precio en soles
2.1
0
3.5
2
2.1
0
2.5
5
3.5
0
3.5
0
2.9
9
2.9
9
2.2
5
57
11
18
26
34
45
55
58
59
a 30 operarios en un
X4
8.0
8.4
8.6
8.9
9.0
9.0
9.1
9.2
9.8
10.0
10.2
10.8
11.0
11.5
11.6
60