You are on page 1of 9

Regresin Lineal Mltiple

UNIVERSIDAD AUTNOMA DE NUEVO


LEN
FACULTAD DE CIENCIAS QUMICAS

Regresin Lineal Mltiple


Evidencia No. 3: El estudiante ahorrador

Dr. Juan Manuel Hernndez Lpez


ESTADSTICA APLICADA

EQUIPO No. 12
Gerardo Echazarreta Garca
Matrcula: 1635404
Valdemar Emmanuel De La Paz Cavazos
Matrcula: 1615168
Enrique Joan Salas Villarreal
Matrcula: 1614836
Grupo: 501 Ingeniera Qumica

San Nicols de los Garza, N.L.


1 a 18 de noviembre de 2016
Regresin Lineal Mltiple

CONTENIDO
1. PROBLEMA.................................................................................................................3
2. FORMULACIN DEL MODELO...................................................................................3
3. ECUACIN DE REGRESIN LINEAL MLTIPLE.......................................................4
4. COEFICIENTE DE DETERMINACIN MLTIPLE......................................................6
5. PRUEBA F PARA LA SIGNIFICANCIA DEL MODELO.................................................7
6. PRUEBA T PARA EVALUAR LA SIGNIFICANCIA DE CADA PENDIENTE..................8
7. INTERVALOS DE CONFIANZA PARA LAS PENDIENTES..........................................9
8. DESVIACIN ESTNDAR DEL MODELO DE REGRESIN......................................9
9. BIBLIOGRAFA............................................................................................................9

2
Regresin Lineal Mltiple

1. PROBLEMA.
Un joven estudiante de la carrera de Ingeniero Qumico en la Facultad de Ciencias Qumicas de la
UANL comenz a trabajar en un puesto de hamburguesas que quedaba cerca de su casa, con el fin
de obtener ingresos extras y solventarse una nueva computadora porttil.
Despus de trabajar por 10 meses, de diciembre de 2015 a septiembre de 2016, y revisar que an
no tena el dinero que esperaba, decidi revisar la relacin que existe entre el dinero que ganaba, la
cantidad de clientes que atenda y el tiempo que permaneca al da en dicho restaurante.

2. FORMULACIN DEL MODELO.


Tabla 1. Datos recolectados de diciembre de 2015 a septiembre de 2016.
y b1 b2
Semana Dinero ($) Cliente Tiempo (h)
s
1 252 46 6.5
2 506.5 100 6.5
3 279 69 6.5
3 316 137 6.5
4 404 142 6.5
5 372 55 7.5
6 299 102 6.5
7 136.5 71 7.5
8 501 94 7.5
9 107 77 7.5
10 276 89 6.5
11 236.5 57 7.5
12 416 135 6.5
13 168.5 112 6.5
14 241 106 6.5
15 269 99 6.5
16 340 109 7.5
17 451 130 7.5
18 259 108 6.5
19 552 99 7.5
20 323.5 75 7.5
21 334 109 7.5
22 125 142 7.5
23 267.5 110 7.5

3
Regresin Lineal Mltiple

24 417 113 7.5


25 173 129 7.5
26 267.5 131 6.5
27 353 129 6.5
28 147 109 6.5
29 143 56 7.5
30 414 90 7.5
31 171.5 130 7.5
32 476 124 6.5
33 447.5 108 7.5
34 186 72 6.5
35 403 60 7.5
36 120 105 7.5

Modelo de regresin mltiple: y(Dinero) = b0 + b1(Clientes) + b2(Tiempo)


Tabla 2. Matriz de correlacin.
Dinero Clientes Tiempo
Dinero 1
Clientes 0.14055487 1
Tiempo 0.003430282 -0.196681982 1
Si comparamos el Dinero contra la cantidad de Clientes observamos que r=0.14055, lo que nos
indica que hay una asociacin lineal positiva, tal y como sucede cuando comparamos el Dinero con
el Tiempo de permanencia en el puesto de hamburguesas, ya que se aprecia que r=0.00343.

3. ECUACIN DE REGRESIN LINEAL MLTIPLE.


Con ayuda del software Microsoft Excel, se procedi a calcular todo lo necesario de la regresin
mltiple para de esta forma estimar la ecuacin de regresin lineal mltiple. A continuacin se
exponen los resultados del tratamiento realizado.
Tablas 3.1,2,3. Valores de los estadsticos descriptivos de cada conjunto de datos.
Tabla 3.1. Estadsticos del dinero
DINERO
Mean 301.3648649
Standard Error 20.29656853
Median 279
Mode 267.5
Standard Deviation 123.4592065

4
Regresin Lineal Mltiple

Sample Variance 15242.17568


Kurtosis -0.941985918
Skewness 0.177887972
Range 445
Minimum 107
Maximum 552
Sum 11150.5
Count 37
Tabla 3.2. Estadsticos de los clientes
CLIENTES
Mean 100.7837838
Standard Error 4.442852872
Median 106
Mode 109
Standard Deviation 27.02481898
Sample Variance 730.3408408
Kurtosis -0.810140733
Skewness -0.370477336
Range 96
Minimum 46
Maximum 142
Sum 3729
Count 37
Tabla 3.3. Estadsticos del tiempo
TIEMPO
Mean 7.040540541
Standard Error 0.083058959
Median 7.5
Mode 7.5
Standard Deviation 0.505227924
Sample Variance 0.255255255
Kurtosis -2.087217004
Skewness -0.169654688
Range 1
Minimum 6.5
Maximum 7.5
Sum 260.5
Count 37

5
Coefficient Regresin
Standard t Stat Lineal Mltiple
P-value Lower 95% Upper 95%
s Error
Intercep 178.109591 323.71913 0.5501979 0.58578042 -479.76684 835.986027
t 5 0
Clientes 0.67115060 0.7907380 0.8487647 0.40194868 -0.9358224 2.27812364
4 8
Tiempo 7.89913444 42.296855 0.1867546 0.85296292 -78.0584175 93.8566864
Tabla 4. 3 5 Valores
esenciales para la ecuacin de regresin lineal mltiple.
Con la tabla anterior se puede obtener la ecuacin estimada de regresin lineal mltiple, la cual es
y = 178.109591 + 0.6711506 b1 + 7.89913444 b2
Donde: y Dinero expresado en pesos mexicanos.
b1 Cantidad de clientes atendidos.
b1 Tiempo de permanencia en horas.

4. COEFICIENTE DE DETERMINACIN MLTIPLE.


Tabla 5. Estadsticos de regresin.
REGRESSION STATISTICS
Multiple R 0.144083929
R Square 0.020760178
Adjusted R Square -0.036842164
Standard Error 125.7128888
Observations 37

Tabla 6. Anlisis de Varianza (ANOVA).


df SS MS F Significance F
Regression 2 11391.49034 5695.745171 0.36040510 0.700025924
8
Residual 3 537326.834 15803.73041
4
Total 3 548718.324
6 3
Este coeficiente, que se ve representado por la letra R2, es el cociente que se obtiene a partir de la
divisin entre la Suma de Cuadrados de la Regresin y la Suma de Cuadrados Total.
Como se puede apreciar en la Tabla 5, nuestro coeficiente es R2=0.020760178, dicho valor nos
indica que el 2.08% del dinero que el joven puede ganar es explicada por la variacin en la cantidad
de clientes que atiende y el tiempo que permanece en el puesto de hamburguesas.

6
Regresin Lineal Mltiple

Por otro lado, el coeficiente de determinacin mltiple ajustado, representado por la letra RA2, nos
ayuda a entender dicha variacin en los ingresos del joven tomando en cuenta el tamao de la
muestra y el nmero de variables independientes.
En la misma Tabla 5 se puede apreciar que el valor de RA2=-0.036842164, el cual nos indica que
realmente no existe variacin estadstica alguna entre el dinero que el joven puede ganar en funcin
de los clientes y el tiempo que trabaje, tomando en cuenta los parmetros antes mencionados.

5. PRUEBA F PARA LA SIGNIFICANCIA DEL MODELO.


Lo que se busca al realizar esta prueba es mostrar si existe una relacin lineal entre todas las
variables independientes, que en este caso son los clientes y el tiempo, consideradas en forma
conjunta y la variable dependiente, que es el dinero que se obtiene. Se presenta el desarrollo de
forma puntualizada.
Se plantean las hiptesis.
H0: b1 = b2 (No hay relacin lineal)
H1: b1 b2 (Existe relacin lineal de la variable dependiente con al menos una de las variables
independientes).
Se obtienen los valores necesarios.
Como se puede apreciar en la Tabla 6, los valores que se necesitan para determinar cul de
nuestras hiptesis es la correcta son los siguientes:
Se poseen 2 y 34 grados de libertad.
El valor de F=0.360405108.
El valor P=0.700025924 para la prueba.
Se procede al anlisis grfico correspondiente.

Valor crtico
F0.05=3.275
H0

H1

Nuestro estadstico es
F=0.3604

Figura 1. Representacin grfica del anlisis estadstico.

7
Regresin Lineal Mltiple

Como F=0.3604<F0.05=3.275, se acepta H0; con lo que se demuestra que no existe suficiente
evidencia que justifique la aseveracin de que existe una relacin lineal entre la variable dependiente
y cualquiera de las dos variables independientes.
6. PRUEBA T PARA EVALUAR LA SIGNIFICANCIA DE CADA PENDIENTE.
Lo que se busca realizar con esta prueba es mostrar si existe una relacin lineal entre la variable
dependiente y cualquiera de las variables independientes, pero ahora tomadas cada una de forma
individual, caso contrario a la prueba F.
Se plantean las hiptesis.
H0: bi = 0 (No hay relacin lineal)
H1: bi 0 (Existe relacin lineal de la variable dependiente con la variable independiente
representada por bi).
Se obtienen los valores necesarios.
Como se puede apreciar en la Tabla 4, los valores que se necesitan para determinar cul de
nuestras hiptesis es la correcta son los siguientes:
Se poseen 34 grados de libertad.
El valor de tclientes=0.84876478 y el valor de ttiempo=0.18675465.
El valor Pclientes=0.40194868 y el valor Ptiempo=0.85296292.
Se procede al anlisis grfico correspondiente.

Valor crtico Valor crtico


-t0.025=-2.032 t0.025=2.032

H0

H1 H1

Nuestro estadstico es
Nuestro estadstico es
ttiempo=0.18675465 tclientes=0.84876478

Figura 2. Representacin grfica del anlisis estadstico.


Para ambas variables independientes se acepta H0; por lo tanto se puede concluir que no existe
suficiente evidencia que justifique la aseveracin de que existe una relacin lineal entre la variable
dependiente y las dos variables independientes, tomadas en cuenta por separado.

8
Regresin Lineal Mltiple

7. INTERVALOS DE CONFIANZA PARA LAS PENDIENTES.


Como se puede apreciar en la Tabla 4, los intervalos de confianza para cada una de las variables
independientes son los siguientes:
Clientes atendidos: 2.2781 a -0.9358.
Tiempo de trabajo: 93.8566 a -78.0584.

8. DESVIACIN ESTNDAR DEL MODELO DE REGRESIN.


La desviacin estndar, representada por la letra S, debe ser comparada con el promedio de la
variable dependiente para saber si es o no considerada como un valor grande, para ello se vuelve
necesario recurrir a la Tabla 5, la cual muestra que el valor de dicho parmetro es S=125.7128888.
El promedio de dinero que el joven obtiene por da es de 301.3649, por lo que comparado con la
desviacin estndar, se puede decir que sta ltima es pequea.

9. BIBLIOGRAFA.
ALEA, V. et al. (1999) Estadstica Aplicada a les Cincies Econmiques i Socials. Barcelona:
Edicions McGraw-Hill EUB.
CANAVOS, G. (1988) Probabilidad y Estadstica. Aplicaciones y Mtodos. Mxico: McGraw-
Hill.
DURA PEIR, J. M. y LPEZ CUAT, J.M. (1992) Fundamentos de Estadstica. Estadstica
Descriptiva y Modelos Probabilsticos para la Inferencia. Madrid: Ariel Editorial.

You might also like