You are on page 1of 26

REGRESION

LINEAL
SIMPLE

CONCEPTO
El anlisis de regresin es una tcnica estadstica
para investigar la relacin funcional entre dos o
ms
variables,
ajustando
algn
modelo
matemtico. La regresin lineal simple utiliza una
sola variable de regresin y el caso ms sencillo es
el modelo de lnea recta.

Los mtodos de regresin estudian la construccin de modelos para explicar o


representar la dependencia entre una variable respuesta o dependiente (Y ) y la(s)
variable(s) explicativa(s) o dependiente(s), X . En este Tema abordaremos el
modelo de regresin lineal, que tiene lugar cuando la dependencia es de tipo lineal,
y daremos respuesta a dos cuestiones bsicas:
Es significativo el efecto que una variable X causa sobre otra Y ? Es
significativa la dependencia lineal entre esas dos variables?.
De ser as, utilizaremos el modelo de regresin lineal simple para explicar y
predecir la variable dependiente (Y ) a partir de valores observados en la
independiente (X

Ejemplo 1
Ejemplo 9.1. El inventor de un nuevo material aislante quiere determinar la
magnitud de la compresin (Y ) que se producir en una pieza de 2 pulgadas de
espesor cuando se somete a diferentes cantidades de presin (X). Para ello prueba
5 piezas de material bajo diferentes presiones. Los pares de valores observados (x,
y) se muestran en la siguiente tabla:

En principio no sabemos si las variables en cuestin estn relacionadas o no, o si


en caso de haber dependencia es significativa o no. De haber entre ellas una
dependencia lineal significativa, podramos expresar la Compresin (Y ) a partir de
la Presin (X) mediante una recta, y a partir de ella predecir la compresin que se
dara para un determinado nivel de presin. Una forma de determinar si puede
existir o no dependencia entre variables, y en caso de haberla deducir de qu tipo
puede ser, es grficamente representando los pares de valores observados. A dicho
grfico se le llama nube de puntos o diagrama de dispersin.

En a) hay ausencia de relacin (independencia). En


b) existe asociacin lineal positiva (varan en general en el mismo sentido). En
c) existe asociacin lineal negativa (varan en sentido contrario). En
d) existe fuerte asociacin, pero no lineal

Se considera que la variable X es la variable independiente o regresiva y se mide


sin error, mientras que Y es la variable respuesta para cada valor especfico xi de
X; y adems Y es una variable aleatoria con alguna funcin de densidad para cada
nivel de X.

Si la recta de regresin es: Y = 0 + 1X


Cada valor yi observado para un xi puede considerarse como el valor esperado de
Y dado xi ms un error
Epislon error
Modelo lineal simple : Y = 0 + 1x+ i
Regresin Lineal Simple Los i se suponen errores aleatorios con distribucin
normal, media cero y varianza 2 ; 0 y 1 son constantes desconocidas
(parmetros del modelo de regresin

Mtodo de Mnimos Cuadrados para


obtener estimadores de 0 y 1
Consiste en determinar aquellos estimadores de 0 y 1 que minimizan la suma de
cuadrados de los errores i ; es decir, los estimadores y de 0 y 1
respectivamente deben ser tales que:

Un caso de particular inters es probar la hiptesis:


Ya que si la pendiente es igual cero, entonces puede significar o que la variacin
de X no influye en la variacin de Y, o que no hay regresin lineal entre X y Y. Por
otro lado, si la pendiente es diferente de cero, entonces existir algn grado de
asociacin lineal entre las dos variables, es decir, la variabilidad de X explica en
cierta forma la variabiliad de Y (aunque no implica que no pueda obtenerse un
mejor ajuste con algn polinomio de mayor grado en X).
Nota: si se utilizara en lugar de una recta, una curva con grado mayor a 1 en X
pero grado 1 en los coeficientes de X, la regresin sigue siendo lineal, ya que es
lineal en los parmetros de regresin p.ej. Y=o+1x+2x2

Estimacin de intervalos de confianza en torno a la lnea

de regresin: BANDAS DE CONFIANZA

Estimadores de los minimos cuadrados ejemplo

Problema 4.3. Los datos de la tabla adjunta muestran el tiempo de impresin (Y )


de trabajos que se han imprimido en impresoras de la marca PR. Se est
interesado en estudiar la relacin existente entre la variable de inters tiempo de
impresin de un trabajo y la variable explicativa (X) nmero de pginas del
trabajo. Utilizando estos datos ajustar un modelo de regresin

Las estimaciones de los parmetros de la recta de regresin son

Intervalos de confianza (al 90 %) y contrastes de hiptesis sobre los parametros del modelo son:

El grafico de residuos frente a las predicciones


se observa en el siguiente grafico,

conclusion
La regresin lineal nos ayuda a predecir distintos compartimientos de una muestra

You might also like