You are on page 1of 35

Modelo lineal

De Wikipedia, la enciclopedia libre


Saltar a: navegacin, bsqueda

En estadstica, el trmino modelo lineal es usado en diferentes maneras de acuerdo al


contexto. La manera ms frecuente es en conexin con modelos de regresin y el
trmino a menudo se toma como un sinnimo del modelo de regresin lineal. Sin
embargo, el trmino es tambin usado en anlisis de series de tiempo con un significado
diferente. En cada caso, la denominacin como "lineal" es usada para identificar una
subclase de modelos para los cuales la reduccin en complejidad de la teora estadstica
relacionada es posible.

ndice
[ocultar]

1 Modelos de Regresin Lineal


o 1.1 Algunas expresiones del modelo de regresin lineal
1.1.1 Modelos polinomiales
1.1.2 Modelos multinomiales
o 1.2 Estimacin del modelo
1.2.1 Insesgado
1.2.2 Residuos
2 Modelos de series temporales
3 Otros usos en estadstica
4 Vase tambin
5 Referencias

Modelos de Regresin Lineal[editar]


Para el caso de regresin, el modelo estadstico es como sigue: un modelo lineal predice
el valor de una variable a travs de otras que llamaremos factores mediante una funcin
lineal de estos.1 Estos factores estn determinados por el escenario donde observamos la
variable a predecir, a la cual llamaremos variable endgena. Dada una muestra

(aleatoria) la relacin entre las observaciones Yi y las variables independientes Xij


se frmula como

donde pueden ser funciones no lineales. En la ecuacin anterior, las cantidades i


son variables aleatorias representando errores en la relacin. La parte "lineal" se refiere
a la apariencia de los coeficientes de regresin, j en esta ecuacin. Alternativamente, se
puede decir que los valores ajustados correspondientes al anterior modelo, notados
son funciones lineales de los j.

Dado que la estimacin se toma en la base de un anlisis de mnimos cuadrados, las


estimaciones de los parmetros desconocidos j se determinan al minimizar una funcin
de suma de cuadrados

Por lo tanto, se puede ver que el aspecto "lineal" del modelo implica lo siguiente:

la funcin a ser minimizada es una funcin cuadrtica de los j para lo


cual el problema de minimizacin es relativamente simple;
las derivadas de la funcin son funciones lineales de los j haciendo fcil
de encontrar los valores estimados que la minimizan;
los valores estimados de j son funciones lineales de las observaciones
Yi;
los valores estimados de j son funciones lineales de los errores
aleatorios i lo cual hace relativamente fcil determinar sus propiedades
estadsticas.

Algunas expresiones del modelo de regresin lineal[editar]

Modelos polinomiales[editar]

Los modelos lineales sirven para estimar modelos polinomiales. Por ejemplo, si las
potencias de una variable explican la variable endgena, el modelo sera:

Modelos multinomiales[editar]

Tambin podemos recurrir a los modelos lineales para estimar modelos multinomiales.
Un ejemplo es el siguiente:

Estimacin del modelo[editar]

Para estimar el modelo, tenemos que observar el valor de la variable dependiente y de

los factores en casos. En este caso, las ecuaciones sern:


Este sistema de ecuaciones admite la siguiente expresin vectorial:

Los smbolos que aparecen en este modelo vectorial representan lo siguiente:

El vector de errores cometido por el modelo viene dado por:

El estimador mnimo cuadrtico es aquel que hace mnima la suma de los cuadrados de
estos errores. Esta suma es:

Observemos que no hemos establecido ninguna restriccin para el valor de .


Estamos pues ante un problema de optimizacin sin restricciones. Los clculos llevan a

las llamadas ecuaciones normales que tiene que verificar el valor de que hace
mnima la suma de los cuadrados de los errores.

El estimador mnimo-cuadrtico para resulta ser:

El Teorema de Gauss-Mrkov nos informa sobre la eficacia de este estimador.

Insesgado[editar]

Si los errores -que son variables aleatorias- son insesgados , el estimador mnimo-
cuadrtico tambin lo es:
Es importante que incluyamos en el modelo todos los factores relevantes: si falta
alguno, es posible que los errores no tengan media cero y el estimador de los
coeficientes ser sesgado. No obstante, cualquier buen modelo lineal ayuda a
comprender un fenmeno y a hacer buenas estimaciones. Si incluimos factores de
influencia dudosa, tambin podemos provocar un sesgo en el estimador mnimo-
cuadrtico. Desde hace muchos aos, existe una teora de inferencia en modelos lineales
que nos permite decidir -con un pequeo margen de error- si un factor es o no relevante.

Residuos[editar]

Los errores cometidos por el modelo cuando se usa el verdadero valor del parmetro son

. No obstante, nosotros no conocemos el verdadero valor del parmetro , sino

slo su estimacin y esto provoca que no manejemos los verdaderos errores


cometidos, sino su estimacin, a la que llamaremos residuos y que vienen dados por:

En nuestros clculos, tampoco manejaremos la suma de los cuadrados de los errores,


sino la suma de los cuadrados de los residuos:

Se dice que los errores son homocedsticos cuando:

Si el error presenta una varianza distinta en cada caso, hablamos de heterocedasticidad.

Modelos de series temporales[editar]


Un ejemplo de modelo lineal en series temporales es el Modelo autorregresivo de media
mvil, en el que los valores {Xt} de la serie pueden representarse de la forma

donde, de nuevo, las cantidades t son variables aleatorias que representan las
innovaciones o nuevos efectos aleatorios que aparecen en un instante determinado pero
solo afectan a X en lo sucesivo de la serie. En este contexto, el trmino modelo lineal se
refiere a la estructura de la relacin que representa a Xt como una funcin lineal de los
valores anteriores de la misma serie de tiempo y de innovaciones en el mismo instante e
instantes pasados.2 Este aspecto particular de la estructura indica que hay una manera
simple de encontrar relaciones para la media y las propiedades de covarianza de las
series. Note que la parte "lineal" del trmino "modelo lineal" no se refiere a los
coeficientes i y i, como era el caso en el modelo de regresin, pero se ve
estructuralmente similar.
Otros usos en estadstica[editar]
Hay otras instancias donde los "modelos no lineales" son usados en contraste con un
modelo estructuralmente lineal, aunque el trmino "modelo lineal" no sea
particularmente usado. Un ejemplo de esto es la "reduccin de dimensionalidad no
lineal".
Modelos lineales
Los modelos lineales predicen un objetivo continuo basndose en relaciones
lineales entre el objetivo y uno o ms predictores.

Los modelos lineales son relativamente simples y proporcionan una frmula


matemtica fcil de interpretar para la puntuacin. Las propiedades de estos
modelos se entienden bien y normalmente pueden crearse con bastante
rapidez en comparacin con otros tipos de modelos (como redes neuronales o
rboles de decisin) del mismo conjunto de datos.

Ejemplo. Una corredura de seguros con recursos limitados para investigar las
reclamaciones de seguros de los asegurados desea crear un modelo para
estimar el coste de las reclamaciones. Al desplegar este modelo en centros de
servicios, los representantes pueden introducir informacin sobre
reclamaciones mientras atienden por telfono al cliente y obtienen
inmediatamente el coste "esperado" de la reclamacin en funcin de los datos
pasados.

Requisitos de campo Debe haber un Objetivo y, al menos, una Entrada. De


forma predeterminada, los campos con los roles predefinidos Ambos o Ninguno
no se utilizan. El destino debe ser continuo (escala). No hay restricciones del
nivel de medicin de los predictores (entradas); los campos categricos (marca,
nominal y ordinal) se utilizan como factores en el modelo y los campos
continuos se usan como covariables.

Objetivos (modelos lineales)


Qu desea hacer?

Crear un modelo nuevo. Crear un modelo totalmente nuevo. ste es el


funcionamiento habitual del nodo.
Continuar entrenando un modelo existente. El entrenamiento contina con
el ltimo modelo creado correctamente por el nodo. Esto permite actualizar un modelo
existente sin tener que acceder a los datos originales. Adems, puede dar como
resultado un rendimiento significativamente ms rpido ya que slo se introducen en la
ruta los registros nuevos o actualizados. Los detalles del modelo anterior se
almacenan con el nodo de modelado, lo que permite utilizar esta opcin incluso si el
nugget de modelo anterior ya no est disponible en la ruta o la paleta de modelos.

Nota: Cuando se habilita esta opcin, se inhabilitan el resto de los controles de


las pestaas Campos y Opciones de creacin.

Cul es su objetivo principal? Seleccione el objetivo apropiado.

Crear un modelo estndar. El mtodo genera un modelo simple para predecir


el destino mediante los predictores. Por lo general, los modelos estndar son ms
fciles de interpretar y pueden puntuarse ms rpido que los conjuntos por aumento,
agregacin auntodocimante o los conjuntos de datos muy grandes.
Nota

Para modelos segmentados, para utilizar esta opcin con Continuar entrenando un
modelo existente debe estar conectado a Analytic Server.

Mejorar la precisin del modelo (aumento). El mtodo genera un modelo de


conjunto mediante el aumento, que genera una secuencia de modelos para obtener
predicciones ms precisas. Se puede tardar ms tiempo en generar y puntuar
conjuntos que un modelo estndar.

El aumento produce una sucesin de "modelos de componente", cada uno de


ellos basados en el conjunto de datos completo. Antes de crear cada modelo
de componente sucesivo, los registros se ponderan en funcin de los residuos
del modelo del componente anterior. Los casos con residuos de grandes
dimensiones tienen ponderaciones de anlisis relativamente superiores para
que el siguiente modelo de componente se centre en predecir correctamente
estos registros. Juntos, estos modelos de componentes forman un modelo de
conjunto. El modelo de conjunto punta algunos registros con una regla de
combinacin; las reglas disponibles dependen del nivel de medicin del
destino.

Mejorar la estabilidad del modelo (agregacin autodocimante). El mtodo


genera un modelo de conjunto mediante la agregacin autodocimante, que genera
varios modelos para obtener predicciones ms fiables. Se puede tardar ms tiempo en
generar y puntuar conjuntos que un modelo estndar.

La agregacin autodocimante produce replicaciones del conjunto de datos de


entrenamiento mediante muestreo con repeticin del conjunto de datos original.
Crea muestras de bootstrap de igual tamao al conjunto de datos original. Es
decir, se crea un "modelo de componente" de cada replicacin. Juntos, estos
modelos de componentes forman un modelo de conjunto. El modelo de
conjunto punta algunos registros con una regla de combinacin; las reglas
disponibles dependen del nivel de medicin del destino.

Crear un modelo para conjuntos de datos muy grandes (requiere IBM


SPSS Modeler Server). El mtodo genera un modelo de conjunto dividiendo el
conjunto de datos en bloques de datos independientes. Seleccione esta opcin si su
conjunto de datos es demasiado grande para construir cualquiera de los modelos
anteriores o para la generacin incremental de modelos. Puede que se tarde menos
tiempo en generar esta opcin, pero se puede tardar ms tiempo en puntuarla que un
modelo estndar. Esta opcin requiere conectividad de IBM SPSS Modeler Server .

Conceptos bsicos (modelos


lineales)
Preparar automticamente datos. Esta opcin permite que el procedimiento
transforme internamente el destino y los predictores para aprovechar al mximo
el poder predictivo del modelo; cualquier transformacin se guarda con el
modelo y se aplica a los nuevos datos para su puntuacin. Las versiones
originales de los campos transformados se excluyen del modelo. De forma
predeterminada, se realiza la siguiente preparacin automtica de datos.

Fecha y hora. Cada predictor de fecha se transforma en un nuevo predictor


continuo que contiene el tiempo transcurrido desde una fecha de referencia (01-01-
1970). Cada predictor de hora se transforma en un nuevo predictor continuo que
contiene el tiempo transcurrido desde una hora de referencia (00:00:00).
Ajustar nivel de medicin. Los predictores continuos con menos de 5 valores
distintos se reestructuran como predictores ordinales. Los predictores ordinales con
ms de 10 valores distintos se reestructuran como predictores continuos.
Tratamiento de valores atpicos. Los valores de los predictores continuos que
recaen ms all de un valor de corte (3 desviaciones estndar de la media) se
establecen con el valor de corte.
Gestin de valores perdidos. Los valores perdidos de los predictores nominales
se sustituyen por el modo de la particin de entrenamiento. Los valores perdidos de
los predictores ordinales se sustituyen por la mediana de la particin de
entrenamiento. Los valores perdidos de los predictores continuos se sustituyen por la
media de la particin de entrenamiento.
Fusin supervisada. Hace un modelo ms parsimonioso reduciendo el nmero
de campos que deben procesarse junto con el destino. Las categoras similares se
identifican en funcin de la relacin entre la entrada y destino. Las categoras que no
son significativamente diferentes; es decir, que tienen un valor p superior al valor 0,1,
se fusionan. Tenga en cuenta que si todas las categoras se combinan en una, las
versiones original y derivada del campo se excluyen del modelo porque no tienen
ningn valor como predictor.

Nivel de confianza. ste es el nivel de confianza que se utiliza para calcular las
estimaciones de intervalos de los coeficientes de modelos en la vista
Coeficientes. Especifique un valor mayor que 0 y menor que 100. El valor
predeterminado es 95.

Seleccin de modelos (modelos


lineales)
Mtodo de seleccin de modelos. Seleccione uno de los mtodos de seleccin
de modelos (a continuacin se encuentran los detalles) o Incluir todos los
predictores, que simplemente introduce todos los predictores disponibles como
trminos del modelo de efectos principales. De forma predeterminada, se utiliza
Pasos sucesivos hacia adelante.

Seleccin de Pasos sucesivos hacia adelante. Comienza sin efectos en el


modelo y aade y elimina efectos paso por paso hasta que ya no se puedan
aadir o eliminar segn los criterios de los pasos sucesivos.

Criterios para entrada/eliminacin. sta es la estadstica utilizada para


determinar si debe aadirse o eliminarse un efecto del modelo. Criterio de informacin
(AICC) se basa en la similitud del conjunto de entrenamiento que se le da al modelo, y
se ajusta para penalizar modelos excesivamente complejos. Estadsticos de F se
utiliza en una prueba estadstica de la mejora en el error de modelo. R cuadrado
corregida se basa en el ajuste del conjunto de entrenamiento, y se ajusta para
penalizar modelos excesivamente complejos. Criterio de prevencin sobreajustado
(ASE) se basa en el ajuste del conjunto (error cuadrtico medio, ASE) de prevencin
sobreajustado. El conjunto de prevencin sobreajustado es una submuestra aleatoria
de aproximadamente 30% del conjunto de datos original que no se utiliza para
entrenar el modelo.

Si se selecciona otro criterio que no sea Estadsticos de F, se aadir al


modelo cada paso del efecto que se corresponda con el aumento positivo
mayor en el criterio. Se eliminar cualquier efecto en el modelo que se
corresponda con una disminucin en el criterio.

Si se selecciona Estadsticos de F como criterio, cada paso en el efecto que


tenga el valor p ms pequeo inferior al umbral especificado, se aadir Incluir
efectos con valores p inferiores a al modelo. El valor predeterminado es 0,05.
Cualquier efecto en el modelo con un valor p superior al umbral especificado,
Eliminar efectos con valores p mayores que, ser eliminado. El valor
predeterminado es 0.10.

Personalizar nmero mximo de efectos en el modelo final. De forma


predeterminada, pueden introducirse todos los efectos disponibles en el modelo. Del
mismo modo, si el algoritmo por pasos sucesivos termina con un paso con el nmero
mximo de efectos especificado, el algoritmo se detiene con el conjunto actual de
efectos.
Personalizar nmero mximo de pasos. El algoritmo por pasos sucesivos
termina tras un cierto nmero de pasos. De forma predeterminada, es 3 veces el
nmero de efectos disponibles. Del mismo modo, especifique un entero positivo para
el nmero mximo de pasos.

Seleccin de mejores subconjuntos. Comprueba "todos los modelos posibles",


o al menos el subconjunto ms grande de los modelos posibles que los pasos
sucesivos hacia adelante, para seleccionar el mejor segn el criterio de
mejores subconjuntos. Criterio de informacin (AICC) se basa en la similitud del
conjunto de entrenamiento que se le da al modelo, y se ajusta para penalizar
modelos excesivamente complejos. R cuadrado corregida se basa en el ajuste
del conjunto de entrenamiento, y se ajusta para penalizar modelos
excesivamente complejos. Criterio de prevencin sobreajustado (ASE) se basa
en el ajuste del conjunto (error cuadrtico medio, ASE) de prevencin
sobreajustado. El conjunto de prevencin sobreajustado es una submuestra
aleatoria de aproximadamente 30% del conjunto de datos original que no se
utiliza para entrenar el modelo.

Se selecciona el modelo con el valor mayor del criterio como el mejor modelo.

Nota

La seleccin de los mejores subconjuntos utiliza ms el sistema que la seleccin de


paso adelante. Cuando los mejores subconjuntos se procesan junto con aumento,
agregacin autodocimante y conjuntos de datos de gran tamao, la generacin de un
modelo estndar generado mediante una seleccin por pasos sucesivos hacia delante
puede tardar considerablemente ms tiempo.
Conjuntos (modelos lineales)
Estos ajustes determinan el comportamiento de la agrupacin que se produce
cuando los conjuntos de datos de gran tamao o de aumento o agregacin
autodocimante son obligatorios en Objetivos. Las opciones no aplicables al
objetivo seleccionado se ignorarn.

Agregacin autodocimante y conjuntos de datos muy grandes. Al puntuar


un conjunto, sta es la regla utilizada para combinar los valores predichos a
partir de los modelos bsicos para calcular el valor de puntuacin del conjunto.

Regla de combinacin predeterminada para objetivos continuos. Los


valores predichos de conjunto para objetivos continuos pueden combinarse mediante
la media o mediana de los valores predichos a partir de los modelos bsicos.

Tenga en cuenta que cuando el objetivo es mejorar la precisin del modelo, se


ignoran las selecciones de reglas de combinacin. El aumento siempre utiliza
un voto de mayora ponderada para puntuar objetivos categricos y una
mediana ponderada para puntuar objetivos continuos.

Aumento y agregacin autodocimante. Especifique el nmero de modelos


bsicos que debe generarse cuando el objetivo es mejorar la precisin o
estabilidad del modelo; en el caso de la agregacin autodocimante, se trata del
nmero de muestras de bootstrap. Debe ser un nmero entero positivo.

Avanzado (modelos lineales)


Replicar resultados. Al establecer una semilla aleatoria podr replicar anlisis.
El generador de nmeros aleatorios se utiliza para seleccionar qu registros se
encuentran en el conjunto de prevencin sobreajustado. Especifique un entero
o pulse en Generar, lo que crear un entero pseudo-aleatorio entre 1 y
2147483647, ambos inclusive. El valor predeterminado es 54752075.

Opciones de modelos (modelos


lineales)
Nombre del modelo. Puede generar el nombre del modelo automticamente
tomando como base los campos objetivo o especificar un nombre
personalizado. El nombre generado automticamente es el nombre del campo
objetivo.

Tenga en cuenta que el valor predicho se calcula siempre cuando se punta el


modelo. El nombre del nuevo campo es el nombre del campo objetivo con el
prefijo $L-. Por ejemplo, para un campo objetivo llamado ventas, el nuevo
campo se llamara$L-ventas.
Resumen del modelo (modelos
lineales)
La vista Resumen del modelo es una instantnea, un resumen visual del
modelo y su ajuste.

Tabla. La tabla identifica algunos parmetros de modelo superior, incluyendo:

El nombre del destino especificado en la pestaa Campos,


Si la preparacin de datos automtica se ha realizado tal como se especifica en
la configuracin de Bsicos,
El criterio de seleccin y el mtodo de seleccin de modelo especificados en la
configuracin de Seleccin de modelo. Tambin se muestra el valor del criterio de
seleccin del modelo final y se presenta en un formato ms reducido y mejor.

Grfico. El grfico muestra la precisin del modelo final, que se presenta en el


formato mayor es mejor. El valor es 100 R 2 ajustado para el modelo final.

Preparacin automtica de datos


(modelos lineales)
Esta vista muestra informacin a cerca de qu campos se excluyen y cmo los
campos transformados se derivaron en el paso de preparacin automtica de
datos (ADP). Para cada campo que fue transformado o excluido, la tabla
enumera el nombre del campo, su rol en el anlisis y la accin tomada por el
paso ADP. Los campos se clasifican por orden alfabtico ascendente de
nombres de campo. Las posibles acciones que se toman en cada campo
incluyen:

Derivar duracin: meses calcula el tiempo transcurrido en meses a partir de los


valores de un campo que contiene las fechas hasta la fecha actual del sistema.
Derivar duracin: horas calcula el tiempo transcurrido en horas a partir de los
valores de un campo que contiene las horas hasta la hora actual del sistema.
Cambiar nivel de medicin de continuo a ordinal reestructura los campos
continuos con menos de 5 valores exclusivos como campos ordinales.
Cambiar nivel de medicin de ordinal a continuo reestructura los campos
continuos con ms de 10 valores exclusivos como campos continuos.
Recortar valores atpicos define los valores de los predictores continuos que
recaen ms all de un valor de corte (3 desviaciones estndar de la media) se
establecen con el valor de corte.
Sustituir valores perdidos sustituye los valores perdidos de los campos
nominales por el modo, los campos ordinales por la mediana y los campos continuos
por la media.
Combinar categoras para aumentar al mximo la asociacin con el destino
identifica categoras de predictor "similares" basadas en la relacin entre la entrada y
el destino. Las categoras que no son significativamente diferentes; es decir, que
tienen un valor p superior al valor 0,05, se fusionan.
Excluir predictor constante / despus del tratamiento de los valores atpicos /
despus de fusionar categoras elimina los predictores que tiene un nico valor,
posiblemente despus de tomar otras acciones ADP.

Importancia de predictor (modelos


lineales)
Es normal centrar los esfuerzos de modelado en los campos predictores ms
importantes y valorar la omisin de aquellos con menor relevancia. El grfico
de importancia de los predictores le ayuda a hacerlo indicando la importancia
relativa de cada predictor en la estimacin del modelo. Como los valores son
relativos, la suma de valores de todos los predictores de la visualizacin es 1.0.
La importancia del predictor no est relacionada con la precisin del modelo.
Slo est relacionada con la importancia de cada predictor a la hora de realizar
una prediccin, no con si la prediccin es o no precisa.

Predicho por observado (modelos


lineales)
Muestra un diagrama de dispersin en intervalos de los valores predichos en el
eje vertical por los valores observados en el eje horizontal. Idealmente, los
puntos deben basarse en una lnea de 45 grados; esta vista indica si hay algn
registro predicho de manera incorrecta en el modelo.

Residuos (modelos lineales)


Muestra un grfico de diagnosis de los residuos del modelo.

Estilos de grfico. Existen varios estilos de visualizacin diferentes, que son


accesibles desde la lista desplegable Estilo.

Histograma. Se trata de un histograma en intervalos de los residuos


estudentizados de una superposicin de la distribucin normal. Los modelos lineales
asumen que los residuos tienen una distribucin normal, de forma que el histograma
debera estar muy cercano a la lnea continua.
Grfico p-p. Se trata de un grfico probabilidad-probabilidad en intervalos que
compara los residuos estudentizados con una distribucin normal. Si la curva de los
puntos representados es menos pronunciada que la lnea normal, los residuos
muestran una variabilidad mayor que una distribucin normal; si la curva es ms
pronunciada, los residuos muestran una variabilidad inferior que una distribucin
normal. Si los puntos representados tienen una curva con forma en S, la distribucin
de los residuos es asimtrica.

Valores atpicos (modelos lineales)


Esta tabla enumera los registros que ejercen una influencia excesiva sobre el
modelo, y muestra el ID de registro (si se especifica en la pestaa Campos), el
valor objetivo y la distancia de Cook. La distancia de Cook es una medida de
cunto cambiaran los residuos de todos los registros si un registro en particular
se excluyera del clculo de los coeficientes del modelo. Una distancia de Cook
grande indica que la exclusin de un registro cambia sustancialmente los
coeficientes, y por lo tanto debe considerarse relevante.

Los registros relevantes deben examinarse cuidadosamente para determinar si


puede darles menos importancia en la estimacin del modelo, truncar los
valores atpicos a algn umbral aceptable o eliminar los registros relevantes
completamente.

Efectos (modelos lineales)


Esta vista muestra el tamao de cada efecto en el modelo.

Estilos. Existen varios estilos de visualizacin diferentes, que son accesibles


desde la lista desplegable Estilo.

Diagrama. Es un grfico en el que los efectos se clasifican desde arriba hacia


abajo con una importancia de predictores descendente. Las lneas de conexin del
diagrama se ponderan tomando como base la significacin del efecto, con un grosor
de lnea mayor correspondiente a efectos con mayor significacin (valores p
inferiores). Al pasar el ratn por encima de una lnea de conexin muestra la
informacin sobre herramientas que muestra el valor de p y la importancia del efecto.
Este es el mtodo predeterminado.
Tabla. Se trata de una tabla ANOVA para el modelo completo y los efectos de
modelo individuales. Los efectos individuales se clasifican desde arriba hacia abajo
con una importancia de predictores descendente. Tenga en cuenta que, de forma
predeterminada, la tabla se contrae para mostrar nicamente los resultados del
modelo global. Para ver los resultados de los efectos del modelo individual, pulse la
casilla Modelo corregido en la tabla.

Importancia del predictor. Existe un control deslizante Importancia del


predictor que controla qu predictores se muestran en la vista. Esto no cambia
el modelo, simplemente le permite centrarse en los predictores ms
importantes. De forma predeterminada, se muestran los 10 efectos ms
importantes.

Significacin. Existe un control deslizante Significacin que controla an ms


qu efectos se muestran en la vista, a parte de los que se muestran tomando
como base la importancia de predictor. Se ocultan los efectos con valores de
significacin superiores al valor del control deslizante. Esto no cambia el
modelo, simplemente le permite centrarse en los efectos ms importantes. El
valor predeterminado es 1.00, de modo que no se filtran efectos tomando como
base la significacin.

Coeficientes (modelos lineales)


Esta vista muestra el valor de cada coeficiente en el modelo. Tenga en cuenta
que los factores (predictores categricos) tienen codificacin de indicador
dentro del modelo, de modo que los efectos que contienen los factores
generalmente tendrn mltiples coeficientes asociados: uno por cada
categora exceptuando la categora que corresponde al parmetro (de
referencia) redundante.

Estilos. Existen varios estilos de visualizacin diferentes, que son accesibles


desde la lista desplegable Estilo.

Diagrama. Es un grfico que muestra la interceptacin primero, y luego


clasifica los efectos desde arriba hacia abajo con una importancia de predictores
descendente. Dentro de los efectos que contienen factores, los coeficientes se
clasifican en orden ascendente de valores de datos. Las lneas de conexin del
diagrama se colorean en funcin del coeficiente (consulte la clave del diagrama) y se
ponderan tomando como base la significacin del coeficiente, con un grosor de lnea
mayor correspondiente a coeficientes con mayor significacin (valores p inferiores). Al
pasar el ratn por encima de una lnea de conexin se muestra la informacin sobre
herramientas que muestra el valor del coeficiente, su valor p y la importancia del efecto
con el que se asocia el parmetro. Este es el estilo predeterminado.
Tabla. Muestra los valores, las pruebas de significacin y los intervalos de
confianza para los coeficientes de modelos individuales. Tras la interceptacin, los
efectos se clasifican desde arriba hacia abajo con una importancia de predictores
descendente. Dentro de los efectos que contienen factores, los coeficientes se
clasifican en orden ascendente de valores de datos. Tenga en cuenta que, de forma
predeterminada, la tabla se contrae para mostrar nicamente el coeficiente, la
significacin y la importancia de cada parmetro del modelo. Para ver el error
estndar, estadstico t y el intervalo de confianza, pulse la casilla Coeficiente en la
tabla. Al pasar el ratn por encima del nombre de un parmetro de modelo en la tabla
se muestra la informacin sobre herramientas con el nombre del parmetro, el efecto
con el que se asocia el parmetro y (en los predictores categricos) las etiquetas de
valor asociadas con el parmetro del modelo. Puede ser especialmente til para ver
las nuevas categoras creadas cuando la preparacin de datos automtica fusiona
categoras similares de un predictor categrico.

Importancia del predictor. Existe un control deslizante Importancia del


predictor que controla qu predictores se muestran en la vista. Esto no cambia
el modelo, simplemente le permite centrarse en los predictores ms
importantes. De forma predeterminada, se muestran los 10 efectos ms
importantes.

Significacin. Existe un control deslizante Significacin que controla an ms


qu coeficientes se muestran en la vista, a parte de los que se muestran
tomando como base la importancia de predictor. Se ocultan los coeficientes con
valores de significacin superiores al valor del control deslizante. Esto no
cambia el modelo, simplemente le permite centrarse en los coeficientes ms
importantes. El valor predeterminado es 1.00, de modo que no se filtran
coeficientes tomando como base la significacin.

Medias estimadas (modelos lineales)


Son grficos representados para predictores significativos. El grfico muestra el
valor estimado de modelo del objetivo en el eje vertical de cada valor del
predictor en el eje horizontal, que alberga el resto de los predictores
constantes. Proporciona una visualizacin til de los efectos de los coeficientes
de cada predictor en el objetivo.

Note: si no hay predictores significativos, no se generan medias estimadas.

Resumen de creacin de modelos


(modelos lineales)
Cuando se selecciona un algoritmo de seleccin de modelos que no sea
Ninguno, proporciona algunos detalles del proceso de creacin del modelo.

Pasos sucesivos hacia adelante. Cuando la seleccin por pasos hacia


adelante es el algoritmo de seleccin, la tabla muestra los ltimos 10 pasos en
el algoritmo de seleccin por pasos hacia adelante. Para cada paso, se
muestran el valor del criterio de seleccin y los efectos en el modelo en ese
paso. Esto ofrece el sentido del grado de contribucin de cada paso al modelo.
Cada columna le permite clasificar las filas, de modo que es posible ver con
mayor facilidad qu efectos hay en un paso en particular.

Mejores subconjuntos. Cuando Mejores subconjuntos es el algoritmo de


seleccin, la tabla muestra los 10 modelos principales. Para cada modelo, se
muestran el valor del criterio de seleccin y los efectos en el modelo. Esto
ofrece un sentido de la estabilidad de los modelos principales; si tienden a
tener muchos efectos similares con pocas diferencias, puede tenerse una
confianza casi completa en el modelo "principal"; si tienden a tener muchos
efectos diferentes, algunos efectos pueden ser demasiado parecidos y
deberan combinarse (o eliminar uno). Cada columna le permite clasificar las
filas, de modo que es posible ver con mayor facilidad qu efectos hay en un
paso en particular.

Configuracin (modelos lineales)


Tenga en cuenta que el valor predicho se calcula siempre cuando se punta el
modelo. El nombre del nuevo campo es el nombre del campo objetivo con el
prefijo $L-. Por ejemplo, para un campo objetivo llamado ventas, el nuevo
campo se llamara$L-ventas.

Generar SQL para este modelo Cuando se utilizan datos de una base de datos,
se puede devolver cdigo SQL a la base de datos para su ejecucin, lo que
proporciona un mayor rendimiento para muchas operaciones.

Seleccione una de las siguientes opciones para especificar cmo se lleva a


cabo la generacin de SQL.
Valor predeterminado: Puntuar utilizando el adaptador de puntuacin del
servidor (si est instalado) de lo contrario en curso Si se conecta a una base de datos
con un adaptador de puntuacin instalado, se genera SQL con el adaptador de
puntuacin y las funciones definidas por el usuario (UDF) asociadas y se punta el
modelo dentro de la base de datos. Si no hay ningn adaptador de puntuacin
disponible, esta opcin capta los datos de la base de datos y los punta en SPSS
Modeler.
Puntuar convirtiendo a SQL nativo Si selecciona esta opcin, se genera SQL
para puntuar el modelo dentro de la base de datos.

Nota

aunque esta opcin puede proporcionar resultados ms rpidos, el tamao y la


complejidad del SQL nativo aumenta a medida que lo hace la complejidad del modelo.

Puntuar fuera de la base de datos Si se selecciona, esta opcin capta los datos
de la base de datos y los punta en SPSS Modeler.
EL MODELO LINEAL
DEFINICIN DE MODELO LINEAL
UTILIDAD
ESPECIFICACIN DEL MODELO
HIPOTESIS BSICAS DEL MODELO LINEAL
ESTIMACIN DEL MODELO Y PREDICCIN
DISTRIBUCIN DE LOS ESTIMADORES DE LOS PARAMETROS DEL
MODELO LINEAL
INFERENCIA SOBRE EL MODELO LINEAL : Inferencia sobre un
parmetro.Contraste de hiptesis sobre un regresor.Contrastes lineales sobre
un conjunto de regresores.Contraste de significacin de los
regresores.Contraste de validez del modelo/ significacin general/ Anova
PREDICCIN DE UN VALOR EXTRAMUESTRAL

Complementos

(Notacin matricial)(Formas lineales y cuadrticas:-derivacin)


Cuestiones previas sobre la regresin mnimo cuadrtica
Teorema de Cochran

MODELO LINEAL

Puede definirse como un esquema de relacin entre una variable Y (EXGENA O A


EXPLICAR) y otra(s) variable(s) X (X1X2 ... Xk ) (endgena(s) o explicativa(s), tal que:

Y= F.LINEAL (X) + PERTURBACIN ALEATORIA

(Modelo Lineal Simple)

Y= F.LINEAL (X1X2 ... Xk ) + PERTURBACIN ALEATORIA

(Modelo Lineal General)

Las hiptesis (bsicas) que se asuman sobre la perturbacin aleatoria permitirn realizar
el anlisis estadstico inferencial

Las razones para la introduccin de una perturbacin aleatoria, son fundamentalmente:

1.efecto de variables no consideradas


2.efectos imprevistos (catastrofes,modas,etc.)
3.errores de observacin o medicin.

UTILIDADES DEL MODELO LINEAL:

1.verificar la existencia de la relacin lineal.


2.estimar (contrastar) la (una) relacin lineal concreta (estructural).- supone actuar sobre
los coeficientes de la relacin lineal.

3.predecir la variable y en funcin de x o (x1x2 ... xk )

ESPECIFICACIN DEL MODELO

NOTACIONES ALTERNATIVAS:

La informacin recogida hace referencia a n periodos de tiempo, o n localizaciones


espaciales.Entonces, la relacin (terica) segn el modelo entre las variables sera:

M.L.S.: yi= + xi + i para i= 1,2,3,..., n

M.L.G.: yi = 0+ 1x1i + 2x2i + . . . + kxki+ i para i= 1,2,...,n

puede expresarse tambin matricialmente:

y = X + donde:

Y EN EL Modelo lineal simple

HIPTESIS BSICAS DEL MODELO LINEAL

Sobre el modelo lineal:

M.L.S.:

yi= + xi + i para i= 1,2,3,..., n


M.L.G.:

yi = 0+ 1x1i + 2x2i + . . . + kxki+ i para i= 1,2,...,n

que tambin pueden expresarse matricialmente como: y = X +

que establece la relacin terica entre las n observaciones de variable exgena y las de
la(s) endgena(s).

Consideramos adems las siguientes hiptesis bsicas:

1 i i sigue una N (0, ) las perturbaciones aleatorias se distribuyen normalmente


con media cero y desviacin tpica (varianza) constante (homoscedasticidad) en todos
los periodos o localizaciones considerados.

2 i j D(i j) = 0 Las n perturbaciones aleatorias estn incorrelacionadas ( al ser


normales, son independientes).

(hiptesis de no autocorrelacin)

Como consecuencia de estas dos hiptesis: sigue una Nn(0; 2 I)

3 La variable x (las variables x1,x2, . . .,xk) es (son) de naturaleza no aleatoria. Adems


sus valores son independientes de la perturbacin aleatoria.Y en el caso del M.L.G. las
variables x1,x2, . . .,xk estn incorrelacionadas (hiptesis de ausencia de
multicolinealidad)

Como consecuencia de estas hiptesis tendremos que el comportamiento terico de las


observaciones de y deber ser tal que:

yi sigue una N( + xi; ) con D(yiyj) = 0 i j en el M.L.S.

yi sigue una N(0 + 1x1i+ . . . + kxki ; ) con D(yiyj) = 0 i j en el M.L.G.

y por lo tanto, para cualquiera de los dos casos la distribucin conjunta del vector de
observaciones:
y sigue una Nn( X ; 2 I )

A partir de estas hiptesis podremos considerar que los valores observados de la


variable y son "como si fueran" datos muestrales de una poblacin normal de las
caractersticas sealadas arriba y podremos plantearnos realizar inferencias sobre los
parmetros ( y ,en el M.L.S. o 0,1, . . .,k y en el caso del M.L.G.)

ESTIMACIN DEL MODELO Y PREDICCIN PUNTUAL

ir a modelo lineal

Nos plantemos, en primer lugar construir un estimador del modelo (esto es , del valor
terico de yi) con la pretensin fundamental de obtener a partir del modelo estimado
predictores puntuales de y para situaciones no observadas (supuestos ciertos valores de
x).

Vamos buscando un estimador del tipo:

Empleando el mtodo de mxima verosimilitud para obtener los E.M.V. de en


M.L.S. tendremos que:

La funcin de densidad de cada dato yi ser:

y por tanto la f. de verosimilitud para el conjunto de los n datos :

Tomando logaritmos e igualando a cero las derivadas parciales con respecto a a,b,s
obtendramos los tres E.M.V:

Es decir, se obtiene como resultado de la estimacin mximo verosmil que los


estimadores de los parmetros son los coeficientes de la regresin mnimo cuadrtica y
el estimador de la varianza de la perturbacin, la varianza residual muestral.

Quedando el modelo estimado como:

y el predictor para un periodo extramuestral:

Puede probarse que el E.M.V. del vector de parmetros del M.L.G.tambin coincide
con el vector obtenido por ajuste mnimo cuadrtico:

Siendo tambin la varianza residual muestral el E.M.V. de la varianza de la perturbacin


DISTRIBUCIONES DE LOS ESTIMADORES

Con el objeto de poder realizar inferencias (estimaciones por intervalo y contrastes de


hiptesis) sobre los parmetros analizaremos las distribuciones que tienen los
estimadores obtenidos (E.M.V coincidentes con los E.M.C.O.)

Consideramos los estimadores del M.L.G. que luego particularizaremos para el


M.L.S..Llamemos al estimador del vector (parmetros) ; b.

El vector b de estimadores (M.C./M.V.) es como sabemos:

b= (X'X)-1X'y

Esto es,ser una funcin lineal del vector aleatorio n-dimensional y . Como el vector y
sigue una Nn (X ;2 I) la distribucin de b ser normal y como es un vector formado
por k+1 (nmero de variables + 1) estimadores: la distribucin de b ser normal (k+1)-
dimensional.

Su vector de medias vendr dado por:

E(b)=E[(X'X)-1X'y ]= (X'X)-1X' E(y)=

=(X'X) -1X'E(X+) = + E() = de modo que los estimadores de los coeficientes


son INSESGADOS

Su matriz de varianzas vendr dada por:

D2(b)= D2 ((X'X) -1X'y)=D2 [(X'X)-1X'(X+)]=D2 [((X'X) -1 X'X ) +(X'X) -1


X' ]=

D2 [(X'X)-1X'] =(X'X)-1X' D2() [(X'X)-1X']'=(X'X) -1X' .D2(). X(X'X) 1 =

=2 .[ (X'X) -1X' I X(X'X) 1 ] = 2 . (X'X) -1

de forma que b Nk+1 [ ; s2 (X'X)-1]

En el caso del M.L.S. el vector de estimadores era, como sabemos:


y la matriz (X'X)-1 era:

De modo que la distribucin conjunta de los estimadores a,b ser:

De donde obtenemos que :

Siendo la covarianza entre ambos estimadores:

Para estudiar la distribucin del estimador de s2 , la varianza residual que en el caso


general para k variables (M.L.G.) tomaba la expresin:

Sr2= 1/n (yi- b0- b1x1- . . . - bkxk)2 =

=1/n (y- Xb)'( y-Xb)

Consideraremos una variable derivada de este estadstico la variable:

nSr2/ 2= (1/2 ) (yi- b0- b1x1- . . . - bkxk)2 =(1/2) (y- Xb)'( y-Xb)

Tengamos en cuenta que el vector de residuos muestrales ,e=y-Xb es un vector n-


dimensional que se obtiene a travs de una transformacin lineal de dos vectores
normales (y b):Por tanto su distribucin ser normal.

No es dificil probar que tiene por vector de medias el vector 0 y por matriz de varianzas
la matriz M=[ I -X(X'X)-1X] que tiene por rango k+1 y la propiedad de ser idempotente
MM=M'M=M.

Tampoco es costoso ver que la relacin entre el vector de residuos muestrales y el de


perturbaciones aleatorias es: e=M
De esta manera que el estadstico nSr2/ 2 puede verse como:

nSr2/ 2=(1/2) (y- Xb)'( y-Xb)= (1/2 ) .e'e=(1/2 ) 'M'M=

=(1/s2 )'M=(1/2 ) (') - (1/2 )('X(X'X)-1X')

X' es un vector aleatorio k+1 dimensional tal que X'N(0,2(X'X))

de forma que,aplicando el teorema de Cochran:

1/2 (') sigue una chi2 con n grados de libertad

y 1/2('X(X'X)-1X') sigue una chi2 con (k+1) grados de libertad

y a partir de este resultado es facil probar que:

nSr2/2sigue una chi2 con (n -k-1) grados de libertad

(En particular para el caso del M.L.S k=1 ,de forma que:

nSr2/2 sigue una chi2 con (n -2) grados de libertad)

Este ltimo resultado es, no slo importante en s mismo sino que tambin
tiene efectos sobre las
inferencias de los estimadores de .

En efecto, como sabemos b sigue Nk+1 [ ; s2 (X'X)-1]

de modo que la distribucin marginal de cada estimador de cada parmetro


j, bj ser:

bj sigue N [ j ; ajj]

donde ajj es la raiz cuadrada de el elemento j-j de la matriz (X'X)-1

Como el parmetro es desconocido es conveniente encontrar una distribucin que


no dependa de .

Es fcil ver que el estadstico:


(Al valor que est dividiendo a la diferencia (bj-j) se le llama error standard del
estimador y se le suele representar por Sbj)

Lo que para el M.L.S. supone que:

INFERENCIAS SOBRE EL MODELO LINEAL

Inferencia sobre un parmetro.

Contraste de hiptesis sobre un regresor.

Contrastes lineales sobre un conjunto de regresores.

Contraste de significacin de los regresores.

Contraste de validez del modelo/ significacin general/ Anova

Inferencias sobre un parmetro

Teniendo en cuenta los resultados anteriores resulta sencillo disear los mtodos para la
realizacin de inferencias sobre uno de los "regresores", j .

Intervalo de confianza (1-) para j:

teniendo en cuenta que:

si llamamos Sbj al error standard del estimador ,esto es, a todo lo que divide a (bj-j) en
la expresin anterior; el intervalo de confianza para j resulta (para un N.C. de 1-):

j [bj - t/2 Sbj ; bj + t/2 Sbj] con (1-) de confianza

Para el caso particular del M.L.S. los intervalos de confianza para los coeficientes a y b
sern respectivamente:
Ejemplo: En el ejemplo visto con anterioridad: El regresor para la primera variable
explicativa (precio por kilo)e ra b2=-1.44765.La raiz cuadrada del elemento 2,2 de
(X'X)-1, a22=(0.000746)1/2=0.027313,la "cuasi-desviacin tpica residual":Sr (n/n-k-1)1/2=
8.451406,de forma que que el error standard del estimador es: Sb2= 0.230912

Si queremos construir un intervalo de confianza para un nivel del 99%: t0.005 (12-2-1
g.l.)=3.25 de forma que el intervalo quedar:

b2[-1.44765- 3.25. 0.230912 ; 1.44765+ 3.25. 0.230912 ]

b2[-2.198114; 0.697186]

Contrastes de hiptesis sobre un regresor.

Basndonos en la distribucin de (bj-j)/ Sbj podremos igualmente contrastar hiptesis


sobre el regresor j

Si la hiptesis nula es: Ho: j= j* ya sea la alternativa uni o bilateral, el estadstico (bj-
j* )/ Sbj ,supuesta cierta la hiptesis nula tendr una distribucin t de Student(con n-k-1
g.l.) y podremos disear el contraste de la manera habitual que ya conocemos.

ejemplo

Contrastes lineales sobre un conjunto de regresores.

En muchos casos prcticos podemos estar interesado en contrastar una hiptesis no ya


sobre el valor que toma un regresor,sino sobre cmo se comportan un conjunto de
varios regresores.Si la hiptesis a contrastar consiste en que un conjunto de regresores
verifican una cierta relacin lineal esto puede llevarse a cabo a partir del procedimiento
general que exponemos a continuacin:

Una o varias relaciones lineales entre un conjunto de regresores puede expresarse de


forma general de la siguiente manera:
D = h
Donde el vector (k+1) dimensional es el vector de parmetros (regresores) del
modelo;h es un vector r-dimensional ,donde r es el nmero de relaciones lineales que
estamos considerando; y, por ltimo la matriz D de dimensin (rk+1) es una matriz de
coeficientes.

As por ejemplo si queremos expresar sobre un modelo con 4 regresores (0,1,2,3)las


siguientes 2 relaciones lineales:

1+2= 1 y 1-23= 0 podr hacerse como:

Teniendo en cuenta esto es facil ver que la hitesis nula de que un conjunto de
regresores verifican una o ms relaciones lineales puede expresarse como:

H0: D = h

Es igualmente sencillo probar que si pre-multiplicamos el vector de estimadores b por


la matriz D el resultado ser un vector aleatorio

r-dimensional cuya distribucin ser normal ya que es una transformacin lineal (forma
lineal) del vector b que segua una distrucin normal:

(b --> N [ ; (X'X)-1])
k+1
2

El vector de medias del vector Db ser E(Db)=DE(b)=D=h (siempre que la


hiptesis sea cierta).

y la matriz de varianzas ser

Var (Db)= D.Var (b) D'= 2 D(X'X)-1D'

As pues, si la hiptesis nula es cierta: Db --> N [ h , D(X'X) D']


r
2 -1

Puede apreciarse que la distribucin de este estadstico vectorial depende del parmetro
desconocido .Para evitar este problema puede actuarse de la siguiente manera:

Aplicando el teorema de Cochran es inmediato que la forma cuadrtica:

1/2. (Db-h)' [D(X'X)-1D']-1 (Db-h) sigue una 2 con r grados de libertad

Si consideramos que 1/2 . e'e sigue una 2 con n-k-1 g.l.


y asumiendo la independencia entre ambas variables aleatorias:

el estadstico:

Bajo el supuesto de que la hiptesis nula es cierta.

As pues evaluando este estadstico y comparandolo con el valor crtico correspondiente


para el nivel de significacin requerido:

si F > Frechazaremos la hiptesis que supone la presencia de esa relacin lineal, y en


caso contrario, la aceptaremos

ejemplo

Contrastes de significacin de los regresores

Un tipo particularmente importante de contrastes de hiptesis sobre los regresores (ya


sea sobre 1 o sobre varios de ellos) es el contraste de la hiptesis nula de que el (o los)
regresor(es) considerado(s) son cero frente a la alternativa bilateral de que son distintos
de cero.En estos casos, si llegamos a rechazar la hiptesis nula quedar establecido que
el regresor es significativo queriendo decirse que existir una relacin lineal
significativa entre la variable a explicar y la(s) variable(s) explicativa asociada al
regresor (o regresores) sujeto(s) a debate.

Suele llamarse contraste de significacin a este tipo de contraste.Cuando se trata de un


contraste individual se llevar a cabo mediante un contraste t de Student bilateral.

Una medida de la significacin o significatividad de un parmetro (regresor) suele darse


a travs del valor del nivel de significacin necesario para rechazar la hiptesis de
nulidad;de forma que cuanto ms pequeo sea este valor ms significativo es el
regresor.

Un caso particular importante de los contrastes de significacin es aquel en el que se


consideran (a la vez)todos los regresores (excepcin hecha del termino
independiente).Este contraste constituye una prueba de la validez global del modelo y
recibe el nombre de "contraste de significacin general", de validez general (y, tambin
de anlisis de la varianza de la regresin)
Contraste de validez general (significacin general)(ANOVA)

Como acabamos de comentar se trata de anlizar la significacin de todos los regresores


a la vez, lo que equivale a analizar la validez general del modelo,la fuerza de la relacin
lineal existente entre la variable y y las variables x,la significacin de la correlacin
lineal mltiple; todo ello es equivalente.

Como tambin hemos comentado se trata, en el fondo de contrastar la hiptesis:

H0: 1=2=3=. . . = k= 0

Podemos plantearlo, exactamente igual que el contraste general de hiptesis lineales


sobre un conjunto de regresores.

H0: D = h

Aqu la matriz D sera la matriz identidad de orden k (con 1 elemento menos que el
nmero total de parmetros k+1) y el vector h sera el vector 0 de orden k.

Pudindose expresar la hiptesis como:

H0:Ik = 0k

y si llamamos al vector de orden k formado por los regresores excluyendo el trmino


independiente podemos expresar la hiptesis como: (igualmente a su estimador lo
llamamos b y llamamos X a la matriz de los datos de x excluida la primera columna de
unos)

H0: = 0

Al ser la matriz D la identidad y el vector h el vector cero, el estadstico del contraste


quedara:
Si tenemos en cuenta que la regresin muestral era: Xb=y* y que pasaba por el centro
de gravedad, entonces: b' X' X b ser n veces la varianza debida a la regresin:

b' X' X b = n S2y*=n S2yR2 . (Donde R2 es el coeficiente de determinacin muestral)

Por otro lado:e'e es n veces la varianza residual:

e'e= n Sr2 = n Sy2(1- R2).

A partir de estos dos hechos es muy facil ver que el estadstico del contraste queda
como:

Que bajo el supuesto de la hiptesis nula seguir una distribucin Fk,n-k-1

Es interesante observar que en el caso del M.L.S. , con k=1, y ante la coincidencia del
coeficiente de determinacin y el cuadrado del coeficiente de correlacin, nos
encontramos con el estadstico del contraste de incorrelacin, cuya distribucin no
probamos y aqu haya una demostracin.

El planteamiento de este contraste admite un esquema ANOVA, en el siguiente sentido:


La variacin total (muestral) de la y (nSy2) puede descomponerse en variacin debida a
la regresin

( b'X'Xb = n S2y*=n Sy2R2 ) ms la variacin residual o no explicada

(e'e= n Sr2 = n Sy2(1- R2)).

PREDICCIN DE UN VALOR EXTRAMUESTRAL.-PREDICCIN POR


INTERVALO

Ya vimos que la prediccin puntual de un valor de y extramuestral se llevaba a cabo


utilizando como predictor el modelo estimado aplicado sobre los valores futuros de las
variables explicativas.

De manera general podramos expresarlo de la siguiente forma:


Donde x'0 es el vector fila formado por los valores futuros de las variables explicativas:
x'0 = ( 1 x10 x20 . . . xk0 )

Este predictor es una transformacin lineal del vector aleatorio b de los estimadores del
vector de regresores b .Ademas la dimensin del predictor es 1, por lo que ser una
variable aleatoria Normal.

Ademas su media ser: E(x'0 b)= x'0 E(b) =x'0 b esto es, el valor terico esperado en el
futuro para la variable y (el predictor es insesgado).

Por otro lado su varianza ser:

Var(x'0b)=x'0 Var(b)x0 = s 2 x'0 (X'X)-1x0

As pues la distribucin del predictor es:

Distribucin que depende del parmetro desconocido s .Este problema puede


solventarse construyendo el estadstico

Que tendr una distribucin F de Snedecor con 1 y n-k-1 g.l..

Como tanto x'0 (X'X)-1x0 ; como x'0b ; como el predictor son escalares podemos expresar
este estadstico como:

Y como la raiz cuadrada de una variable F1,n-k-1 es una variable t de Student con n-k-1
g.l., tendremos que:
A partir de este estadstico es sencillo construir un intervalo para la prediccin esperada
segn el modelo, dado un nivel de confianza prefijado (1- a):

Donde ta/2 es el correspondiente valor tabulado para n-k-1 g.l.

Es interesante ver cmo quedara el intervalo de prediccin en el caso de un M.L.S.:

Tras realizar las operaciones pertinentes acaba quedando un intervalo para el valor
futuro de y (terico segn el modelo):

Donde ta/2 es el valor tabulado para n-2 grados de libertad.

COMPLEMENTOS
ESPECIFICACIN DEL MODELO

NOTACIONES ALTERNATIVAS:

La informacin recogida hace referencia a n periodos de tiempo, o n localizaciones


espaciales.Entonces, la relacin (terica) segn el modelo entre las variables sera:

M.L.S.: yi= + xi + i para i= 1,2,3,..., n


M.L.G.: yi = 0+ 1x1i + 2x2i + . . . + kxki+ i para i= 1,2,...,n

puede expresarse tambin matricialmente:

y = X + donde:

Y EN EL Modelo lineal simple

Formas lineales y cuadrticas ; su derivacin.

FORMA LINEAL:

sea a un vector columna de constantes de Rn

sea x un vector columna de variables de Rn

una forma lineal es entonces f(x)= x' a = a' x = ai xi

FORMA CUADRTICA:

Si A es una matriz cuadrada de orden n

una forma cuadrtica es entonces:

Q(x)= x' A x = aij xi xj


Tanto f como Q son funciones que hacen corresponder vectores de R n con
valores (escalares) de R.

DERIVACIN VECTORIAL DE F. LINEALES Y CUADRTICAS:

puede probarse que la derivada vectorial de una f. lineal es:

y que la derivada vectorial de una forma cuadrtica es:

EN EL CASO DE QUE A SEA UNA MATRIZ SIMTRICA:

( A' + A)= 2A Y LA DERIVADA RESULTA SER: 2Ax

CUESTIONES PREVIAS SOBRE LA REGRESIN (MUESTRAL)


MNIMO-CUADRTICA:

Recordemos que el mtodo de ajuste por "mnimos cuadrados "a una

recta y= a + b x se basaba en obtener como coeficientes a,b aquellos valores que :

min (a,b)= min (yi- a - bxi)2

y que el resultado de tal ajuste acababa siendo:

Igualmente para el caso multidimensional la ecuacin de ajuste mnimo cuadrtico y =


b0+b1x1+. . . +bkxk

que matricialmente puede expresarse (si la extendemos para los n datos disponibles)
como: y= Xb

la podremos obtener

min ( b0,b1, . . . ,bk) = min (yi- b0- b1x1- . . . - bkxk)2

esto es: min ( b)= min (y - Xb )' (y - Xb )


de forma que el vector de coeficientes b que nos dar la ecuacin de ajuste mnimo-
cuadrtico ser tal que igualar a cero la derivada parcial de ( b) con respecto a b :

( b)= (y - Xb )' (y - Xb ) = y'y - (Xb)'y - y'(Xb)+(Xb)'(Xb) =


= y'y - b'X'y - y'X b + b'X'X b = y'y - 2 b'X'y + b'X'X b

por lo que la derivada parcial de ( b) con respecto a b acaba siendo:

-2 X'y + 2 X'X b que si la igualamos a cero nos dar la solucin del ajuste
mnimo-cuadrtico:

-2 X'y + 2 X'X b= 0 b= (X'X)-1 X'y

de forma que el vector de coeficientes que nos da el ajuste a un hiperplano que


minimiza la suma de los cuadrados de los residuos es:

es facil comprobar que en el caso de la regresin simple los coeficientes de la recta de


regresin mnimo-cuadrtica verifican tambin esa relacin:

en efecto en el caso de la regresin simple tenemos:

de manera que X'X ser:

y su inversa (X'X )-1 =


y por otro lado X'y sera:

por lo que el vector (X'X)-1 X'y acaba siendo:

es decir los valores de los coeficientes a y b que ya conocemos.

RECORDEMOS, en otro orden de cosas,que la VARIANZA RESIDUAL era uno de


los indicadores de la calidad del ajuste tanto en el caso de la REGRESIN SIMPLE
como de la LA MLTIPLE, y se defina como: Sr2= 1/n (yi- a -bxi)2 en el caso de la
R.simple

Sr2= 1/n (yi- b0- b1x1- . . . - bkxk)2

en el caso de la R. mltiple

y matricialmente Sr2= 1/n (y- Xb)'( y-Xb)

En el caso de la regresin simple : Sr2= Sy2(1 - r2) = Sy2 - r2.Sy2

y en el caso de la regresin mltiple: Sr2= Sy2 (1 - R2) = Sy2 - R2.Sy2

donde r y R son respectivamente el coeficiente de correlacin entre x e y y el coeficiente


de correlacin mltiple entre y, y las xi (a sus cuadrados se les llama coeficiente de
determinacin)

You might also like