Professional Documents
Culture Documents
ndice
[ocultar]
Por lo tanto, se puede ver que el aspecto "lineal" del modelo implica lo siguiente:
Modelos polinomiales[editar]
Los modelos lineales sirven para estimar modelos polinomiales. Por ejemplo, si las
potencias de una variable explican la variable endgena, el modelo sera:
Modelos multinomiales[editar]
Tambin podemos recurrir a los modelos lineales para estimar modelos multinomiales.
Un ejemplo es el siguiente:
El estimador mnimo cuadrtico es aquel que hace mnima la suma de los cuadrados de
estos errores. Esta suma es:
las llamadas ecuaciones normales que tiene que verificar el valor de que hace
mnima la suma de los cuadrados de los errores.
Insesgado[editar]
Si los errores -que son variables aleatorias- son insesgados , el estimador mnimo-
cuadrtico tambin lo es:
Es importante que incluyamos en el modelo todos los factores relevantes: si falta
alguno, es posible que los errores no tengan media cero y el estimador de los
coeficientes ser sesgado. No obstante, cualquier buen modelo lineal ayuda a
comprender un fenmeno y a hacer buenas estimaciones. Si incluimos factores de
influencia dudosa, tambin podemos provocar un sesgo en el estimador mnimo-
cuadrtico. Desde hace muchos aos, existe una teora de inferencia en modelos lineales
que nos permite decidir -con un pequeo margen de error- si un factor es o no relevante.
Residuos[editar]
Los errores cometidos por el modelo cuando se usa el verdadero valor del parmetro son
donde, de nuevo, las cantidades t son variables aleatorias que representan las
innovaciones o nuevos efectos aleatorios que aparecen en un instante determinado pero
solo afectan a X en lo sucesivo de la serie. En este contexto, el trmino modelo lineal se
refiere a la estructura de la relacin que representa a Xt como una funcin lineal de los
valores anteriores de la misma serie de tiempo y de innovaciones en el mismo instante e
instantes pasados.2 Este aspecto particular de la estructura indica que hay una manera
simple de encontrar relaciones para la media y las propiedades de covarianza de las
series. Note que la parte "lineal" del trmino "modelo lineal" no se refiere a los
coeficientes i y i, como era el caso en el modelo de regresin, pero se ve
estructuralmente similar.
Otros usos en estadstica[editar]
Hay otras instancias donde los "modelos no lineales" son usados en contraste con un
modelo estructuralmente lineal, aunque el trmino "modelo lineal" no sea
particularmente usado. Un ejemplo de esto es la "reduccin de dimensionalidad no
lineal".
Modelos lineales
Los modelos lineales predicen un objetivo continuo basndose en relaciones
lineales entre el objetivo y uno o ms predictores.
Ejemplo. Una corredura de seguros con recursos limitados para investigar las
reclamaciones de seguros de los asegurados desea crear un modelo para
estimar el coste de las reclamaciones. Al desplegar este modelo en centros de
servicios, los representantes pueden introducir informacin sobre
reclamaciones mientras atienden por telfono al cliente y obtienen
inmediatamente el coste "esperado" de la reclamacin en funcin de los datos
pasados.
Para modelos segmentados, para utilizar esta opcin con Continuar entrenando un
modelo existente debe estar conectado a Analytic Server.
Nivel de confianza. ste es el nivel de confianza que se utiliza para calcular las
estimaciones de intervalos de los coeficientes de modelos en la vista
Coeficientes. Especifique un valor mayor que 0 y menor que 100. El valor
predeterminado es 95.
Se selecciona el modelo con el valor mayor del criterio como el mejor modelo.
Nota
Generar SQL para este modelo Cuando se utilizan datos de una base de datos,
se puede devolver cdigo SQL a la base de datos para su ejecucin, lo que
proporciona un mayor rendimiento para muchas operaciones.
Nota
Puntuar fuera de la base de datos Si se selecciona, esta opcin capta los datos
de la base de datos y los punta en SPSS Modeler.
EL MODELO LINEAL
DEFINICIN DE MODELO LINEAL
UTILIDAD
ESPECIFICACIN DEL MODELO
HIPOTESIS BSICAS DEL MODELO LINEAL
ESTIMACIN DEL MODELO Y PREDICCIN
DISTRIBUCIN DE LOS ESTIMADORES DE LOS PARAMETROS DEL
MODELO LINEAL
INFERENCIA SOBRE EL MODELO LINEAL : Inferencia sobre un
parmetro.Contraste de hiptesis sobre un regresor.Contrastes lineales sobre
un conjunto de regresores.Contraste de significacin de los
regresores.Contraste de validez del modelo/ significacin general/ Anova
PREDICCIN DE UN VALOR EXTRAMUESTRAL
Complementos
MODELO LINEAL
Las hiptesis (bsicas) que se asuman sobre la perturbacin aleatoria permitirn realizar
el anlisis estadstico inferencial
NOTACIONES ALTERNATIVAS:
y = X + donde:
M.L.S.:
que establece la relacin terica entre las n observaciones de variable exgena y las de
la(s) endgena(s).
(hiptesis de no autocorrelacin)
y por lo tanto, para cualquiera de los dos casos la distribucin conjunta del vector de
observaciones:
y sigue una Nn( X ; 2 I )
ir a modelo lineal
Nos plantemos, en primer lugar construir un estimador del modelo (esto es , del valor
terico de yi) con la pretensin fundamental de obtener a partir del modelo estimado
predictores puntuales de y para situaciones no observadas (supuestos ciertos valores de
x).
Tomando logaritmos e igualando a cero las derivadas parciales con respecto a a,b,s
obtendramos los tres E.M.V:
Puede probarse que el E.M.V. del vector de parmetros del M.L.G.tambin coincide
con el vector obtenido por ajuste mnimo cuadrtico:
b= (X'X)-1X'y
Esto es,ser una funcin lineal del vector aleatorio n-dimensional y . Como el vector y
sigue una Nn (X ;2 I) la distribucin de b ser normal y como es un vector formado
por k+1 (nmero de variables + 1) estimadores: la distribucin de b ser normal (k+1)-
dimensional.
nSr2/ 2= (1/2 ) (yi- b0- b1x1- . . . - bkxk)2 =(1/2) (y- Xb)'( y-Xb)
No es dificil probar que tiene por vector de medias el vector 0 y por matriz de varianzas
la matriz M=[ I -X(X'X)-1X] que tiene por rango k+1 y la propiedad de ser idempotente
MM=M'M=M.
(En particular para el caso del M.L.S k=1 ,de forma que:
Este ltimo resultado es, no slo importante en s mismo sino que tambin
tiene efectos sobre las
inferencias de los estimadores de .
bj sigue N [ j ; ajj]
Teniendo en cuenta los resultados anteriores resulta sencillo disear los mtodos para la
realizacin de inferencias sobre uno de los "regresores", j .
si llamamos Sbj al error standard del estimador ,esto es, a todo lo que divide a (bj-j) en
la expresin anterior; el intervalo de confianza para j resulta (para un N.C. de 1-):
Para el caso particular del M.L.S. los intervalos de confianza para los coeficientes a y b
sern respectivamente:
Ejemplo: En el ejemplo visto con anterioridad: El regresor para la primera variable
explicativa (precio por kilo)e ra b2=-1.44765.La raiz cuadrada del elemento 2,2 de
(X'X)-1, a22=(0.000746)1/2=0.027313,la "cuasi-desviacin tpica residual":Sr (n/n-k-1)1/2=
8.451406,de forma que que el error standard del estimador es: Sb2= 0.230912
Si queremos construir un intervalo de confianza para un nivel del 99%: t0.005 (12-2-1
g.l.)=3.25 de forma que el intervalo quedar:
b2[-2.198114; 0.697186]
Si la hiptesis nula es: Ho: j= j* ya sea la alternativa uni o bilateral, el estadstico (bj-
j* )/ Sbj ,supuesta cierta la hiptesis nula tendr una distribucin t de Student(con n-k-1
g.l.) y podremos disear el contraste de la manera habitual que ya conocemos.
ejemplo
Teniendo en cuenta esto es facil ver que la hitesis nula de que un conjunto de
regresores verifican una o ms relaciones lineales puede expresarse como:
H0: D = h
r-dimensional cuya distribucin ser normal ya que es una transformacin lineal (forma
lineal) del vector b que segua una distrucin normal:
(b --> N [ ; (X'X)-1])
k+1
2
Puede apreciarse que la distribucin de este estadstico vectorial depende del parmetro
desconocido .Para evitar este problema puede actuarse de la siguiente manera:
el estadstico:
ejemplo
H0: 1=2=3=. . . = k= 0
H0: D = h
Aqu la matriz D sera la matriz identidad de orden k (con 1 elemento menos que el
nmero total de parmetros k+1) y el vector h sera el vector 0 de orden k.
H0:Ik = 0k
H0: = 0
A partir de estos dos hechos es muy facil ver que el estadstico del contraste queda
como:
Es interesante observar que en el caso del M.L.S. , con k=1, y ante la coincidencia del
coeficiente de determinacin y el cuadrado del coeficiente de correlacin, nos
encontramos con el estadstico del contraste de incorrelacin, cuya distribucin no
probamos y aqu haya una demostracin.
Este predictor es una transformacin lineal del vector aleatorio b de los estimadores del
vector de regresores b .Ademas la dimensin del predictor es 1, por lo que ser una
variable aleatoria Normal.
Ademas su media ser: E(x'0 b)= x'0 E(b) =x'0 b esto es, el valor terico esperado en el
futuro para la variable y (el predictor es insesgado).
Como tanto x'0 (X'X)-1x0 ; como x'0b ; como el predictor son escalares podemos expresar
este estadstico como:
Y como la raiz cuadrada de una variable F1,n-k-1 es una variable t de Student con n-k-1
g.l., tendremos que:
A partir de este estadstico es sencillo construir un intervalo para la prediccin esperada
segn el modelo, dado un nivel de confianza prefijado (1- a):
Tras realizar las operaciones pertinentes acaba quedando un intervalo para el valor
futuro de y (terico segn el modelo):
COMPLEMENTOS
ESPECIFICACIN DEL MODELO
NOTACIONES ALTERNATIVAS:
y = X + donde:
FORMA LINEAL:
FORMA CUADRTICA:
que matricialmente puede expresarse (si la extendemos para los n datos disponibles)
como: y= Xb
la podremos obtener
-2 X'y + 2 X'X b que si la igualamos a cero nos dar la solucin del ajuste
mnimo-cuadrtico:
en el caso de la R. mltiple