Professional Documents
Culture Documents
8.1.
El problema del ajuste de datos; es decir, descubrir una funcion matematica que
pueda explicar de la mejor forma posible el comportamiento de alg
un mecanismo o
grupo de seres u objetos que puede ser medido, y del cual conocemos algunos datos
(con sus posibles errores de medicion), es un problema clasico y ha supuesto un reto
para la comunidad matematica desde su planteamiento por Gauss y Legendre hacia
1800.
En lenguaje de algebra lineal consiste en encontrar la solucion de un sistema lineal
Ax b siendo A P Cmn con m n. En A y b se recogen todos los datos del
experimento que se quieren ajustar. Enseguida veremos algunos ejemplos.
Sabemos que el sistema tiene solucion si y solo si b P Im A, condicion que difcilmente
se cumple si m es mucho mayor que n. Si m n diremos que el sistema Ax b
esta sobredeterminado; y si no existe ning
un x P Cn1 tal que Ax b lo que se
159
160
Ax b P Cm,
Ejemplo 8.1 El ejemplo mas tpico de ajuste de datos por mnimos cuadrados es
el calculo del polinomio de interpolaci
on: dados m puntos del plano pxi , yi q,
i 1, . . . , m, de forma que xi xj para i j, se trata de encontrar un polinomio
de grado a lo mas m 1, ppxq a0 a1 x am1 xm1 , que pase por los n
puntos.
i 1, . . . , m.
a1 x i
am1 xim1
yi ,
i 1, . . . , m
(8.1)
161
1
1 x1 x21 xm
1
m
1
2
j 1
1 x2 x2 x2
A xi
.. .. .. . . . ..
. .
.
.
m1
2
1 xm xm xm
Esta es una matriz de Vandermonde cuyo determinante es
det A
pxi xj q.
i j
2
1
2
3
Figura 8.1:
a=-5:5;
A=fliplr(vander(a));
b=[0 0 0 1 1 1 0 0 0 0 0];
c=Azb;
p=flipud(c);
t=linspace(-5.05,5.05);
plot(t, polyval(p,t),a,b,r*,...;
markersize,10);
zeroaxes
162
curva que interprete los datos obtenidos. Como las mediciones se realizan en momentos puntuales, tal grafica debera reflejar, salvo que se tengan motivos para pensar
lo contrario, una comportamiento suave entre dos datos consecutivos, y no la fluctuacion que muestra el polinomio de interpolacion de nuestro ejemplo. Quiza un
polinomio de menor grado pueda mostrar un mejor comportamiento. Tal polinomio
no pasara por algunos de los puntos. Pero la medicion de todo proceso real conlleva
errores que podran explicar tal fenomeno.
Ejemplo 8.2 (Ajuste por mnimos cuadrados) Con los mismos datos del ejemplo anterior calcular el polinomio de grado 7 que mejor se ajusta a los datos en el
sentido de los mnimos cuadrados.
Siguiendo los mismos pasos que en el ejemplo anterior lo que buscamos es un polinomio de grado a lo mas n 1 m 1
ppxq a0
a1 x
an1 xn1
tal que }ppxq y }2 sea mnimo. Aqu, ppxq es el vector cuya i-esima componente es
ppxi q y el vector y es el que tiene por i-esima componente yi .
Ahora bien, si
1 x1 x21 x1n1
1 x
x22 x2n1
2
A .. ..
.. . . ..
.
..
.
.
2
n1
1 xm xm xm
x C
Figura 8.2:
a=-5:5
A=fliplr(vander(a))
b=[0 0 0 1 1 1 0 0 0 0 0];
p=polyfit(a,b,7);
t=linspace(-5.3,5.3);
plot(t, polyval(p,t),a,b,r*,...
markersize,10);
axis([-6 6 -3 5]);
zeroaxes
4
3
2
1
6
163
1
2
3
c2 2 pxq
cn n pxq,
que mejor se ajusta a una de tales nubes de puntos. Aqu 1 , 2 ,. . . , n son funciones
dadas, o de las que uno sospecha que una combinacion lineal de ellas puede ajustarse
bien a los datos. En este caso el problema se reduce a calcular el vector c donde se
alcanza el mnimo:
mn }Ax y }2 ,
x C
8.2.
La soluci
on del problema de mnimos cuadrados
164
r=Ax0b
b
Ax
Im A
}Ax0 b}2 m
n }Ax b}2
xPF
n
PAb.
b Ax0 P pIm AqK .
A Ax0 A b.
(i) Ax0
(ii)
(iii)
Ademas, la solucion x0 es u
nica si y solo si rang A n.
En la demostracion se usa el teorema de Pitagoras: Si x, y P Cn son ortogonales
entonces }x y }22 }x}22 }y }22 . En efecto, }x y }22 px y q px y q x x y
x y y x x x y y }x}22 }y }22 , donde hemos usado que x y y x 0 porque
x e y son ortogonales.
Demostraci
on.- Todo se basa en la demostracion de la idea geometrica expuesta
mas arriba:
mnn }Ax b}2 }PA b b}2 .
x C
PA b b}22
165
Solo queda demostrar la equivalencia entre las tres condiciones. Por una parte
8.3.
El Teorema 8.3 nos da las claves para calcular un vector x0 que solucione el problema
de mnimos cuadrados. En primer lugar, el sistema A Ax A b recibe el nombre de
166
Bf pxq 0,
B xi
i 1, . . . , n
3. Resuelvase Ly
4.
167
168
8.3.1.
La inversa generalizada de Moore-Penrose se puede definir como la matriz que soluciona el problema de mnimos cuadrados. Es decir, de la misma que la solucion del
sistema Ax b es x A1 b siempre que A sea invertible, la solucion del problema
de mnimos cuadrados es x0 A: b. Veremos que esto es, en efecto as, y que este hecho nos proporciona un algoritmo alternativo para resolver el problema de mnimos
cuadrados.
Recordemos que x0 es solucion del problema se mnimos cuadrados si y solo si es
solucion del sistema Ax PA b, siendo PA la proyeccion ortogonal sobre Im A. Recordemos tambien que si r rang A y A U V es una descomposicion completa
de A en valores singulares, entonces las r primeras columnas de U son una base ortonormal de Im A. (Proposicion 3.10). Sea Ur la submatriz de U formada por sus r
primeras columnas. Como son una base ortonormal de Im A, la matriz Ur Ur es la
proyeccion ortogonal sobre Im A. Es decir, PA Ur Ur . As pues, si ponemos
r 0
0 0
Ur r 0 V x Ur Ur b.
Y este sistema es equivalente a r 0 V x Ur b dado que Ur Ur
c Ur b y y V x. Entonces,
Ax PA b r 0 y
Si r
Ir . Pongamos
c.
c1{1
c2 {2
cr {r yr
yn
T
con yr 1 ,. . . , yn , n
umeros arbitrarios. Si el rango de A es completo, n, la solucion del
sistema queda completamente determinada; cosa que ya habamos demostrado. Pero
si rang A n entonces hay infinitas soluciones del problema de mnimos cuadrados.
Entre ellas, se suele escoger la solucion de norma mnima. Y esta es la que se consigue
haciendo yr 1 yn 0. Finalmente, como y V x, tenemos que x V y.
169
c1 {1
c2 {2
..
.
c1 {1
c {
2 2
x0 V y0 V cr {r Vr .. ,
.
0
.
cr {r
..
0
donde Vr es la submatriz de V formada por sus r primeras columnas.
Ahora vamos a volver hacia atras a fin de recuperar la solucion del problema
en terminos de los datos originales: A y b. Recordemos, antes de nada, que con
las notaciones introducidas A Ur r Vr es una descomposicion reducida de A en
valores singulares. En consecuencia
A:
Vr r 1Ur
c1 {1
c {
2 2
1
1
x0 Vr .. Vr
r c Vr r Ur b,
.
cr {r
Vr r 1Urb A:b
170
8.4.
El condicionamiento del problema de mnimos cuadrados es un tema importante porque tiene implicaciones no triviales en el estudio de la estabilidad de los algoritmos
para este problema. Como es habitual analizaremos en detalle el condicionamiento del problema y estudiaremos la estabilidad de los algoritmos mediante ejemplos
significativos.
Recordemos que el problema de mnimos cuadrados consiste en lo siguiente (supondremos en lo sucesivo que la matriz del sistema tiene rango completo):
Dada A P Fmn de rango completo y m n, y dado b P Fm ,
calcular x P Fn para que }Ax b}2 sea mnima.
(8.2)
P b,
171
1 .
n
r=Axb
y=Ax=Pb
Im A
172
de modo que
1 }x}x }yy} 1.
2
Equivalentemente
cos
}x}x }yy}
2
.
2
As pues
}}yb}}2 .
2
Para el seno usamos la identidad sen2 1 cos2 :
}y}22 }b}22 }y}22 .
sen2 1
}b}22
}b}22
Ahora bien, b y b y siendo y y b y ortogonales (y P Im A y b y
b P b pIm P qb P pIm AqK ). Por consiguiente, usando el Teorema de Pitagoras,
}b}22 }y}22 }b y}22 y
}b y }2
sen
}b}
cos
2 }x}2
}A}}y2 }}x}2 }A}}Ax
} .
2
{2
pAq
173
}
A}2 }A1 }2 }Ax}2
2pAq.
}Ax}2
}pAAq1A}2 1 .
(8.3)
}pAAq1}2 12
(8.4)
siendo 1
Demostraci
on.- La propiedad (8.4) es una consecuencia inmediata de que los valores singulares de A son las races cuadradas positivas de los valores propios de A A,
y de que 1{n2 es el mayor valor singular de pA Aq1 (ver Porposiciones 3.12 y 3.16).
Para probar la propiedad (8.3) se usa el Teorema SVD para ver que los valores
singulares de pA Aq1 A y los de A: coinciden.
Podemos ahora plantear y demostrar el resultado principal
Teorema 8.5 Sean b P Fm y A P Fmn con b 0 y rang A n m. Para el
problema de mnimos cuadrados (8.2) se cumplen las siguientes propiedades, todo
respecto de la norma `2 :
(i) El n
umero de condicion del problema de calcular y
1
.
cos
Ax P Fn respecto de b es
(8.5)
174
(ii) El n
umero de condicion del problema de calcular x P Fn respecto de b es
2 pAq
.
cos
(8.6)
}y y}2 2pAq
}y}2
cos
Op2 q.
(8.7)
}x x}2 pAq
2
}x}2
2 pAq2 tan
Op2 q.
(8.8)
"
}A}2 , }b}2 * n
}A}2 }b}2
1
*
}x x}2 " pAq 1
2 pAq2 tan
1
2
}x}2
cos
siendo 1
Op2 q.
(8.9)
Pb
175
(8.10)
P b respecto de
Q
I 0
r
QQ Q Q n
r
0 0
Q
}P }2 1pP q 1
}y}2 . En conclusion:
Finalmente, recordemos que cos
}b}2
}P }2}b}2 1 ,
pbq
}y}2
cos
tal y como se deseaba demostrar.
}2 n
1 A y f 1 b. Por hipotesis, }}A
A}2
1
y como }A}2 1 , tenemos que }A}2 n . Por el Teorema 3.18 resulta que
rangpA Aq n y consecuentemente rangpA tE q n para todo t P r0, s. Se
(v) En primer lugar definimos E
pA
tE q pA
tE qxptq pA
tE q pb
tf q
(8.11)
176
tiene una u
nica solucion para cada t P r0, s. Invertir una matriz es una funcion
diferenciable en los elementos de la matriz. Por lo tanto x es una funcion diferenciable
de t en r0, s. Por la definicion de diferencial
x1 p0q
xpq xp0q
Op2 q.
1, tenemos que x 0 y
}x x}2 }x1p0q}2 Op2q.
(8.12)
}x}2
}x}2
Necesitamos una estimacion de }x1 p0q}2 . Para ello calculamos x1 p0q en (8.11). Primero derivamos
E pA tE qxptq
tE q Exptq
pA
pA
tE q f,
pA
A Ex
A Ax1 p0q A f
E b.
Tomando normas:
2 pAq2
}b Ax}2{}Ax}2 .
}A}2}x}2{}Ax}2
Ahora bien,
y tan
177
}2 . En consecuencia
}b}AxAx
}
2
}x1p0q}2 pAq 1
2
}x}2
cos
2 pAq2
tan
sustituyendo en (8.12)
2 pAq2 tan
Op2 q,
8.5.
178
hacia atras (ver [11, Sec 20.3]). Finalmente, los algoritmos basados en la factorizacion QR mediante reflexiones de Householder y valores singulares son estables hacia
atras para sistemas en los que A es una matriz de rango completo. A continuacion
se enuncian los teoremas que lo hace explto.
Teorema 8.6 Supongamos que el problema de mnimos cuadrados con una matriz
A de rango completo se resuelve mediante el algoritmo QR por reflexiones de Householder o mediante la descomposicion en valores singulares en un ordenador que
cumple los axiomas (5.2) y (5.4) de la Leccion 5. Este algoritmo es estable hacia
atras: para cada A P Fmn (m n y rang A n) existe una perturbacion A tal
que
}A} Op q
M
}A}
p producida por el algoritmo satisface
y la solucion x
}pA
p b}2
Aqx
m
n }pA
xPF
n
Aqx b}2 .