Professional Documents
Culture Documents
f(xk),
wyznaczania hesjanu bez potrzeby znajdowania jego skadnikw explicite. Poszukiwany jest
algorytm generujcy iteracyjnie uzupenienie [ Gk ] przybliajce macierz startow [ G1 ] do
odwrotnoci hesjanu [ H ]-1. W tym celu wprowadzono pojcie kierunkw sprzonych di, dj
wzgldem pewnej macierzy [ A ] definicyjnie okrelonych zalenoci
(9.1)
Jak wida pojcie A-sprzenia jest uoglnieniem pojcia ortogonalnoci podstawiajc za
[ A ] macierz identycznociow [ I ] otrzymujemy zwyky warunek ortogonalnoci dwch
kierunkw.
Uyteczno kierunkw sprzonych w zagadnieniach optymalizacyjnych wynika
z nastpujcych
twierdze
przytaczanych
tu
bez
dowodw,
ktre
mona
znale
w specjalistycznych monografiach :
TWIERDZENIE 1. Dla dowolnego cigu d1, d2, ...dn kierunkw sprzonych wzgldem
symetrycznej, dodatnio okrelonej macierzy [A] o rozmiarze n i dowolnego punktu
startowego x0 jest moliwe znalezienie minimum funkcji kwadratowej fQ
(9.2)
w co najwyej n krokach iteracyjnych prowadzc minimalizacj wzdu kadego kierunku di.
Twierdzenie to oznacza, e kada kolejna minimalizacja wzdu di (i=1, 2, ...n), znajduje
minimum fQ na podprzestrzeni definiowanej przez rosncy zbir A-ortogonalnych kierunkw.
Findeisen W., Szymanowski J.,Wierzbicki A.: Teoria i metody obliczeniowe optymalizacji, PWN Warszawa, 1980;
Aoki M.: Introduction to optimization techniques, Macmillan, New York, 1977
W celu okrelenia tego zbioru kierunkw wykorzystywany jest algorytm GramaSchmidta, w ktrym zwyky iloczyn skalarny zosta zastpiony przez iloczyn A-sprzony
(9.1). Jako zbir wyjciowych kierunkw D0 najprociej jest wykorzysta baz ei przestrzeni
euklidesowej, w ktrej zdefiniowano wektor zmiennych decyzyjnych
(9.3)
Zamy, e
(9.4)
poszukujemy skalara 21, takiego e kierunki d1 i d2 powizane zalenoci
(9.5)
s A-sprzone. Oznacza to, e zachodzi
(9.6)
Wynika std
(9.7)
Dla dowolnego kolejnego kierunku dk+1 mamy wic zaleno
(9.8)
gdzie wspczynniki kj wynosz
(9.7)
(9.11)
Odwrotno hesjanu [H]-1 wyznacza si elementarnie dla przypadku kiedy sam hesjan
ma struktur diagonaln
(9.12)
Jeeli przyjmiemy, e macierz [A] jest rwna [H]-1, to forma kwadratowa fQ(x1, x2) w
nowej metryce ma posta
(9.13)
co dla rozpatrywanej funkcji daje
(9.14)
Izolinie fQ(x1, x2) w tej metryce bd okrgami co pokazano na rys.9.1. Naley zwrci
uwag, e omwiona transformacja dotyczy take dowolnego pooenia elips funkcji
kwadratowej oraz e zmiana metryki nie zmienia pooenia minimum badanej funkcji.
x2
fQE2
x1
fQ[H]-1
Oznaczenia s nastpujce
[ I ] macierz jednostkowa,
k = xk+1 xk = kdk
k = f(xk+1) - f(xk)
(9.20)
gdzie poprawka [V]k jest obliczana ze wzoru (9.17) lub (9.18) w zalenoci od wyboru
metody.