2 Statická optimalizace funkcí jedné proměnné2.2 Numerické metody jednorozměrné optimalizaceNumerické metody jednorozměrné optimalizace lze rozdělit na dvě základní skupiny:
Budeme se zde zabývat numerickými metodami jednorozměrné minimalizace spojitých unimodálních funkcí (jsou to takové funkce, které mají jeden extrém na daném intervalu), tj. řešením optimalizační úlohy
Není-li daná účelová funkce f(x) na intervalu U numerických metod je nutno předem zadat požadovanou přesnost vyznačení optimálního řešení x*, tj. nezáporné číslo ε, pro které N-tá aproximace řešení xN musí vyhovovat nerovnosti
a také požadovanou přesnost vyznačení optimální hodnoty účelové funkce f *, tj. nezáporné číslo δ, pro které hodnota účelové funkce v bodě xN vyhovuje nerovnosti (obr. 2.4)
U některých numerických metod kontrola splnění podmínek (2.7), resp. (2.8) je problematická. Jde především o ty případy, kdy informace o vlastnostech účelové funkce f(x) jsou velmi nedostatečné, proto se rovněž používají vztahy
resp.
2.2.1 Diferenciální metodyBudeme uvažovat hladkou unimodální účelovou funkci f(x) na intervalu
V jednodušších případech lze rovnici (2.11) řešit analyticky. Bude-li tato rovnice transcendentní (nealgebraická), její řešení musíme hledat pomocí numerických iteračních metod. a) Bolzanova metodaNejjednodušší iterační metodou jednorozměrné minimalizace je Bolzanova metoda (metoda půlení intervalu, metoda dichotomie), kterou využijeme pro řešení rovnice (2.11). Bolzanova metoda spočívá v utvoření takové posloupnosti intervalů
pro kterou platí vztahy
kde lk je délka intervalu Ik. Ze vztahů (2.13) v limitě dostaneme
Interval Ik nazýváme k-tým intervalem neurčitosti nebo lokalizace. Bolzanova metoda může být popsána následujícím algoritmem (obr. 2.5):
Po N-tém kroku optimální bod x* leží v intervalu neurčitosti IN a proto lze psát
kde
Nutný počet kroků N při lokalizace optimálního bodu x* s přesností
V algoritmu (2.16) se využívá vlastnosti hladké unimodální účelové funkce f(x), která může být vyjádřena nerovnostmi
Bolzanova metoda je vždy konvergentní, pokud jsou splněny její podmínky (2.20), ale rychlost konvergence je malá. Příklad 2.4Bolzanovou metodou vyřešte optimalizační úlohu z příkladu 2.1 s přesností ε = 0,01 Řešení: Potřebný počet kroků vypočteme ze vztahu Shodně s algoritmem Bolzanovy metody (2.16) lze psát: Jednotlivé kroky řešení:
Výsledek zapíšeme: l7 = b7 - a7 = 0,01563 Přibližné řešení: Přesné řešení: Výsledek řešení ze souboru v Excelu (StatOpt-BolzMet.xls): b) Newtonova metodaMezi základní iterační metody řešení rovnice (2.11) patří Newtonova metoda (Newtonova-Raphsonova metoda, metoda tečen). Tato metoda spočívá v utvoření posloupnosti bodů
Metoda odpovídá sestrojení tečny v bodě
Postačujícími podmínkami konvergence posloupnosti bodů
jsou:
Za počáteční aproximaci je vhodné volit takový bod x1, který vyhovuje nerovnosti
Při nevhodné volbě počátečního bodu x1 další aproximace může ležet vně intervalu Newtonův rekurentní vzorec (2.21) má ještě jednu velmi názornou interpretaci. V okolí bodu xk účelovou funkci f(x) zastoupíme prvními třemi členy Taylorova rozvoje (kvadratickou parabolou)
Za (k+1)-ní aproximaci optimálního bodu X zvolíme bod xk+1, ve kterém funkce fk(x) nabývá svého ostrého globálního minima. Z nutné podmínky dostaneme (obr. 2.6a)
Obdrželi jsme Newtonův rekurentní vzorec (2.21). Odhad přesnosti N-té aproximace lze provést např. podle vztahu
kde
Konvergence Newtonovy metody je tím rychlejší, čím více se účelová funkce f(x) blíží kvadratické parabole, pro kterou přesné řešení dostaneme po jednom kroku. Newtonova metoda má některé velmi nepříjemné vady. Nejdůležitější jsou:
V praxi je možno použít modifikaci Newtonovy metody spočívající v tom, že když druhá derivace f ''(x) se již mnoho nemění, lze ji ponechat beze změny i pro následující iterace, tj. použijeme vzorce (obr. 2.7) kde B je konstanta rovná posledně vypočtené druhé derivaci f ''(x) . Tato modifikovaná metoda se někdy také nazývá Whittakerova metoda.
U Newtonovy metody se nevypočítává počet kroků iterace a výpočet se ukončí když platí Příklad 2.5Optimalizační úlohu z příkladu 2.1 vyřešte Newtonovou metodou a modifikovanou Newtonovou metodou, obě pro přesnost εN = 0,001 Řešení: a) Newtonova metoda Nejdříve vypočteme všechny požadované derivace účelové funkce: f '(x) = 3x2 - 1 f ''(x) = 6x f '''(x) = 6 Zkontrolujeme postačující podmínky konvergence: f '(0) f '(1) = - 2 < 0, Postačující podmínky konvergence Newtonovy metody jsou splněny pro polouzavřený interval Za počáteční aproximaci volíme bod x1 = 1, protože platí f '(1) f '''(1) = 12 > 0. Newtonův rekurentní vzorec má tvar x1 = 1 |x5 - x4| = 0.00003 Přibližné řešení: b) modifikovaná Newtonova metoda Ve vzorci (2.31) za B volíme f ''(1) = 6 a dostaneme: x1 = 1 |x8 - x7| = 0.00058 Přibližné řešení: Přesné řešení: c) Metoda sečenTato metoda vychází z Newtonovy metody a proto pro ni platí stejné postačující podmínky konvergence (2.23) – (2.25). Zastoupíme-li v Newtonově rekurentním vzorci (2.21) směrnici tečny funkce f '(x) v bodě xk [tj. výraz f ''(xk)] směrnicí vhodně volené sečny, např.
pak dostaneme vztah pro metodu sečen
Metoda sečen má několik modifikací. Vztahy (2.32) – (2.34) vyjadřují případ uvedený na obr. 2.8, kdy pevným bodem je bod b a platí pro něj
Pokud to neplatí, bude pevným bodem bod a a vztah (2.34) je třeba upravit na tvar Vhodnou volbou počátečních aproximací lze u této metody zajistit konvergenci u většiny praktických případů. Rychlost konvergence je pomalejší než u Newtonovy metody. Ukončení iteračního výpočtu a zápis řešení optimalizační úlohy je stejný jako u Newtonovy metody. Výsledek zapisujeme ve tvaru S výhodou se využívá kombinace metody sečen s Newtonovou metodou. Příklad 2.6Metodou sečen je třeba řešit optimalizační úlohu z příkladu 2.1 s přesností εN = 0,001 Řešení: Zvolíme si b = 1 a shodně se vztahem (2.34) pro f '(x) = 3x2 - 1 dostaneme: x1 = 1 |x8 - x7| = 0,00032 Přibližné řešení: Přesné řešení: 2.2.2 Přímé metodya) Metoda kvadratické interpolaceMetoda kvadratické interpolace spočívá v aproximaci hladké unimodální účelové funkce f(x) v okolí minima kvadratickou parabolou (mnohočlenem 2. stupně). Předpokládejme, že známe hodnoty účelové funkce f(x) ve třech bodech xa < xb < xc . Označíme je fa, fb a fc. Použijeme Lagrangeův interpolační mnohočlen, který pro tento případ má tvar
Aproximační kvadratická parabola fk(x) má ostré globální minimum ve stacionárním bodě xk, který je jediným reálným kořenem rovnice
tj.
Odtud dostaneme
Pro ekvidistantní body (body stejně vzdálené od sebe) xa, xb a xc, tj. pro
vztah (2.38) se podstatně zjednoduší
Při řešení úloh jednorozměrné minimalizace metodou kvadratické interpolace se nejčastěji postupuje dvojím způsobem: a)Vypočtený bod xk je dosazen ve vzorci (2.38) na místo jednoho ze tří bodů xa, xb nebo xc, a počítá se další aproximace xk+1. b)Body xa, xb a xc jsou voleny tak, aby byly splněny podmínky (2.39) a
Vypočtený bod xk ze vztahu (2.40) se dosadí za bod xb a další body xc a xa, jsou vybrány takovým způsobem, aby vyhovovaly podmínkám (2.39), (2.41) a počítá se další aproximace xk+1, tj.
Rozdíl Problém konvergence metody kvadratické interpolace je velmi složitý a závisí především na vhodné volbě bodů xa, xb a xc. U této metody se nevypočítává počet kroků iterace a výpočet se ukončí když platí Příklad 2.7Úlohu minimalizace z příkladu 2.1 vyřešte metodou kvadratické interpolace Řešení: K výpočtu použijeme vzorec (2.40), resp. (2.42). Volíme body:
Nemůžeme volit např. body:
protože fc - fa = 0. Po dosazení do (2.40) dostaneme: Volíme další body, např.:
Ze vzorce (2.42) dostaneme: x2 = 0,57731 Přibližné řešení: Přesné řešení: b) Rovnoměrná komparativní metodaRovnoměrná komparativní metoda (metoda rovnoměrného hledání) patří mezi nepostupné (pasivní) komparativní metody hledání minima libovolné spojité unimodální účelové funkce f(x). U této metody počáteční interval neurčitosti
a vyhledáme (obr. 2.9)
Optimální bod x* je lokalizován v intervalu neurčitosti
U komparativních metod určení hodnoty účelové funkce f(x) výpočtem nebo experimentálním měřením se nazývá experiment. Efektivnost těchto metod vyjadřuje poměr délky počátečního intervalu neurčitosti k délce posledního N-tého intervalu neurčitosti při stejném počtu experimentů M , tj.
Počet experimentů M u rovnoměrné komparativní metody při požadované přesnosti ε lze určit z nerovnosti
ze které po úpravě dostaneme
Shodně se vztahy (2.46) a (2.47) efektivnost rovnoměrné komparativní metody je
c) Metoda zlatého řezuMetoda zlatého řezu patří mezi postupné (adaptivní) komparativní metody hledání minima libovolné spojité unimodální účelové funkce f(x). Postupné komparativní metody spočívají, podobně jako Bolzanova metoda, v utvoření takové posloupnosti intervalů neurčitosti
Každý následující interval neurčitosti je podintervalem předcházejícího intervalu neurčitosti, a proto posloupnosti
Počet kroků N je dán požadovanou přesností ε, pro kterou platí vztahy:
kde
Metoda zlatého řezu spočívá v rozdělení každého intervalu neurčitosti tak, aby poměr větší části k menší byl roven poměru celého děleného intervalu k větší části (obr. 2.10), tj.
Po dosazení (2.57) do (2.58) a úpravě dostaneme kvadratickou rovnici
jejíž kladný kořen je hledaný poměr
Platí pro něj vztahy:
Při metodě zlatého řezu ve všech krocích (kromě prvního) interval neurčitosti obsahuje spolu s krajními body jeden vnitřní bod. Proto je třeba určit hodnotu účelové funkce f(x) pouze v jednom novém bodě umístěném symetricky k již známému bodu (obr. 2.11 a obr. 2.12).
Metodu zlatého řezu lze popsat algoritmem:
Po N -tém kroku optimální bod x* je lokalizován v intervalu neurčitosti
tj.
Potřebný počet kroků N pro určení optimálního bodu x* s přesností ε zjistíme ze vzorce
který získáme úpravou vztahů (2.54) a (2.65). Počet experimentů M je stejný jako počet kroků N, tj.
Efektivnost metody zlatého řezu je dána vztahem [viz (2.46) a (2.65)]
U metody zlatého řezu se výsledek zapíše ve tvaru Příklad 2.8Úlohu minimalizace z příkladu 2.1 vyřešte metodou zlatého řezu s přesností ε = 0,01 Řešení: Počet kroků vypočteme ze vzorce (2.67) Shodně s algoritmem (2.64) pro
Přibližné řešení: Zápis výsledku s ohledem na zadanou přesnost ε: Přesné řešení: Výsledek řešení ze souboru v Excelu (StatOpt-MetZlatRezu.xls): d) Fibonacciova metodaFibonacciova (Kieferova) metoda rovněž patří mezi postupné komparativní metody, a proto pro ni platí vztahy (2.50) – (2.56). Fibonacciova metoda využívá při zkracování intervalů neurčitosti přímé úměrnosti jejich délek číslům Fibonacciovy posloupnosti (obr. 2.13), tj.
kde čísla Fibonacciovy posloupnosti
resp.
Pro veliké k lze v rovnici (2.72) výraz
V tabulce 2.1 je uvedeno prvních 16 čísel Fibonacciovy posloupnosti a také jejich aproximace podle vztahu (2.73).
Fibonacciova metoda minimalizace může být popsána následujícím algoritmem:
Malé kladné číslo γ na N-tém kroku dovoluje určit polohu optimálního bodu x* vzhledem k bodu xN-1 . Hodnotu čísla γ volíme nejméně o řád menší než je požadovaná přesnost ε. Po N-tém kroku optimální bod x* leží v intervalu
Pro dosažení přesnosti ε při lokalizaci optimálního bodu x* ze vztahů (2.54) a (2.76) dostaneme
tj. musíme najít takové číslo Fibonacciovy posloupnosti, které vyhovuje nerovnosti (2.77). Jeho index N udává počet potřebných kroků, a zároveň počet experimentů M , tzn.
Využijeme-li v nerovnosti (2.77) aproximace (2.73), pak dostaneme přibližný vztah
Pro efektivnost Fibonacciovy metody platí [viz vztah (2.76) a (2.78)]
resp. přibližně
U Fibonacciovy metody číslo N musíme znát před zahájením výpočtu. Příklad 2.9Úlohu minimalizace z příkladu 2.1 řešte Fibonacciovou metodou s přesností ε = 0,01 Řešení: Počet kroků N zjistíme ze vztahu (2.77), resp. (2.79): Shodně s algoritmem Fibonacciovy metody lze psát:
Přibližné řešení: Zápis výsledku s ohledem na zadanou přesnost ε: Přesné řešení: Výsledek řešení ze souboru v Excelu (StatOpt-FibonacMet.xls): |