3 Statická optimalizace funkcí více proměnných3.2 Omezeními ve tvaru rovnostíOptimalizační úlohy s omezeními ve tvaru rovností (klasické úlohy na vázaný extrém) lze vyjádřit ve tvaru
kde g(x) = [g1(x), g2(x), …, gm(x)]T – vektor omezujících (vazebních) funkcí, b = [b1, b2, …, bm]T – vektor omezujících (vazebních) konstant. Rozdíl
se nazývá stupeň volnosti úlohy. Pro s = 0 optimalizační úloha (3.20) spočívá v nalezení řešení soustavy n = m obecně nelineárních rovnic
Z těchto řešení se pak srovnáním funkčních hodnot vyčlení optimální řešení x*, pro které účelová funkce f(x) nabývá globálního minima na množině přípustných řešení X. Značně důležitější je případ s > 0, tj. n > m. Pro řešení takových optimalizačních úloh se nejčastěji používá Lagrangeova metoda mající v teorii optimalizace základní význam. Uvažujme úlohu minimalizace
tj. s = 1, n = 2 a m = 1. Předpokládejme, že v bodě existuje lokální řešení optimalizační úlohy (3.23) a že v tomto bodě jedna z parciálních derivací prvního řádu omezující funkce je nenulová. Např. proměnné x1 a x2 jsou očíslovány tak, že platí
Pak vztah pro totální (úplný) diferenciál
lze v okolí bodu x* zapsat ve tvaru
Řešením této rovnice je
kde
Nyní již můžeme výchozí úlohu vyjádřit ve tvaru optimalizační úlohy s jednou proměnnou bez omezení
pro kterou nutná podmínka prvního řádu je dána vztahem
Po dosazení vztahu (3.28) do podmínky (3.30) a úpravě dostaneme
Zavedeme novou proměnnou
a po dosazení (3.32) do (3.31) a ze samotného vztahu (3.32) obdržíme nutné podmínky prvního řádu pro existenci lokálního řešení úlohy (3.23), tj.
resp. po vyloučení proměnné
Totální diferenciál účelové funkce f(x) při posuvu podél, hladiny [f(x) = konst.] je dán vztahem
Z posledního vztahu vyplývá vlastnost směrnice tečny ke hladině
Vztah (3.26) vyjadřuje směrnici tečny ke křivce omezení
Ze srovnání vztahů (3.35), (3.37) a (3.38) plyne, že lokální řešení x* úlohy (3.23) vystupuje v bodě dotyku křivek hladiny a omezení, tj. v bodě, ve kterém obě křivky mají společnou tečnu (obr. 3.2).
Nutné podmínky prvního řádu (3.33), (3.34) a výchozí omezení lze získat z podmínek stacionarity funkce
tj.
resp. po rozepsání
Proměnná p se nazývá Lagrangeův multiplikátor (Lagrangeův neurčitý koeficient). Pro tuto proměnnou se rovněž používají jiné symboly: λ, u, φ, μ, atd. Funkce (3.39) je tzv. Lagrangeova funkce. Je-li splněna podmínka (3.24), pak existuje jediný Lagrangeův multiplikátor p* odpovídající možnému lokálnímu řešení . Nyní si ukážeme, jakou interpretaci má Lagrangeův multiplikátor p*. Uvažujme Lagrangeovu funkci L jako funkci omezující konstanty b:
Derivováním podle b dostaneme Pro optimální proměnné , a p* platí
a protože
dostaneme velmi důležitý vztah
Vidíme, že optimální hodnota Lagrangeova multiplikátoru p* vyjadřuje citlivost (senzitivitu) optimální hodnoty účelové funkce f * na změnu hodnoty omezující konstanty b. Podobně lze postupovat i při řešení obecné optimalizační úlohy s omezeními ve tvaru rovností (3.20) pro m < n > 2. Využívá se zde věty o implicitních funkcích, která vyjadřuje Jacobiovy podmínky (jsou to postačující podmínky) pro to, aby v okolí bodu x* bylo možné vyřešit soustavu rovnic
vzhledem některým m proměnných, např. x2 = [x1, x2, …, xm]T vyjádřených ve funkci zbývajících n - m proměnných x1 = [xm+1, xm+2, …, xn]T tj. [viz vztah (3.27)]
resp.
Tyto podmínky spočívají v tom, že vektorová funkce g(x) má spojité všechny parciální derivace prvního řádu (je spojitě diferencovatelná) a hodnost Jacobiovy matice
je rovna počtu řádků m. Pak optimalizační úlohu s omezeními ve tvaru rovností (3.20) lze zastoupit (n - m) = s – rozměrnou optimalizační úlohou bez omezení
Další postup je formálně shodný s výše uvedeným případem pro n = 2 a m = 1. Zavedeme m-rozměrný vektor Lagrangeových multiplikátorů
a utvoříme Lagrangeovu funkci
Nutné podmínky prvního řádu pro existenci lokálního řešení x* úlohy (3.20) jsou shodné s podmínkami stacionarity Lagrangeovy funkce (3.54), a proto lze psát
Po rozepsání dostaneme
resp.
Z těchto podmínek [viz např. (3.56)] vyplývá, že záporný gradient (antigradient) účelové funkce je dán lineární kombinací gradientů omezujících funkcí . Váhovými koeficienty jsou Lagrangeovy multiplikátory Řešením soustavy n+m rovnic (3.57) [(3.55) nebo (3.56)] dostaneme n+m neznámých: n proměnných a m Lagrangeových multiplikátorů . Nutné podmínky druhého řádu spočívají v tom, že Hessova matice
sestavena z parciálních derivací druhého řádu Lagrangeovy funkce L podle proměnných {xj} musí být kladně (záporně) semidefinitní v bodě lokálního minima (maxima) [x*, p*]T při současném splnění podmínky
kde J je Jacobiova matice (3.51). Bude-li při splnění podmínky (3.59) Hessova matice Lagrangeovy funkce (3.58) kladně (záporně) definitní, pak nutné podmínky prvního řádu (3.55) [(3.56) nebo (3.57)] jsou zároveň postačujícími podmínkami pro to, aby v bodě x* účelová funkce f(x) měla ostré lokální minimum (maximum). Samozřejmě se předpokládá, že všechny funkce f(x) a Podmínky (3.55) [(3.56) nebo (3.57)] jsou nutné a postačující pro existenci globálního minima (maxima) v případě, že účelová funkce f(x) je konvexní (konkávní) a omezující funkce {gi(x)} jsou lineární. V optimálním bodě [x *, p *]T platí
resp.
Uvažujme nyní okolí bodu [x*, p*] v (n+m)-rozměrném euklidovském prostoru Rn+m. Má-li funkce L(x, p) v bodě x * lokální minimum, pak platí [viz vztah (3.60)]
Protože , pro libovolný vektor p platí rovnost
a vztah (3.63) lze tedy zapsat ve tvaru
ze kterého vyplývá, že Lagrangeova funkce L(x,p) má v bodě [x*, p*]T lokální singulární sedlový bod [protože na pravé straně vztahu (3.65) je znak rovnosti]. Lagrangeova metoda je velmi výhodná, protože umožňuje převést optimalizační úlohu s omezeními ve tvaru rovností na optimalizační úlohu bez omezení, tzn. dovoluje zastoupit získání lokálních vázaných extrémů účelové funkce f(x) určením lokálních volných extrémů Lagrangeovy funkce L(x, p). Při řešení konkrétní optimalizační úlohy nejdříve najdeme stacionární body Lagrangeovy funkce L(x,p), potom každý stacionární bod identifikujeme a vzájemným srovnáním funkčních hodnot vyčleníme globální řešení (pokud existuje). Příklad 3.2Lagrangeovou metodou vyřešte úlohu minimalizace Řešení: Jacobiova matice J = [1, a] má hodnost 1. Hessova matice je kladně definitní, a proto účelová funkce f(x) je ryze konvexní. Omezující funkce g(x) je lineární, proto účelová funkce f(x) nabývá v bodě ostrého globálního minima. Optimální hodnota účelové funkce f(x*) = f * je dána vztahem Po derivování podle omezující konstanty b, dostaneme
|