1 Úvod do optimalizace1.2 Základní pojmy z teorie optimalizace1.2.1 Prostor, bod, funkce, množinaEukleidovský n-rozměrný prostor Rn je množinou všech uspořádaných n-tic reálných čísel
kde Body
kde T je symbol transpozice.
Jsou-li x1a x2 dva nenulové vektory a φ je úhel, který svírají, pak jejich skalární součin je definován vztahem
Poznámka: Protože všechny vlastnosti, které platí v dvojrozměrném prostoru R2 , tj. euklidovské rovině, platí i v libovolném konečněrozměrném prostoru Rn proto pro názornou geometrickou interpretaci budeme používat R2 a R3. Množinu
nazýváme okolím bodu x1 (obr. 1.2).
Bod x je vnitřním bodem množiny
Bod x je hraničním bodem množiny
Množina všech hraničních bodů množiny X tvoří hranici množiny X (obr. 1.4) Hraniční bod množiny X nemusí přirozeně do množiny X patřit. Hraniční bod x množiny X, je krajním bodem množiny X, když pro libovolné dva navzájem různé body x1 a x1 z X tento bod nemůže být vyjádřen vztahem (viz např. body
Množina Otevřenou množinou je tedy i okolí, viz obr. 1.2. Množina Množina
Uzavřená a ohraničená množina
Množina
Tzn. konvexní množina obsahuje spolu se svými dvěma libovolnými body i úsečku, která tyto body spojuje (obr. 1.7)
Jsou-li množiny
je také konvexní (obr. 1.8). Tzn. průnik konečného počtu konvexních množin je konvexní množinou.
Množina určená vztahem
je konvexní (obr. 1.9).
Tzn. konvexní kombinace bodů vytvoří konvexní množinu. Reálná funkce f(x) se nazývá konvexní na množině
Platí-li nerovnost (1.10) jako ostrá, pak funkce f(x) je na množině X ryze konvexní (obr. 1.10).
Jsou-li funkce
je také konvexní na množině X. Tzn. lineární kombinace s nezápornými váhovými koeficienty konvexních funkcí tvoří rovněž konvexní funkci (obr. 1.11).
Funkce f(x) je konkávní, resp. ryze konkávní, když funkce -f(x) je konvexní, resp. ryze konvexní (obr. 1.12 a obr. 1.13).
Bude-li funkce g(x) konvexní, resp. konkávní, pak množina
resp.
bude také konvexní (obr. 1.14a, resp. obr. 1.14b).
1.2.2 Derivace funkceDerivace (první, prvního řádu) funkce jedné proměnné f(x) v bodě x0 je definována vztahem
za předpokladu, že tato limita existuje (obr. 1.15).
Funkce jedné proměnné f(x), která má spojitou derivaci na intervalu Ze vztahu (1.14) dostaneme
kde df(x0) je diferenciál funkce f(x) v bodě x0 (přírůstek na tečně), dx je diferenciál nezávislé proměnné x. Diferenciál pro
Má-li funkce jedné proměnné f(x) na intervalu Neexistuje-li v bodě x0 limita (1.14), ale existuje limita zleva
Protože derivaci f '(x) lze považovat za funkci proměnné x, proto lze určit v bodě x0 derivaci této derivace, tj.
Nazýváme ji derivací druhého řádu (druhou derivací) funkce f(x) v bodě x0. Podobně je možno určit i derivace vyšších řádů. 1.2.3 Parciální derivace funkce a totální diferenciálParciální derivace (první, prvního řádu) funkce n-proměnných f(x) v bodě x, podle proměnné xj je definovaná vztahem (za předpokladu, že tato limita existuje)
kde Parciální derivaci funkce f(x) podle proměnné xj, (j = 1, 2, ..., n) určíme obyčejným derivováním funkce f(x) podle proměnné xj, přičemž všechny ostatní proměnné pokládáme za konstanty (obr. 1.17).
Totální (úplný) diferenciál funkce n-proměnných f(x) v bodě x0 (přírůstek na tečné nadrovině) je dán vztahem (obr. 1.17)
kde
Funkce n-proměnných f(x), která má na nějaké otevřené množině totální diferenciál, se nazývá diferencovatelná na této množině. Protože existence totálního diferenciálu je spojena nejenom s existencí všech parciálních derivací Vztah (1.19) lze pomocí skalárního součinu zapsat ve tvaru
kde
je vektor parciálních derivací funkce f(x) v bodě x0, který se nazývá gradient a
je vektor diferenciálů nezávisle proměnných. Diferenciál df(x0) pro
Limitu (pokud existuje)
kde s je jednotkový směrový vektor (tj. |s| = 1), nazýváme derivací funkce f(x) v bodě x0 ve směru s (obr. 1.18).
Funkce n-proměnných f(x), která je diferencovatelná v bodě x0, má v tomto bodě i derivaci v libovolném směru s a platí
Označíme-li si písmenem φ úhel, který svírá gradient
z něhož vyplývá, že funkce f(x) má v bodě x0 největší derivaci ve směru určeném gradientem Budou-li parciální derivace
Pro Čtvercová matice otevřená s n2 parciálních derivací druhého řádu
se nazývá Hessova matice (hessián). Má-li funkce jedné proměnné f(x) spojitou derivaci druhého řádu, pak ji lze v okolí bodu x0 rozložit podle Taylorova vzorce se zbytkem v Lagrangeově tvaru, tj.
kde Podobně, je-li funkce n-proměnných f(x) dvakrát spojitě diferencovatelná, pak ji lze v okolí bodu h = 0, a tedy i x0 rovněž rozložit podle Taylorova vzorce se zbytkem v Lagrangeově tvaru, tj.
kde 1.2.4 Extrémy funkceFunkce f(x) definovaná na množině
Je-li nerovnost (1.31) splněna pro body
pak funkce f(x) má v bodě Platí-li neostrá nerovnost (1.31), resp. ostrá nerovnost (1.32) pro všechny body Zaměníme-li ve vztazích (1.31) a (1.32) znaky nerovností na opačné, dostaneme vztahy definující odpovídající druh maxima (obr. 1.19).
Společný název pro minimum a maximum je extrém. Body Funkce f(x), která má na množině X pouze jeden extrém (daného druhu), se nazývá unimodální. V opačném případě je multimodální. Je-li extremální bod
pak funkce f(x) má v bodě x* vnitřní (volný, nepodmíněný) extrém. V opačném případě, tj. když extremální bod x* je hraničním bodem množiny X, funkce f(x) má v bodě x* hraniční (vázaný, podmíněný) extrém. 1.2.5 Druhy podmínekPři určování extrémů funkce f(x) budeme používat tři druhy podmínek: a) Nutné podmínky (NP) existence extrému (E) Má-li funkce f(x) v bodě
resp.
b) Postačující podmínky (PP) existence extrému (E) Budou-li v bodě
resp.
c) Nutné a postačující podmínky (NPP) existence extrému (E) Budou-li v bodě
resp.
V uvedených podmínkách značí:
1.2.6 Minimalizace funkceMnožinu X budeme nazývat množinou přípustných řešení (bodů, vektorů) a funkci f(x) – účelovou funkcí nebo kritériem optimality. Nyní si můžeme formulovat obecný problém statické optimalizace ve tvaru úlohy minimalizace účelové funkce f(x) na množině přípustných řešení
resp.
kde
Úlohu maximalizace účelové funkce f(x) na množině přípustných řešení X lze rovněž zastoupit úlohou minimalizace (1.40), resp. (1.41), protože platí (obr. 1.20, viz také obr. 1.12)
resp.
Platí dokonce obecnější vztahy
resp.
kde a je libovolné číslo, b je libovolné kladné číslo. Proto se dále budeme zabývat především minimalizací. V úloze minimalizace (1.40), resp. (1.41) je třeba určit vždy globální minimum účelové funkce f(x) na množině přípustných řešení X. Protože všechny doposud známé metody řešení těchto úloh dovolují určit pouze lokální minima (extrémy), k vyznačení globálního minima je třeba disponovat dodatečnou informací o vlastnostech účelové funkce f(x) a množiny přípustných řešení X. 1.2.7 Věty o extrémechPro statickou optimalizaci má základní význam Weierstrassova věta: „Nechť neprázdná množina přípustných řešení X je kompaktní [tj. omezená (ohraničená) a uzavřená], pak spojitá účelová funkce f(x) definovaná na této množině nabývá na ní globálního minima i maxima“. Předpoklady o vlastnostech účelové funkce f(x) mohou být oslabeny a nahrazeny podmínkou: a) globální minimum – účelová funkce f(x) musí být zdola omezená na množině X; b) globální maximum – účelová funkce f(x) musí být shora omezená na množině X . Podmínky Weierstrassovy věty jsou postačující. Další důležitou větou statické optimalizace je věta vyjadřující postačující podmínky pro globální extrémy: „Nechť neprázdná množina přípustných řešení X je kompaktní a konvexní, účelová funkce f(x) je spojitá a konvexní (resp. konkávní) na X, pak platí: a) lokální minimum (resp. maximum) je globálním minimem (resp. maximem); b) množina bodů, na které účelová funkce f(x)dosahuje minima (resp. maxima) je konvexní; c) pro ryze konvexní (resp. konkávní) účelovou funkci f(x) lokální minimum (resp. maximum) je jednoznačným ostrým globálním minimem (resp. maximem)“. Dosud jsme uvažovali kritérium optimality ve tvaru účelové funkce, tj. reálné funkce reálných proměnných. V tomto případě optimalizace se nazývá statická a spočívá v minimalizaci (maximalizaci) funkce. Pro statickou optimalizaci se rovněž používá ekvivalentní pojem matematické programování. V některých případech kritérium optimality může mít tvar účelového funkcionálu, tj. reálného funkcionálu, u kterého nezávisle proměnné jsou reálné funkce reálné proměnné (nejčastěji času). Řešením těchto problémů se zabývá dynamická optimalizace a spočívá v minimalizaci (maximalizaci) daného funkcionálu. |