Viazané extrémy na množine

Viazané extrémy na množine

Viazané extrémy na množine

Jeden komentár

V krátkosti si vysvetlíme, čo je to vlastne ten extrém a prečo sa ráta tak, ako sa ráta.

fmfi_mat_a4_030

Extrém funkcie je bod, v ktorom funkcia nadobúda svoje maximum alebo minimum, zjednodušene povedané tam, kde je “vrch oblúčiku” alebo “spodok oblúčiku”. V tomto bode je dotyčnica k funkcii rovnobežná s osou x, čiže akoby nejaká konštantná funkcia s rovnicou y=c (c – konštanta). A keďže dotyčnice môžeme v istom smere pokladať za vektory (predsalen určujú smer rastu funkcie), tak ak konštatnú funkciu presunieme z daného bodu do nuly, dostaneme funkciu y=0. (pozn. aj pri integrovaní pridávame konštantu, ktorá je vlastne akoby toto posunutie spať). Takže pre toto sa extrém funkcie hľadá ako bod, v ktorom sa derivácia rovná nule.

Takisto to platí aj v prípade viacrozmerných funkcií. Extrém je tam, kde sa derivácie podľa všetkých premenných rovnajú nule. Na obrázku máme akoby vrchol kopca, kde je extrém. Tak ak spravíme dve dotyčnice k ploche v smere x a y, vidíme, že obidve sú rovnobežné so svojimi osami, tj ich rovnice po posunutí do stredu súradnicovej sústavy sú y=0, pre prevné x=0; a x=0, pre pevné y=0. Z toho nám vyplýva, že pri viacrozmerných funkciách sa extrémy hľadajú obdobne ako pri jednorozmerných a to hľadaním pre aké x a y sa parciálne derivácie podľa x a y rovnajú nule.

fmfi_mat_a4_031

Takto hľadáme extrémy na celej množine, volajú sa aj voľné extrémy. Dá sa povedať, že ak hľadáme voľný extrém funkcie, nie sme ničím obmedzený, hľadáme extrémy úplne na celom obore hodnôt danej funkcie.

Viazané extrémy

Viazaný extrém funkcie je extrém, ktorý nie je voľný, tj. je na niečo naviazaný. A tou väzbou bude práve určenie, na ktorej časti z oboru hodnôt našej funkcie máme nájsť extrém. Časť, na ktorej budeme extrém hľadať určíme tiež funkciou. Ako vidíme na príkladnom obrázku: máme zadanú zelenú funkciu (nejaké akoby vlny) a máme nájsť viazaný extrém s väzbou červenej funkcie – valca. To znamená, že budeme hľadať, kde na prieniku zelenej a červenej funkcie má extrém zelená funkcia.

fmfi_mat_a4_032

Na obrázku je valec priesvitný, aby sme ľahšie získali predstavu o jeho prieniku so zelenou funkciou. Prienik vidíme ako akúsi zvlnenú kružnicu na povrchu zelenej funkcie. Pohľadom na obrázok môžeme zistiť, že extrém bude práve niekde vpravo, kde je zvlnená kružnica prieniku najvyššie (nemusí to ale vôbec byť práve na vrchole vlny zelenej funkcie).

Pre ilustráciu a lepšiu predstavu si ukážme viacej názorných obrázkov aj so zakreslenými extrémami:

fmfi_mat_a4_033 fmfi_mat_a4_034 fmfi_mat_a4_032

V prvých dvoch obrázkových príkladoch máme prípady, keď sme mali väzbovú funkciu zadanú ako rovnicu, napríklad druhý obrázok sú viazané extrémy zelenej funkcie akejsi rovnej plochy, kde väzbová funkcia je hranica gule. Ak však máme väzbovú funkciu ako nerovnicu, tj. napríklad guľa a aj jej vnútro, nájsť musíme aj extrémy, ktoré sa nachádzajú vnútri. Príkladom toho je tretí obrázok, kde hľadáme extrémy aj vnútri danej väzbovej funkcie (telesa).

Výpočet

Teraz si už konečne ukážme, ako sa takéto viazané extrémy vlastne výpočtovo hľadajú. Používa sa na to Lagrangeova funkcia, ktorá má nasledujúci tvar:

fmfi_mat_a4_035

kde L(x,y) označuje práve danú Lagrangeovu funkciu, f(x,y) je zadaná funkcie, ktorej viazaný extrém hľadáme, g(x,y) je väzbová funkcia, ktorá nám vlastne ohraničí na akej časti funkcie f hľadáme extrém, a napokon lambda je konštanta, ktorú pri výpočte musíme nájsť. Samotný výpočet je takpovediac “jednoduchý”. Všetko, čo je potrebné spraviť, je nájsť extrémy novovzniknutej L funkcie podľa všetkých troch premenných (x,y,lambda).
Čiže budeme hľadať, pre aké x,y,lambda sa parciálne derivácie podľa každej z troch premenných rovnajú nule. Samozrejme “ľahké” je to len v niektorých prípadoch, preto si názorne a konkrétne ukážeme aj ľahké aj ťažšie príklady. Najprv si ale vysvetlíme, prečo má Lagrangeova funkcia práve takýto tvar a ako je možné, že to vyjde?
Úvaha je veľmi ľahká, poďme na to postupne: Ak napríklad zoberieme ako našu funkciu niečo podobné ako zvlnená zelená plocha vyššie na obrázku a ako väzbu nejakú krivku v rovine xy. Teraz chceme zistiť, kde “nad” touto krivkou má naša funkcia extrém. Krivka bude zadaná nejakou implicitnou rovnicou g(x,y)=0, naša “zelená” funkcia bude z=f(x,y).
Ak by sme tento extrém už poznali, a jeho hodnota by bola c a bolo by to maximum, tak vieme, že všetky ostatné funkčné hodnoty sú od tejto hodnoty c menšie. V rovine xy teraz pre naše maximum c nakreslíme krivku s rovnicou f(x,y)=c (pozn. bude to krivka v rovine tvorená síce funciou f(x,y), ale nech vás to nemýli, pretože naša originálna funkcia priraďuje z=f(x,y), a táto krivka má c pevne určené, čiže napr c=5, takže akoby to bola krivka f(x,y)-c=0 ). Dá sa dokázať, že táto krivka f(x,y)-c=0 bude presne naša krivka g(x,y)=0. Ak teraz vezmeme našu hodnotu c a budeme ju mierne meniť, zmení sa mierne aj krivka f(x,y)-c=0. Veľa zmien hodnoty c nám vytvorí veľa rôznych kriviek, ktoré budú vyzerať ako vrstevnice našej pôvodnej funkcie premietnuté do roviny xy. Na týchto vrstevniciach bude vidno, že v istom bode sa najviac primkýnajú k našej pôvodnej krivke g(x,y)=0. Bude to nejaký bod B. V tomto bode sa v nie nekonečnom priblížení istá vrstevnica vytvorená zmenou hodnoty c až dotkne krivky g(x,y). V tomto bode budú mať obidve tieto krivky rovnakú dotičnicu, rovnaký smer rastu, avšak nie rovnakú rýchlosť rastu, keďže ďalej od tohto bodu už nejdú rovnako, ale oddialujú sa od seba. Ak majú v tomto bode dotyčnice, ktoré majú rovnaký smer, znamená to, že jedna je nejakým násobkom druhej (sú lineárne závislé), tento násobok nazveme lambda. Z tohto nám vyplýva, že derivácia f(x,y) je nejakým lambda násobkom derivácie funkcie g(x,y). Derivujeme parciálne podľa oboch premenných, teda gradient f(x,y)=lambda*gradient g(x,y). Tento tvar dostaneme práve po parciálnom derivovaní horeuvedenej Lagrangeovej funkcie. Viac a podrobnejšie, prečo je to celé takto, nájdete tu.

Príklady

Poďme si teda uviesť konkrétny celý výpočet. Zadanú máme nasledujúcu funkciu g a máme nájsť extrémy na množine M:

fmfi_mat_a4_036

Funkcia g priraďuje trom hodnotám nejakú štvrtú hodnotu. Množina M je akoby otočený zaoblený kužeľ, pretože ak sa pozrieme na rovnice množiny M, tak x^2+y^2 je menšie ako z, to je pre pevné z vlastne rovnica kruhu, ktorý má polomer odmocnina zo z. Takže ak budeme meniť hodnotu z, bude sa meniť aj polomer kruhu. A keďže nám z udáva akoby výšku, v ktorej sa kruh nachádza, tak zo zvyšujúcim sa z, sa bude rozširovať aj teleso. Oblúkom to pôjde preto, lebo polomer je odmocnina zo z, a mocninová funkcia je zaoblená.

fmfi_mat_a4_037

Funkcia g sa nakresliť ani predstaviť nedá, lebo je akoby štvorrozmerná. pozn.: napríklad funkcia z=2x+3y je trojrozmerná, dá sa predstaviť ako každému bodu B=(x,y) v rovine xy sa priradí nejaká hodnota z a tú zakreslíme niekde v priestore ako bod D=(x,y,z), ak však trom hodnotám priraďujeme štvrtú, nemáme to ako zakresliť, pretože každému bodu z priestoru priraďujeme ďalšiu hodnotu. Máme teda nájsť extrémy funkcie g na množine M. Množina M je paraboloid z obrázku. Keďže z patrí 0 až nekonečno, budeme brať iba z kladné. Hranicu paraboloidu si môžeme upraviť do implicitného tvaru ako:

fmfi_mat_a4_038

Ľavú stranu tejto rovnice teraz zoberieme ako väzbovú funkciu a doplníme do Lagrangeovej funkcie nasledovne:

fmfi_mat_a4_039

Teraz vyrátame parciálne derivácie novovzniknutej Lagrangeovej funkcie podľa všetkých štyroch premenných a tie položíme rovné nule, pretože chceme zistiť, kedy sa nule rovnajú. Zo získaných rovníc vyjadríme a vypočítame ich hodnoty, ktoré nám určia stacionárny bod (pretože ak nám čosi vyjde, neznamená to hneď, že to už musí byť extrém!)

fmfi_mat_a4_040

V našom prípade nám cez Lagrangeovu funkciu vyšiel iba jeden stacionárny bod a to (-1/2,-1/2,1/2). Je to bod na hranici daného telesa. Lambda pre tento bod nám vyšla rovná 1. V iných príkladoch je možné, že by nám vyšlo aj viacero stacionárnych bodov. Daný výpočet vlastne nie je nič iné, ako sústava štyroch rovníc o štyroch neznámych.

Stacionárne body, ktoré nám výjdu, budú stacionárne body na hranici daného telesa, keďže sme znamienko nerovnosti zmenili na rovnosť. Stacionárne body vnútri telesa vypočítame potom úplne jednoducho a to tak, že nájdeme stacionárne body čisto originálnej funkcie g(x,y,z), tie dosadíme do nerovnosti množiny M a zistíme, či nerovnosť platí. V našom prípade ale funkcia g(x,y,z) po parciálnych deriváciách dá gradient (1,1,1), čo sa nikdy nerovná nule (pozn. gradient – vektor všetkých parciálnych derivácií).

Cez Lagrangeovu funkciu sme teda získali jediný stacionárny bod a to (-1/2,-1/2,1/2). Ako teraz zistíme, či daný stacionárny bod je maximum, minimum, sedlový bod alebo či tam extrém nie je? Ľahko, a to cez Hessovu maticu.

Hessova matica

Hessova matica je matica všetkých kombinácií druhých parciálnych derivácií Lagrangeovej funkcie. Všeobecný tvar má taký ako vidíme na obrázku nižšie, pod ním máme už dosadené naše všeobecné hodnoty. Do týchto všeobecných hodnôt (v inom príklade sa tam určite objaví menej núl a viac premenných, kľudne aj x,y alebo z) teraz dosadíme postupne všetky získané stacionárne body z Lagrangeovej funkcie, v našom prípade iba jeden. Dostávame maticu s dvomi dvojkami na diagonále, ostané sú nuly. Taktiež je to iba v tomto prípade, pretože je jednoduchý. Z vzniknutej matice po dosadení konkrétneho bodu sa vo všeobecnom prípade už dá zistiť, akým extrémom je daný stacionárny bod.

fmfi_mat_a4_041

fmfi_mat_a4_042

fmfi_mat_a4_043Vo všeobecnosti môžeme mať príklady dvojrozmerné alebo trojrozmerné.
Pri dvojrozmerných budeme mať Hessovu maticu iba v rozmeroch 2×2.
Pri trojrozmerných bude Hessova matica 3×3.
Pre obidva tieto prípady platia iné pravidlá určenia extrému.
D1 je myslený determinant prvého ľavého horného prvku matice, tj prvok samotný.
D2 je determinant horných štyroch prvkov (pri dvojrozmerných vlastne determinant celej)
D3 je determinant celej Hessovej matice 3×3.

Pri dvojrozmerných:
ak D1>0, D2>0 – lokálne minimum
ak D1<0, D2>0 – lokálne maximum
ak D1-ľubovoľné, D2<0 – nie je to extrém
Pri trojrozmerných:
ak D1>0, D2>0, D3>0 – lokálne minimum
ak D1<0, D2>0, D3<0- lokálne maximum
ak D1,D3-ľubovoľné, D2<0 – nie je to extrém
ak D2>0, D1 a D3 sú nerovnaké, teda D3>0,D1<0 alebo opačne, alebo je niektorý 0 – potom nevieme určiť a musíme použiť metódu s vektormi

Metóda lineárne nezávislých vektorov

Táto metóda sa môže použiť vždy, nie iba ak nám to cez Hessovu maticu nevyjde. Avšak cez Hessovu maticu je to rýchlejšie. Túto metódu preto použijeme iba ak nám to cez Hessovu maticu nevyjde. Cieľom je nájsť dva lineárne nezávislé vektori k danému stacionárnemu bodu. Vezmime si konkrétny bod z nášho začatého príkladu.
Bod máme (-1/2,-1/2,1/2), označme si ho ako bod A. Teraz musíme k nemu nájsť dva kolmé lineárne nezávislé vektori, ktoré si označme u a v. Keďže obidva vektori majú byť kolmé na bod A (tá kolmosť na bod nie je celkom korektné vyjadrenie, ale takto sa to ráta), tak skalárny súčin A.u sa musí rovnať nule, takisto aj A.v
Väčšinou sa niečo také dá odhadnúť pohľadom. Napríklad ak si za u zvolíme vektor u=(2,1,3), tak ak ho skalárne vynásobíme s A=(-1/2,-1/2,1/2), dostaneme 0.
Za vektor v si môžeme zvoliť napríklad v=(1,1,2), skalárne s A nám vyjde opäť nula. Dôležitá je lineárna nezávislosť vektorov u a v, to znamená, že jeden nesmie byť násobkom druhého, čo je v našom prípade splnené.
Vektori u a v si ale prevedieme do všeobecného tvaru s parametrami a,b. To znamená, že akoby ich vynásobíme týmito parametrami. Dostaneme v=(a,a,2a), u=(2b,b,3b).
Tieto dva vektori spočítame dokopy, dostaneme nový vektor w=(a+2b,a+b,2a+3b). Tento vektor použijeme pri nasledovnom výpočte.
Vynásobíme vektor w s Hessovou maticou pre náš bod A, a následne ešte raz s transponovaným vektorom w. Dostaneme tým jeden výraz:

fmfi_mat_a4_044

Ako vidíme, výsledkom je nejaký výraz, kde sa nám objavia parametre a,b.

Parametre a,b sú ľubovoľné, teda môžu byť menšie, rovné alebo väčšie ako nula. Pre všetky tieto možnosti posúdime daný výraz. Ak by bolo a záporné, a na druhú je kladné, ak by bolo a kladné, a na druhú je tiež kladné. Takisto to platí pre b. Z toho nám vyplýva, že časť 4a^2+10b^2 bude vždy kladná, prípadne rovná nule. Časť 8ab bude kladná ak budú obidva parametre buď kladné alebo záporné.
Ak budú mať rozdielne znamienka, bude tento výraz záporný. Avšak keďže ostatné dva výrazy sú vždy kladné a sú dostatočne veľké, celý výraz bude vždy väčší alebo rovný nule. Z toho nám vyplýva, že daný bod A je lokálne minimum.
Ak by sme úvahamy prišli k tomu, že výraz je vždy menší ako nula, bude bod lokálne maximum. Ak by sme však úvahami prišli k tomu, že pre rôzne parametre a,b je daný výraz úplne rôzny, tj nie je vždy buď viac alebo vždy menej ako nula, daný bod bude sedlovým bodom. Sedlový bod je taký, ako vidíme na obrázku červený bod. V jednom smere je to maximum a v druhom smere minimum. Funkcia vyzerá naozaj ako nejaké sedlo na koňa.
Úvahy, ktoré pri posudzovaní výrazu je potrebné použiť sú nasledovné: niečo na druhú je vždy kladné, niečo na štvrtú takisto, niečo na tretiu však nevieme určiť. Súčet napríklad 4a^2+a je vždy kladný, lebo aj ak by a bolo záporné, tak 4a^2 bude kladné a v absolútnej hodnote väčšie ako samotné a, čiže výraz bude spolu kladný.
Avšak súčet 4a^2+20a nevieme jednoznačne určiť, pretože 20a by pre záporné a bolo v absolútnej hodnote väčšie ako 4a^2, celý výraz by bol záporný pre záporné a, kladný pre kladné a. Iné úvahy by sa vyskytnúť nemali, keďže v podstate vo všeobecných prípadoch budeme iba násobiť výrazy s parametrami a,b najviac trikrát.
To by bolo o rátaní extrémov z podrobného vysvetlovania všetko. Uveďme si teraz aspoň dva iné príklady na viazané extrémy a aplikujme dané pravidlá počítania:

fmfi_mat_a4_046

 Nájdeme parciálne derivácie, položíme ich rovné nule a dostaneme všetky stacionárne body:

fmfi_mat_a4_047

Teraz môžeme povedať, že jeden zo stacionárnych bodov by mohol byť (0,0,0),

Tento bod však nepatrí množine epsilon, čo si môžeme overiť dosadením.
Taktiež ani ak spravíme kombinácie typu x=0,y=0,lambda=-1, vyjde nám z=0, čiže opäť ten istý bod, ktorý nepatrí množine epsilon.

Ak však zoberieme lambda=-9, vyjdu nám body (3,0,0) a (-3,0,0), ktoré množine epsilon patria.
Ďalej ak lambda=-4, dostávame body (0,2,0) a (0,-2,0).
A napokon lambda=-1, vyrátame body (0,0,1) a (0,0,-1).

Teraz si vytvoríme Hessovu maticu, ktorá nám vyjde nasledovne:

fmfi_mat_a4_048
V tomto príklade nám postupne po dosadení všetkých lámbd opäť vyjdu matice so subdeterminantmi, z ktorých sa extrém nedá určiť podľa už spomínaných pravidiel, musíme opäť použiť vektori.

Pre body (3,0,0) a (-3,0,0) nám vyjde:

fmfi_mat_a4_049

Výraz pre tieto dva body je vždy menší ako nula, z toho nám vyplýva, že tieto dva body budú minimá.

Pre body (0,2,0) a (0,-2,0) zvolíme vektori u=(1,0,1), v=(2,0,1), vyjde nám vektor
w=(a+2b,0,a+b), kde po vynásobení w, H a w transponované vyjde výraz:
10/9(a+2b)^2-6(a+b)^2, ktorému nevieme jednoznačne určiť znamienko, keďže zátvorky budú vždy kladné a konštanty pred zátvorkami sú jedna kladná a druhá záporná. Body (0,2,0) a (0,-2,0) budú teda sedlové body.

Obdobne vyrátame cez vektori aj body (0,0,1) a (0,0,-1), kde nám vyjde, že sú to maximá.

To by bolo k rátaniu viazaných extrémov všetko. Rátanie s vektormi si treba precvičiť, ale v zásade to nie je tak ťažké. A rátanie podľa pravidiel subdeterminantov Hessovej matice je ľahké. Samozrejme, ak nie je zákerné zadanie.

Každopádne “…všetko je ľahké, len na to nevieme prísť…” – povedala raz Petronela.


facebooktwittergoogle_pluspinterestlinkedintumblr

1 komentár

  1. Petronela  - 30. marec 2017 - 12:53

    “…všetko je ľahké, len na to nevieme prísť…” – hovorím.
    A dopĺňam:
    “…ale ak na to prídeme, zrazu si uvedomíme, aké je to ľahké a zrozumiteľné…” :)

Komentáre

Trochu matiky *

Späť hore