Subpochodna


Subróżniczka w encyklopedii

Z Wikipedii, wolnej encyklopedii (Przekierowano z Subpochodna) Przejdź do nawigacji Przejdź do wyszukiwania Funkcja wypukła (niebieski) i „podstyczne” w x0 (czerwony).

Subróżniczka, subgradient, subpochodna (podróżniczka, podgradient, podpochodna) – pojęcia pojawiające się w analizie wypukłej, czyli badaniu funkcji wypukłych, często w powiązaniu z optymalizacją wypukłą.

Spis treści

Motywacja | edytuj kod

Niech f : I R {\displaystyle f\colon I\to \mathbb {R} } będzie funkcją wypukłą o wartościach rzeczywistych określoną na przedziale otwartym prostej rzeczywistej. Taka funkcja nie musi być różniczkowalna w każdym punkcie: przykładowo funkcja wartości bezwzględnej określona wzorem f ( x ) = | x | {\displaystyle f(x)=|x|} jest nieróżniczkowalna dla x = 0. {\displaystyle x=0.} Jednakże, jak widać na rysunku po prawej, dla każdego x 0 {\displaystyle x_{0}} należącego do dziedziny można nakreślić prostą przechodzącą przez punkt ( x 0 , f ( x 0 ) ) , {\displaystyle {\bigl (}x_{0},f(x_{0}){\bigr )},} która w każdym punkcie albo jest styczna, albo leży poniżej wykresu f . {\displaystyle f.} Właśnie nachylenie tej prostej nazywane jest podpochodną (gdyż prosta leży pod wykresem).

Definicja | edytuj kod

Subpochodną funkcji wypukłej f : I R {\displaystyle f\colon I\to \mathbb {R} } w punkcie x 0 {\displaystyle x_{0}} należącym do przedziału otwartego I {\displaystyle I} nazywa się taką liczbę rzeczywistą c , {\displaystyle c,} że

f ( x ) f ( x 0 ) c ( x x 0 ) {\displaystyle f(x)-f(x_{0})\geqslant c(x-x_{0})}

dla każdego x {\displaystyle x} należącego do I . {\displaystyle I.} Można pokazać, że zbiór podpochodnych w punkcie x 0 {\displaystyle x_{0}} jest niepustym przedziałem domkniętym a , b , {\displaystyle [a,b],} gdzie a {\displaystyle a} oraz b {\displaystyle b} oznaczają granice jednostronne

a = lim x x 0 f ( x ) f ( x 0 ) x x 0 {\displaystyle a=\lim _{x\to x_{0}^{-}}{\frac {f(x)-f(x_{0})}{x-x_{0}}}}

oraz

b = lim x x 0 + f ( x ) f ( x 0 ) x x 0 , {\displaystyle b=\lim _{x\to x_{0}^{+}}{\frac {f(x)-f(x_{0})}{x-x_{0}}},}

które zawsze istnieją i spełniają a b . {\displaystyle a\leqslant b.}

Zbiór a , b {\displaystyle [a,b]} wszystkich podpochodnych nazywa się subróżniczką funkcji f {\displaystyle f} w punkcie x 0 . {\displaystyle x_{0}.}

Przykłady | edytuj kod

Niech dana będzie funkcja wypukła f ( x ) = | x | . {\displaystyle f(x)=|x|.} Jej subróżniczką w początku układu jest przedział 1 , 1 . {\displaystyle [-1,1].} subróżniczka w dowolnym punkcie x 0 < 0 {\displaystyle x_{0}<0} jest równa zbiorowi jednoelementowemu { 1 } , {\displaystyle \{-1\},} zaś w punktach x 0 > 0 {\displaystyle x_{0}>0} jest nią zbiór { 1 } . {\displaystyle \{1\}.}

Własności | edytuj kod

  • Funkcja wypukła f : I R {\displaystyle f\colon I\to \mathbb {R} } jest różniczkowalna w punkcie x 0 {\displaystyle x_{0}} wtedy i tylko wtedy, gdy jej subróżniczka składa się tylko z jednego punktu, który jest pochodną w x 0 . {\displaystyle x_{0}.}
  • Punkt x 0 {\displaystyle x_{0}} jest minimum globalnym funkcji f {\displaystyle f} wtedy i tylko wtedy, gdy zero zawiera się w subróżniczce, tzn. na powyższym rysunku można nakreślić tylko poziomą „podstyczną” do wykresu f {\displaystyle f} w punkcie ( x 0 , f ( x 0 ) ) . {\displaystyle {\bigl (}x_{0},f(x_{0}){\bigr )}.} Własność ta jest uogólnieniem faktu, że pochodna funkcji różniczkowalnej zeruje się w minimum lokalnym.

Subgradient | edytuj kod

 Zobacz też: gradient (matematyka).

Pojęcia subpochodnej i subróżniczki mogą być uogólnione na funkcje wielu zmiennych. Jeżeli f : U R {\displaystyle f\colon U\to \mathbb {R} } jest funkcją wypukłą o wartościach rzeczywistych określoną na wypukłym podzbiorze otwartym przestrzeni euklidesowej R n , {\displaystyle \mathbb {R} ^{n},} to wektor v {\displaystyle \mathbf {v} } tej przestrzeni nazywa się subgradientem w punkcie x 0 {\displaystyle \mathbf {x} _{0}} należącym do U , {\displaystyle U,} jeśli dla każdego x {\displaystyle \mathbf {x} } z U {\displaystyle U} zachodzi

f ( x ) f ( x 0 ) v ( x x 0 ) , {\displaystyle f(\mathbf {x} )-f(\mathbf {x} _{0})\geqslant \mathbf {v} \cdot (\mathbf {x} -\mathbf {x} _{0}),}

gdzie mnożenie po prawej oznacza iloczyn skalarny.

Zbiór wszystkich subgradientów w x 0 {\displaystyle x_{0}} nazywa się subróżniczką w x 0 {\displaystyle \mathbf {x} _{0}} i oznacza symbolem f ( x 0 ) . {\displaystyle \partial f(\mathbf {x} _{0}).} Subróżniczka jest zawsze niepustym, wypukłym zbiorem zwartym (tzn. domkniętym i ograniczonym).

Pojęcia te uogólniają się dalej na funkcje wypukłe f : U R {\displaystyle f\colon U\to \mathbb {R} } określone na podzbiorze wypukłym przestrzeni lokalnie wypukłej V . {\displaystyle V.} Funkcjonał v {\displaystyle \mathbf {v} ^{*}} należący do przestrzeni sprzężonej V {\displaystyle V^{*}} nazywa się subgradientem w x 0 {\displaystyle \mathbf {x} _{0}} należącym do U , {\displaystyle U,} jeżeli

f ( x ) f ( x 0 ) v ( x x 0 ) . {\displaystyle f(\mathbf {x} )-f(\mathbf {x} _{0})\geqslant \mathbf {v} ^{*}(\mathbf {x} -\mathbf {x} _{0}).}

Zbiór wszystkich subgradientów w punkcie x 0 {\displaystyle \mathbf {x} _{0}} nazywa się subróżniczką w x 0 {\displaystyle x_{0}} i także oznacza symbolem f ( x 0 ) . {\displaystyle \partial f(\mathbf {x} _{0}).} Subróżniczka zawsze jest wypukłym zbiorem domkniętym. Zbiór ten może być pusty: przykładem może być operator nieograniczony, który jest wypukły, lecz nie ma subgradientu. Jeśli f {\displaystyle f} jest ciągła, to subróżniczka nie jest pusta.

Zobacz też | edytuj kod

Bibliografia | edytuj kod

  • Jean-Baptiste Hiriart-Urruty, Claude Lemaréchal: Fundamentals of Convex Analysis. Springer, 2001. ISBN 3-540-42205-6.
Na podstawie artykułu: "Subpochodna" pochodzącego z Wikipedii
OryginałEdytujHistoria i autorzy