Jensenova nerovnost

Jensenova nerovnost, jež byla pojmenována po dánském matematikovi Johanu Jensenovi, dává do souvislosti obraz konvexní kombinace a konvexní kombinaci obrazů pro konvexní funkci. Lze ji využít při důkazu jiných nerovností (např. A-G nerovnosti nebo Youngovy nerovnosti).

Vyjádření

Nechť φ {\displaystyle \varphi } je reálná funkce, konvexní na uzavřeném intervalu [ a , b ] {\displaystyle \left[a,b\right]} , n N {\displaystyle n\in \mathbb {N} } , ( i n ^ ) ( x i [ a , b ] ) {\displaystyle \left(\forall i\in {\hat {n}}\right)\left(x_{i}\in \left[a,b\right]\right)} .
Potom platí: φ ( i = 1 n λ i x i ) i = 1 n λ i φ ( x i ) {\displaystyle \varphi \left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n}\lambda _{i}\varphi \left(x_{i}\right)} ,
kde ( i n ^ ) ( λ i [ 0 , 1 ] ) {\displaystyle \left(\forall i\in {\hat {n}}\right)\left(\lambda _{i}\in \left[0,1\right]\right)} a i = 1 n λ i = 1 {\displaystyle \sum _{i=1}^{n}\lambda _{i}=1} .
V případě konkávní funkce je nerovnost obrácená.

Důkaz

Konvexnost funkce φ {\displaystyle \varphi } na [ a , b ] {\displaystyle \left[a,b\right]} je ekvivalentní s výrokem:

( x , y [ a , b ] , x < y ) ( λ [ 0 , 1 ] ) ( φ ( λ y + ( 1 λ ) x ) λ φ ( y ) + ( 1 λ ) φ ( x ) ) {\displaystyle \left(\forall x,y\in \left[a,b\right],x<y\right)\left(\forall \lambda \in \left[0,1\right]\right)\left(\varphi \left(\lambda y+(1-\lambda )x\right)\leq \lambda \varphi (y)+(1-\lambda )\varphi (x)\right)} .

Vlastní důkaz proběhne matematickou indukcí podle n {\displaystyle n} .

  • n = 1 {\displaystyle n=1} : případ je triviální,
  • n = 2 {\displaystyle n=2} : tvrzení vyplývá přímo z výše uvedené definice konvexnosti,
  • n n + 1 {\displaystyle n\to n+1} :

Indukční předpoklad: φ ( i = 1 n λ i x i ) i = 1 n λ i φ ( x i ) {\displaystyle \varphi \left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n}\lambda _{i}\varphi \left(x_{i}\right)} .
Dokážeme tuto nerovnost pro n + 1 {\displaystyle n+1} , tedy: φ ( i = 1 n + 1 λ i x i ) i = 1 n + 1 λ i φ ( x i ) {\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)} .
Sporem lze ukázat: ( i 0 n + 1 ^ ) ( λ i 0 1 ) {\displaystyle \left(\exists i_{0}\in {\widehat {n+1}}\right)\left(\lambda _{i_{0}}\neq 1\right)} . Kdyby totiž platil opak, tedy ( i 0 n + 1 ^ ) ( λ i 0 = 1 ) {\displaystyle \left(\forall i_{0}\in {\widehat {n+1}}\right)\left(\lambda _{i_{0}}=1\right)} , pak i = 1 n + 1 λ i = n + 1 2 {\displaystyle \sum _{i=1}^{n+1}\lambda _{i}=n+1\geq 2} , což je spor s předpoklady.

Protože platí: i = 1 n + 1 λ i = 1 {\displaystyle \sum _{i=1}^{n+1}\lambda _{i}=1} , platí také i = 1 , i i 0 n + 1 λ i = λ {\displaystyle \sum _{i=1,i\neq i_{0}}^{n+1}\lambda _{i}=\lambda } , kde λ := 1 λ i 0 {\displaystyle \lambda :=1-\lambda _{i_{0}}} , a tedy: i = 1 , i i 0 n + 1 λ i λ = 1 {\displaystyle \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}=1} .
Snadno lze také ukázat: ( i n + 1 ^ , i i 0 ) ( λ i λ [ 0 , 1 ] ) {\displaystyle \left(\forall i\in {\widehat {n+1}},i\neq i_{0}\right)\left({\frac {\lambda _{i}}{\lambda }}\in \left[0,1\right]\right)} , protože ( i n + 1 ^ , i i 0 ) ( λ i [ 0 , λ ] ) {\displaystyle \left(\forall i\in {\widehat {n+1}},i\neq i_{0}\right)\left(\lambda _{i}\in \left[0,\lambda \right]\right)} .
Pak lze zřejmě psát: φ ( i = 1 n + 1 λ i x i ) = φ ( i = 1 , i i 0 n + 1 λ i x i + λ i 0 x i 0 ) = φ ( λ i = 1 , i i 0 n + 1 λ i λ x i + ( 1 λ ) x i 0 ) {\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)=\varphi \left(\sum _{i=1,i\neq i_{0}}^{n+1}\lambda _{i}x_{i}+\lambda _{i_{0}}x_{i_{0}}\right)=\varphi \left(\lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}+(1-\lambda )x_{i_{0}}\right)} .
Označme: y := i = 1 , i i 0 n + 1 λ i λ x i {\displaystyle y:=\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}} a dokažme, že y [ a , b ] {\displaystyle y\in \left[a,b\right]} . Protože ( i n + 1 ^ ) ( x i [ a , b ] ) {\displaystyle \left(\forall i\in {\widehat {n+1}}\right)\left(x_{i}\in \left[a,b\right]\right)} , můžeme y {\displaystyle y} odhadnout shora, resp. zdola, když za x i {\displaystyle x_{i}} , pro všechna i {\displaystyle i} dosadíme b {\displaystyle b} , resp. a {\displaystyle a} (zřejmě totiž platí: b = i = 1 , i i 0 n + 1 λ i λ b {\displaystyle b=\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}b} , pro a {\displaystyle a} analogicky).
Potom lze napsat: φ ( λ i = 1 , i i 0 n + 1 λ i λ x i + ( 1 λ ) x i 0 ) = φ ( λ y + ( 1 λ ) x i 0 ) {\displaystyle \varphi \left(\lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}+(1-\lambda )x_{i_{0}}\right)=\varphi \left(\lambda y+(1-\lambda )x_{i_{0}}\right)} .
Z uvedené definice konvexnosti plyne: φ ( λ y + ( 1 λ ) x i 0 ) λ φ ( y ) + ( 1 λ ) φ ( x i 0 ) {\displaystyle \varphi \left(\lambda y+(1-\lambda )x_{i_{0}}\right)\leq \lambda \varphi (y)+(1-\lambda )\varphi (x_{i_{0}})} .
Podle indukčního předpokladu lze psát: λ φ ( y ) + ( 1 λ ) φ ( x i 0 ) = λ φ ( i = 1 , i i 0 n + 1 λ i λ x i ) + ( 1 λ ) φ ( x i 0 ) λ i = 1 , i i 0 n + 1 λ i λ φ ( x i ) + ( 1 λ ) φ ( x i 0 ) = i = 1 n + 1 λ i φ ( x i ) {\displaystyle \lambda \varphi (y)+(1-\lambda )\varphi (x_{i_{0}})=\lambda \varphi (\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i})+(1-\lambda )\varphi (x_{i_{0}})\leq \lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}\varphi (x_{i})+(1-\lambda )\varphi (x_{i_{0}})=\sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)} .
Důsledkem tedy je: φ ( i = 1 n + 1 λ i x i ) i = 1 n + 1 λ i φ ( x i ) {\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)} , což je dokazovaná nerovnost.

Související články

Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.