Théorème de projection sur un convexe fermé

Projection de deux points sur un convexe C.

En mathématiques, le théorème de projection orthogonale sur un convexe fermé est un résultat de minimisation de la distance dont le principal corollaire est l'existence d'un supplémentaire orthogonal, donc d'une projection orthogonale sur un sous-espace vectoriel fermé. Dans le cadre particulier d'un espace de Hilbert, il remplace avantageusement le théorème de Hahn-Banach. Il est en effet plus simple à démontrer et plus puissant dans ses conséquences.

Il possède de nombreuses applications, en analyse fonctionnelle, en algèbre linéaire, en théorie des jeux, pour la modélisation mathématiques des sciences économiques ou encore pour l'optimisation linéaire.

Énoncé du théorème

Dans cet article, E désigne un espace préhilbertien réel, c'est-à-dire un espace vectoriel sur R muni d'un produit scalaire, x désigne un vecteur et C un ensemble convexe complet non vide de E.

La version la plus générale du théorème est la suivante :

Théorème de la projection sur un convexe complet —  Il existe une unique application PC de E dans C, dite projection sur le convexe, qui à x associe le point PC(x) de C, tel que la distance de x à C soit égale à celle de x à PC(x). Le vecteur PC(x) est l'unique point de C vérifiant les deux propositions équivalentes :

( 1 ) y C x P C ( x ) x y , ( 2 ) y C x P C ( x ) , y P C ( x ) 0. {\displaystyle {\begin{matrix}(1)&\forall y\in C&\|x-P_{C}(x)\|\leq \|x-y\|,\\(2)&\forall y\in C&\langle x-P_{C}(x),y-P_{C}(x)\rangle \leq 0.\end{matrix}}}

Dans le cas où l'espace E est de Hilbert, c'est-à-dire complet, supposer que C est complet équivaut à supposer qu'il est fermé. L'application PC est parfois dénommée projecteur de meilleure approximation[1].

Démonstration
  • Existence et unicité de PC(x) vérifiant (1) :
    Soient δ la distance entre x et C et pour tout entier n > 0, Fn l'intersection de C et de la boule fermée de centre x et de rayon δ + 1/n. D'après le théorème des fermés emboîtés, il suffit de démontrer que le diamètre de Fn tend vers 0. Or si y et z sont deux points de Fn, d'après l'identité du parallélogramme, 4 ( δ + 1 / n ) 2 2 y x 2 + 2 z x 2 = y + z 2 x 2 + y z 2 , {\displaystyle 4(\delta +1/n)^{2}\geq 2\|y-x\|^{2}+2\|z-x\|^{2}=\|y+z-2x\|^{2}+\|y-z\|^{2},} ce qui se réécrit : y z 2 4 ( δ + 1 / n ) 2 4 y + z 2 x 2 . {\displaystyle \|y-z\|^{2}\leq 4(\delta +1/n)^{2}-4\left\|{\frac {y+z}{2}}-x\right\|^{2}.} En remarquant que le milieu de y et z est un point de C donc à une distance supérieure ou égale à δ de x, on obtient :
    y z 2 4 ( δ + 1 / n ) 2 4 δ 2 = 8 δ n + 4 n 2 , {\displaystyle \|y-z\|^{2}\leq 4(\delta +1/n)^{2}-4\delta ^{2}={\frac {8\delta }{n}}+{\frac {4}{n^{2}}},}
    ce qui conclut.
  • (1) implique (2) :
    Soient y un élément de C et θ un réel compris entre 0 et 1, alors le barycentre θ y + (1 – θ) PC(x), élément de C, est plus éloigné de x que PC(x), d'après la propriété (1), donc :
    x P C ( x ) 2 x P C ( x ) θ ( y P C ( x ) ) 2 {\displaystyle \|x-P_{C}(x)\|^{2}\leq \|x-P_{C}(x)-\theta (y-P_{C}(x))\|^{2}}
    On en déduit la majoration :
    2 θ   x P C ( x ) , y P C ( x ) θ 2 y P C ( x ) 2 {\displaystyle 2\theta \ \langle x-P_{C}(x)\,,\,y-P_{C}(x)\rangle \leq \theta ^{2}\|y-P_{C}(x)\|^{2}}
    Il suffit alors de diviser par θ puis de passer à la limite quand θ tend vers 0 (par valeurs strictement positives) pour obtenir le résultat.
  • (2) implique (1) : x y 2 = x P C ( x ) 2 2 x P C ( x ) , y P C ( x ) + y P C ( x ) 2 x P C ( x ) 2 . {\displaystyle \|x-y\|^{2}=\|x-P_{C}(x)\|^{2}-2\langle x-P_{C}(x)\,,\,y-P_{C}(x)\rangle +\|y-P_{C}(x)\|^{2}\geq \|x-P_{C}(x)\|^{2}.} Remarquons qu'ici, la convexité de C n'est pas utile.

Elle possède de plus les propriétés suivantes :

Propriétés de la projection — La projection PC est

  • idempotente : PCPC = PC ;
  • 1-lipschitzienne, c'est-à-dire que les images de deux points sont à une distance moindre que leurs antécédents ;
  • monotone au sens suivant :
    x 1 , x 2 E P C ( x 1 ) P C ( x 2 ) , x 1 x 2 0 {\displaystyle \forall x_{1},x_{2}\in E\quad \langle P_{C}(x_{1})-P_{C}(x_{2}),x_{1}-x_{2}\rangle \geq 0} .
Démonstration
  • L'application PC est idempotente : En effet, si x est un élément de E, PC(x) est élément du convexe C, son image est donc lui-même.
  • L'application PC est « monotone » : C'est une conséquence directe du fait que 〈PC(x1) – x1, PC(x1) – PC(x2)〉 et 〈PC(x2) – x2, PC(x2) – PC(x1)〉 sont tous deux négatifs ou nuls. En sommant ces deux inégalités on obtient que P C ( x 1 ) P C ( x 2 ) , x 1 x 2 P C ( x 1 ) P C ( x 2 ) 2 0. {\displaystyle \langle P_{C}(x_{1})-P_{C}(x_{2}),x_{1}-x_{2}\rangle \geq \|P_{C}(x_{1})-P_{C}(x_{2})\|^{2}\geq 0.}
  • L'application PC est 1-lipschitzienne : se déduit aussi de la minoration ci-dessus, grâce à l'inégalité de Cauchy-Schwarz.

Principaux corollaires

Dans ce paragraphe, E désigne un espace de Hilbert réel.

Supplémentaire orthogonal

Le théorème de projection est l'un des outils possibles pour prouver l'existence d'un supplémentaire orthogonal pour tout sous-espace vectoriel fermé d'un Hilbert (ou plus généralement, pour tout sous-espace vectoriel complet d'un espace préhilbertien), donc l'existence d'une projection orthogonale sur ce sous-espace. (Une autre approche pour prouver ce corollaire est d'utiliser simplement l'inégalité de Bessel.)

Ce corollaire est le principal ingrédient de preuve du théorème de représentation de Riesz. Joint à ce dernier, il permet de démontrer le théorème de Lax-Milgram, qui aide à la résolution de certaines équations aux dérivées partielles.

Ce corollaire permet également, dans le cadre particulier hilbertien, de démontrer une version simplifiée du théorème de Hahn Banach sans faire appel au lemme de Zorn.

Séparation des convexes

Article détaillé : Séparation des convexes.

Il existe une autre forme du théorème de Hahn-Banach :

Premier théorème de séparation —  Soient A et B deux parties de E non vides et disjointes telles que A – B soit un convexe fermé. Il existe alors une forme linéaire continue f telle que :

sup x A f ( x ) < inf y B f ( y ) {\displaystyle \sup _{x\in A}f(x)<\inf _{y\in B}f(y)} .

Ce résultat s'exprime encore sous la forme suivante :

Deuxième théorème de séparation — Soient A et B deux parties de E non vides et disjointes telles que A soit un convexe fermé et B un convexe compact. Alors il existe une forme linéaire continue f telle que :

sup x A f ( x ) < inf y B f ( y ) {\displaystyle \sup _{x\in A}f(x)<\inf _{y\in B}f(y)} .

Dans le cas de la dimension finie, une forme du théorème de la séparation ne nécessite plus le caractère fermé du convexe :

Séparation en dimension finie —  Si E est de dimension finie, soient x un élément de E et C un convexe ne contenant pas x, alors il existe une forme linéaire f non nulle telle que :

f ( x ) sup y C f ( y ) {\displaystyle f(x)\geq \sup _{y\in C}f(y)} .
Démonstration

Pour démontrer les théorèmes de séparation, montrons tout d'abord un résultat préliminaire (qui est, dans les deux théorèmes, le cas particulier où B est un singleton)  :

  • Soient C un convexe fermé non vide de E et x un élément de E hors de C. Alors il existe une forme linéaire continue f telle que
    f ( x ) > sup y C f ( y ) {\displaystyle f(x)>\sup _{y\in C}f(y)} .
    Soient PC la projection sur C et f la forme linéaire définie par :
    y E f ( y ) = x P C ( x ) , y {\displaystyle \forall y\in E\quad f(y)=\langle x-P_{C}(x),y\rangle } .
    La deuxième caractérisation du projecteur montre que
    sup y C f ( y ) f ( P C ( x ) ) {\displaystyle \sup _{y\in C}f(y)\leq f(P_{C}(x))} .
    D'autre part, les vecteurs x et PC(x) ne sont pas confondus car x n'est pas élément de C, par conséquent le carré de la norme de leur différence est strictement positif, d'où :
    f ( P C ( x ) ) < f ( x ) {\displaystyle f(P_{C}(x))<f(x)\,} ,
    ce qui démontre le résultat préliminaire.
  • Soient A et B deux parties de E non vides et disjointes telles que A – B soit un convexe fermé. Il existe alors une forme linéaire continue f telle que
    sup x A f ( x ) < inf y B f ( y ) {\displaystyle \sup _{x\in A}f(x)<\inf _{y\in B}f(y)} .
    L'ensemble A – B est un convexe fermé non vide ne contenant pas le vecteur nul. Le résultat précédent montre l'existence d'une forme f telle que
    sup x A y B f ( x ) f ( y ) < 0 , {\displaystyle \sup _{x\in A\;y\in B}f(x)-f(y)<0,}
    ce qui démontre la proposition.
  • Le résultat précédent reste vrai si A est un convexe fermé et B un convexe compact.
    Montrons que A – B est fermé. Soit c un élément de l'adhérence de cet ensemble, alors 0 = d ( c , A B ) = inf a A d ( a , c + B ) . {\displaystyle 0=d(c,A-B)=\inf _{a\in A}d(a,c+B).} Par compacité de A et continuité de l'application qui à tout a associe d(a, c + B), il existe donc un élément a de A tel que 0 = d ( a , c + B ) = d ( a c , B ) . {\displaystyle 0=d(a,c+B)=d(a-c,B).} Comme B est fermé, il contient alors a – c, donc c appartient à A – B.
    Ceci démontre que A – B est fermé. Les hypothèses de la proposition précédente sont rassemblées car A – B est convexe ; elles permettent de conclure.
  • Si E est de dimension finie, soient x un élément de E et C un convexe ne contenant pas x, alors il existe une forme linéaire non nulle f telle que :
    y C , f ( x ) f ( y ) . {\displaystyle \forall y\in C,\qquad f(x)\geq f(y).}
    Pour tout élément y de C, notons Ty l'ensemble des formes linéaires f de norme 1 telles que f(x) – f(y) soit positif ou nul. L'objectif est donc de montrer que l'intersection de tous ces Ty est non vide. Or la sphère unité des formes linéaires est compacte car la dimension est finie, et chaque Ty est un fermé de ce compact (comme image réciproque d'un fermé par une application continue). D'après la propriété de Borel-Lebesgue, pour montrer que l'intersection des Ty est non vide, il suffit donc de montrer que pour toute partie finie non vide D de C, l'intersection des Ty quand y varie dans D est non vide.
    Soit K l'enveloppe convexe d'une telle partie finie D. Elle forme un convexe fermé non vide et ne contient pas x. Le résultat préliminaire montre l'existence d'une forme linéaire f telle que f(x) > f(y) pour tout y dans K, en particulier pour tout y dans D, ce qui termine la démonstration.

Autres applications

Ce théorème possède de multiples autres applications.

Il est utilisé en analyse fonctionnelle. Il peut donner lieu à des algorithmes programmables en dimension finie. Un exemple est donné par le théorème de Stampacchia.

En théorie des jeux, John von Neumann établit un théorème fondamental montrant l'existence de stratégies optimales pour les différents joueurs dans un contexte très général[2]. Ce résultat est une conséquence du théorème de projection dans le cadre d'un Hilbert. Il possède de nombreuses conséquences, dont l'une célèbre est l'existence d'un optimum de Pareto sous des hypothèses pas trop contraignantes en sciences économiques[3].

Ce théorème est utilisé pour trouver des expressions équivalentes à l'existence de solutions de systèmes d'inéquations linéaires[4] (théorèmes de l'alternative).

Différentiabilité

Dans ce paragraphe, E désigne un espace euclidien. La projection PC admet alors des dérivées directionnelles en tout point x de C : si l'on note TC(x) le cône tangent à C en x, on a

x C P C ( x ; d ) = P T C ( x ) ( d ) . {\displaystyle x\in C\quad \Rightarrow \quad P_{C}'(x;d)=P_{T_{C}(x)}(d).}

Cependant, en un point n'appartenant pas à C, PC n'a pas nécessairement de dérivée directionnelle. On connait en effet des contre-exemples dus à Joseph Kruskal[5] avec E = R3, puis à Arnold Shapiro (en)[6] avec E = R2.

Notes et références

Notes

  1. Aubin 1987, p. 28.
  2. (de) John von Neumann, « Zur Theorie der Gesellschaftsspiele », Mathematische Annalen, vol. 100, 1928, p. 295-320.
  3. Les textes sur ce sujet sont nombreux, par exemple : (en) M. Voorneveld, « Pareto-Optimal Security Strategies as Minimax Strategies of a Standard Matrix Game », Journal of Optimization Theory and Applications,‎ , p. 203-210.
  4. (en) G. Dantzig et M. Thapa, Linear Programming 2 : Theory and Extensions, Springer, , 448 p. (ISBN 978-0-387-98613-5, lire en ligne).
  5. (en) J. Krusakl, « Two convex counterexamples: a discontinuous envelope function and a nondifferentiable nearest-point mapping », Proc. Amer. Math. Soc., vol. 23,‎ , p. 697-703.
  6. (en) A. Shapiro, « Directionally nondifferentiable metric projection », Journal of Optimization Theory and Applications, vol. 1,‎ , p. 203-204.

Références

  • Jean-Pierre Aubin, Analyse fonctionnelle appliquée, PUF, (ISBN 978-2-13-039264-4) — L'essentiel des démonstrations et des exemples provient de ce livre.
  • Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions] — Ce sujet est rapidement traité en page 79.

Articles connexes

Théorème de Motzkin

v · m
Analyse fonctionnelle
Théorèmes
Articles liés
v · m
Convexité
Géométrie convexe
Interactions géométrie-analyse
Analyse convexe
Utilisations de la convexité
  • icône décorative Portail de la géométrie