Tribu (mathématiques)

Wikipédia:Bons articles

Vous lisez un « bon article » labellisé en 2010.

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Tribu et Algèbre (homonymie).

En mathématiques, une tribu ou σ-algèbre (lire sigma-algèbre) ou plus rarement corps de Borel[1] sur un ensemble X est un ensemble non vide de parties de X, stable par passage au complémentaire et par union dénombrable (donc aussi par intersection dénombrable). Les tribus permettent de définir rigoureusement la notion d'ensemble mesurable.

Progressivement formalisées pendant le premier tiers du XXe siècle, les tribus constituent le cadre dans lequel s'est développée la théorie de la mesure. Leur introduction est notamment rendue nécessaire par le théorème d'Ulam. Les exemples les plus fameux en sont les tribus boréliennes, du nom d'Émile Borel, qui construisit la tribu borélienne de la droite réelle en 1898, et la tribu de Lebesgue, formée des ensembles mesurables définis par Henri Lebesgue en 1901. En conséquence, les tribus sont aussi fondamentales en théorie des probabilités, dont l'axiomatisation moderne s'appuie sur la théorie de la mesure. Dans ce domaine, les tribus ne sont pas seulement le support du formalisme, mais aussi un outil puissant, qui est à la base de la définition de concepts parmi les plus importants : espérance conditionnelle, martingales, etc.

Définition

Définition[2] — Soit X {\displaystyle X} un ensemble. On appelle tribu (ou σ-algèbre) sur X {\displaystyle X} , un ensemble A {\displaystyle {\mathcal {A}}} de parties de X {\displaystyle X} qui vérifie :

  1. A {\displaystyle {\mathcal {A}}} n'est pas vide
  2. A {\displaystyle {\mathcal {A}}} est stable par complémentaire
  3. A {\displaystyle {\mathcal {A}}} est stable par union dénombrable.

Une minorité de sources exigent également que X {\displaystyle X} ne soit pas vide[3] ; cette hypothèse supplémentaire n'est utilisée à aucun endroit de cet article.

Formellement :

  1. A {\displaystyle {\mathcal {A}}} contient {\displaystyle \varnothing }
  2. B A , {\displaystyle \forall B\in {\mathcal {A}},} c B A {\displaystyle {}^{c}B\in {\mathcal {A}}} (où c B {\displaystyle {}^{c}B} désigne le complémentaire de B {\displaystyle B} dans X {\displaystyle X} ).
  3. si n N , B n A {\displaystyle \forall n\in \mathbb {N} ,B_{n}\in {\mathcal {A}}} alors n N B n A {\displaystyle \bigcup _{n\in \mathbb {N} }B_{n}\in {\mathcal {A}}} (l'union est dite « dénombrable » parce que l'ensemble des indices l'est).

La définition qui précède a l'intérêt d'être lisible sans connaître le langage des algèbres de Boole ; si on le connaît, on peut l'exprimer sous forme plus resserrée :

Forme alternative de la définition[4] — Une tribu est une algèbre d'ensembles stable par réunion dénombrable.

Le couple ( X , A ) {\displaystyle \left(X,{\mathcal {A}}\right)} est appelé espace mesurable[5] ou espace probabilisable en fonction du contexte. Sur les espaces mesurables on définit des mesures ; sur les espaces probabilisables on s'intéresse spécifiquement aux probabilités.

Les parties de X {\displaystyle X} qui appartiennent à la tribu A {\displaystyle {\mathcal {A}}} sont appelées ensembles mesurables. Dans un contexte probabiliste, on les appelle événements.

Quelques exemples

  • La tribu dite grossière : A = { , X } {\displaystyle {\mathcal {A}}=\{\varnothing ,X\}} .
  • La tribu dite discrète : A = P ( X ) {\displaystyle {\mathcal {A}}={\mathcal {P}}(X)} P ( X ) {\displaystyle {\mathcal {P}}(X)} représente l'ensemble de toutes les parties de X {\displaystyle X} .
  • Si X = { a , b , c , d } {\displaystyle X=\{a,b,c,d\}} alors A = { , { a } , { b , c , d } , X } {\displaystyle {\mathcal {A}}=\{\varnothing ,\{a\},\{b,c,d\},X\}} est une tribu sur X {\displaystyle X} . C'est la plus petite tribu contenant l'ensemble { a } {\displaystyle \{a\}} .
  • Pour tout X {\displaystyle X} , { A P ( X ) A {\displaystyle \{A\in {\mathcal {P}}(X)\,\mid \,A} ou c A {\displaystyle {}^{c}A\,} fini ou dénombrable } {\displaystyle \}\,} est une tribu sur X {\displaystyle X} .
  • En revanche si X {\displaystyle X} est infini, { A P ( X ) A {\displaystyle \{A\in {\mathcal {P}}(X)\,\mid \,A} ou c A {\displaystyle {}^{c}A\,} fini } {\displaystyle \}\,} n'est pas une tribu sur X {\displaystyle X} , bien que ce soit une algèbre de Boole de parties de X {\displaystyle X} .

Motivations

En analyse, l'importance des tribus s'est progressivement affirmée au long des trente premières années du XXe siècle. Le siècle s'ouvre par l'élaboration par Henri Lebesgue de sa théorie de l'intégration. Dans la décennie suivante on commence à exploiter la notion géométrique de mesure en probabilités[6], Johann Radon construit en 1913 une théorie de l'intégration sur R n {\displaystyle \mathbb {R} ^{n}} qui généralise à la fois celle de Lebesgue et celle de Stieltjes[7], Felix Hausdorff définit en 1918 la mesure qui porte aujourd'hui son nom en dimensions non entières[8]. Simultanément, on s'efforce de bâtir une axiomatisation abstraite de l'intégration dans laquelle s'intègreraient toutes ces nouvelles théories. Cette unification, réalisée dans le début des années 1930, s'appuie sur la définition moderne d'une mesure. La notion de tribu en est un élément constitutif.

Les tribus sont également les constructions nécessaires à la définition rigoureuse d'une mesure d'aire (mesure de Lebesgue). En première approche, l'aire pourrait être définie intuitivement comme l'image d'un ensemble A R 2 {\displaystyle A\subset \mathbb {R} ^{2}} par une mesure μ : P ( R 2 ) R + {\displaystyle \mu :{\mathcal {P}}(\mathbb {R} ^{2})\to \mathbb {R} ^{+}} (avec éventuellement μ ( A ) = + {\displaystyle \mu (A)=+\infty } si A = R 2 {\displaystyle A=\mathbb {R} ^{2}} ) vérifiant les propriétés suivantes[9] :

  1. L'ensemble vide "n'a pas d'aire" : μ ( ) = 0 {\displaystyle \mu (\emptyset )=0} .
  2. Les aires s'ajoutent : Si ( A n ) n N {\displaystyle (A_{n})_{n\in \mathbb {N} }} est une suite de parties du plan deux à deux disjointes, alors μ ( n N A n ) = n N μ ( A n ) {\displaystyle \mu (\bigcup _{n\in \mathbb {N} }A_{n})=\sum _{n\in \mathbb {N} }\mu (A_{n})} .
  3. L'aire est invariante par déplacements : Si deux ensembles A {\displaystyle A} et A {\displaystyle A'} se déduisent l'un de l'autre par translation ou rotation, alors μ ( A ) = μ ( A ) {\displaystyle \mu (A)=\mu (A')} .
  4. Pour tout rectangle R {\displaystyle R} non plat, on a 0 < μ ( R ) < + {\displaystyle 0<\mu (R)<+\infty } .

Cependant, il vient le problème suivant.

Théorème — Il n'existe pas d'application de P ( R 2 ) {\displaystyle {\mathcal {P}}(\mathbb {R} ^{2})} dans R + {\displaystyle \mathbb {R} ^{+}} vérifiant les quatre propriétés ci-dessus[9].

Démonstration

Supposons qu'il existe une application μ : P ( R 2 ) R + {\displaystyle \mu :{\mathcal {P}}(\mathbb {R} ^{2})\to \mathbb {R} ^{+}} vérifiant les propriétés (1) à (4). On identifie R 2 {\displaystyle \mathbb {R} ^{2}} à C {\displaystyle \mathbb {C} } et notons Ω {\displaystyle \Omega } le disque unité de C {\displaystyle \mathbb {C} } privé de 0 {\displaystyle 0} .

Ω = { u C 0 <∣ u ∣< 1 } {\displaystyle \Omega =\{u\in \mathbb {C} \,\mid \,0<\mid u\mid <1\}}

Posons également T = { γ C γ ∣= 1 } {\displaystyle T=\{\gamma \in \mathbb {C} \,\mid \,\mid \gamma \mid =1\}} . Géométriquement, T {\displaystyle T} s'identifie au groupe des rotations de R 2 = C {\displaystyle \mathbb {R} ^{2}=\mathbb {C} } centrées en 0 {\displaystyle 0} . Un nombre γ = e i θ T {\displaystyle \gamma =e^{i\theta }\in T} s'identifie à la rotation r γ {\displaystyle r_{\gamma }} d'angle θ {\displaystyle \theta } . Pour u C {\displaystyle u\in \mathbb {C} } , on écrira γ u {\displaystyle \gamma \cdot u} au lieu de r γ ( u ) {\displaystyle r_{\gamma }(u)} et pour tout ensemble E Ω {\displaystyle E\subset \Omega } , on pose γ E = { γ u u E } {\displaystyle \gamma \cdot E=\{\gamma \cdot u\,\mid \,u\in E\}} . Comme les rotations préservent les longueurs, Ω {\displaystyle \Omega } est stable par n'importe quelle rotation. Autrement dit, le groupe T {\displaystyle T} agit sur Ω {\displaystyle \Omega } . Soit maintenant Γ T {\displaystyle \Gamma \subset T} l'ensemble des "rotations rationnelles".

Γ = { e i θ θ 2 π Q } {\displaystyle \Gamma =\{e^{i\theta }\,\mid \,\theta \in 2\pi \mathbb {Q} \}}

Γ {\displaystyle \Gamma } est un sous-groupe de T {\displaystyle T} , donc on définit une relation d'équivalence sur Ω {\displaystyle \Omega } telle que

u v γ Γ , γ u = v {\displaystyle u\sim v\Longleftrightarrow \exists \gamma \in \Gamma ,\,\gamma \cdot u=v}

On note C {\displaystyle {\mathcal {C}}} l'ensemble des classes d'équivalence pour la relation {\displaystyle \sim } .

Grâce à l'axiome du choix, il est possible de choisir un point u C {\displaystyle u_{C}} dans chaque classe d'équivalence C C {\displaystyle C\in {\mathcal {C}}} . Si on pose E = { u C C C } {\displaystyle E=\{u_{C}\,\mid \,C\in {\mathcal {C}}\}} , alors E {\displaystyle E} rencontre chaque classe d'équivalence C C {\displaystyle C\in {\mathcal {C}}} en exactement un point (à savoir u C {\displaystyle u_{C}} ). On en déduit que E {\displaystyle E} possède les propriétés suivantes :

(i) γ Γ γ E = Ω {\displaystyle \bigcup \limits _{\gamma \in \Gamma }\gamma \cdot E=\Omega }

(ii) Les ensembles γ E {\displaystyle \gamma \cdot E} sont deux à deux disjoints.

La propriété (i) est évidente puisque E {\displaystyle E} rencontre chaque classe d'équivalence. Pour (ii), supposons que ( γ E ) ( γ E ) {\displaystyle (\gamma \cdot E)\cap (\gamma '\cdot E)\neq \emptyset } avec γ , γ Γ {\displaystyle \gamma ,\gamma '\in \Gamma } . Soit u , u E {\displaystyle u,u'\in E} tels que γ u = γ u {\displaystyle \gamma \cdot u=\gamma '\cdot u'} . Alors u u {\displaystyle u\sim u'} et donc u = u {\displaystyle u=u'} car E {\displaystyle E} rencontre chaque classe en au plus un point. Ainsi γ u = γ u {\displaystyle \gamma \cdot u=\gamma '\cdot u} et donc γ = γ {\displaystyle \gamma =\gamma '} car u 0 {\displaystyle u\neq 0} . Comme Γ {\displaystyle \Gamma } est dénombrable, on doit avoir par (i) et (ii) et (2)

μ ( Ω ) = γ Γ μ ( γ E ) {\displaystyle \mu (\Omega )=\sum _{\gamma \in \Gamma }\mu (\gamma \cdot E)}

Mais par (3), on a aussi μ ( γ E ) = μ ( E ) {\displaystyle \mu (\gamma \cdot E)=\mu (E)} pour tout γ Γ {\displaystyle \gamma \in \Gamma } . Comme Γ {\displaystyle \Gamma } est infini, on en déduit que la somme γ Γ μ ( γ E ) {\displaystyle \sum _{\gamma \in \Gamma }\mu (\gamma \cdot E)} vaut ou bien 0 {\displaystyle 0} (si μ ( E ) = 0 {\displaystyle \mu (E)=0} ) ou bien + {\displaystyle +\infty } (si μ ( E ) > 0 {\displaystyle \mu (E)>0} ). Ainsi μ ( Ω ) { 0 , + } {\displaystyle \mu (\Omega )\in \{0,+\infty \}} . Pour conclure, on applique alors la proposition suivante :

Si A R 2 {\displaystyle A\subset \mathbb {R} ^{2}} est borné, alors μ ( A ) < + {\displaystyle \mu (A)<+\infty } . Si A R 2 {\displaystyle A\subset \mathbb {R} ^{2}} est d'intérieur non vide, alors μ ( A ) > 0 {\displaystyle \mu (A)>0} .
Démonstration

Il découle de (2) que μ {\displaystyle \mu } est croissante : Si A A {\displaystyle A\subset A'} alors μ ( A ) μ ( A ) {\displaystyle \mu (A)\leq \mu (A')} car A {\displaystyle A} est la réunion disjointe de A {\displaystyle A'} et A A {\displaystyle A\backslash A'} donc on a μ ( A ) = μ ( A ) + μ ( A A ) μ ( A ) {\displaystyle \mu (A)=\mu (A')+\mu (A\backslash A')\geq \mu (A')} . Par (4), on en déduit que si A {\displaystyle A} est borné, alors A {\displaystyle A} est contenu dans un rectangle R {\displaystyle R} et on a alors μ ( A ) μ ( R ) < + {\displaystyle \mu (A)\leq \mu (R)<+\infty } . Si A {\displaystyle A} est d'intérieur non vide, il contient donc une boule d'un certain rayon, qui elle-même contient un rectangle, on a donc 0 < μ ( R ) μ ( A ) {\displaystyle 0<\mu (R)\leq \mu (A)} .

D'après la proposition précédente, on a 0 < μ ( Ω ) < + {\displaystyle 0<\mu (\Omega )<+\infty } , or on a montré que μ ( Ω ) { 0 , + } {\displaystyle \mu (\Omega )\in \{0,+\infty \}} , absurde. L'absurdité vient du fait qu'on a supposé l'existence de cette application.

Remarque : On pourrait rétorquer que la propriété d'additivité dénombrable (2) est trop forte, et qu'on pourrait se contenter d'exiger l'additivité finie (2') : ( μ ( k = 0 n A k ) = k = 0 n A k ) {\displaystyle {\Big (}\mu (\bigcup _{k=0}^{n}A_{k})=\sum _{k=0}^{n}A_{k}{\Big )}} pour voir si la contradiction disparaît. Dans ce cas, Banach a montré en utilisant l'axiome du choix qu'il est possible d'attribuer une aire à toutes les parties du plan de façon que (1), (2'), (3) et (4) soient vérifiées, mais Hausdorff a montré que ceci est impossible en dimension 3 {\displaystyle 3}  : on ne peut pas attribuer un volume à toutes les parties de R 3 {\displaystyle \mathbb {R} ^{3}} de sorte que la fonction volume soit finiment additive et invariante par rotations, et que le volume du cube unité soit fini et non nul. Le paradoxe de Banach-Tarski traite un résultat similaire[9].

Il faut donc accepter que certains ensembles n'aient pas d'aire, on doit donc restreindre la notion d'aire à un ensemble de parties A {\displaystyle {\mathcal {A}}} qui possèdent une aire. On a besoin que A {\displaystyle {\mathcal {A}}} soit stable par réunion dénombrable au vu de (2), de même il serait nécessaire que A {\displaystyle {\mathcal {A}}} soit stable par passage au complémentaire. Cela permet donc d'introduire la notion de tribu, on introduit également la notion de mesure au sens large, qui se contentera de ne vérifier que (1) et (2), puisque (3) et (4) sont des propriétés qu'on attendrait d'une mesure d'aire, et pas forcément d'une mesure dans le cas général[9].

Un exemple de processus aléatoire : le mouvement brownien.

Depuis la publication en 1933 des Fondements de la théorie des probabilités d'Andreï Kolmogorov, les probabilités sont solidement ancrées sur la théorie de la mesure[10]. Les σ-algèbres y jouent un rôle incontournable, peut-être plus central qu'en analyse : ici elles ne sont pas seulement un cadre de travail, mais aussi un outil puissant. La preuve de la loi du zéro-un de Kolmogorov fournit un exemple relativement élémentaire de leur efficacité.

La théorie des processus stochastiques (l'étude probabiliste de phénomènes variant avec le temps) permet de donner une interprétation intuitive de certaines tribus. Par exemple, supposons qu'on s'intéresse à l'évolution du prix d'un actif financier en fonction du temps. L'espace des événements X {\displaystyle X} est l'ensemble des évolutions possibles de cet actif, c'est-à-dire des fonctions associant à chaque instant un prix. Pour chaque valeur t {\displaystyle t} du temps, on définit ainsi une tribu A t {\displaystyle {\mathcal {A}}_{t}}  : étant donné un ensemble A {\displaystyle A} d'événements, on décidera que A {\displaystyle A} est dans A t {\displaystyle {\mathcal {A}}_{t}} si on peut le décrire par une formulation qui, lue par un observateur vivant à la date t {\displaystyle t} , ne se réfère qu'au passé. Pour fixer les idées, si A {\displaystyle A} est l'événement « le cours de l'actif a constamment augmenté pendant l'année 2006 », il appartient à A 2010 {\displaystyle {\mathcal {A}}_{2010}} puisqu'un observateur vivant en 2010 peut en décider en consultant des archives, mais n'est pas dans A 2005 {\displaystyle {\mathcal {A}}_{2005}} (sauf à être extralucide, un observateur vivant en 2005 n'en peut rien savoir). On dispose finalement d'une tribu évoluant en fonction du temps, dont la valeur A t {\displaystyle {\mathcal {A}}_{t}} représente le niveau d'information disponible à la date t {\displaystyle t} . Sa croissance exprime l'expansion constante de l'information disponible. Cette famille croissante de tribus (on parle de filtration) permet alors de formaliser diverses hypothèses sur le phénomène modélisé (via les concepts d'espérance conditionnelle, de martingale, etc.) puis d'en tirer mathématiquement des conclusions[11].

Propriétés élémentaires

  • Une tribu est stable par union finie (appliquer le point 3 de la définition à une suite infinie dénombrable ( A 0 , A 1 , , A n , , A n , A n , ) {\displaystyle (A_{0},A_{1},\ldots ,A_{n},\ldots ,A_{n},A_{n},\ldots )} constituée de n + 1 {\displaystyle n+1} ensembles, le dernier étant répété à l'infini).
  • X A {\displaystyle X\in {\mathcal {A}}} (prendre un élément A A {\displaystyle A\in {\mathcal {A}}} et écrire X = A c A {\displaystyle X=A\cup {}^{c}A} ).
  • A {\displaystyle \varnothing \in {\mathcal {A}}} ( {\displaystyle \varnothing } est le complémentaire de X {\displaystyle X} ).
  • Une tribu est également stable pour l'opération d'intersection dénombrable (d'après les points 2 et 3 de la définition) et a fortiori stable sous intersection finie :
    si n N , A n A {\displaystyle \forall n\in \mathbb {N} ,A_{n}\in {\mathcal {A}}} alors n N A n A {\displaystyle \bigcap _{n\in \mathbb {N} }A_{n}\in {\mathcal {A}}} .
  • Une intersection quelconque (finie, infinie, y compris infinie non-dénombrable) de tribus est une tribu. Ainsi, si ( A i ) i I {\displaystyle \left({\mathcal {A}}_{i}\right)_{i\in I}} est une famille de tribus sur X {\displaystyle X} , alors i A i {\displaystyle \bigcap _{i}{\mathcal {A}}_{i}} est aussi une tribu sur X {\displaystyle X} .
  • A contrario, une union de tribus n'est généralement pas une tribu.
  • Le critère suivant est occasionnellement utile pour prouver qu'un ensemble de parties est une tribu :

Proposition[12] — Soit X {\displaystyle X\,} un ensemble, et soit A {\displaystyle {\mathcal {A}}} un ensemble de parties de X {\displaystyle X\,} qui vérifie :

  1. A {\displaystyle {\mathcal {A}}} n'est pas vide
  2. A {\displaystyle {\mathcal {A}}} est stable par complémentaire
  3. Une union dénombrable d'éléments de A {\displaystyle {\mathcal {A}}} deux à deux disjoints est encore dans A {\displaystyle {\mathcal {A}}}
  4. A {\displaystyle {\mathcal {A}}} est stable par intersection finie.

Alors A {\displaystyle {\mathcal {A}}} est une tribu sur X {\displaystyle X\,} .

On le prouve facilement en remarquant que pour toute suite d'éléments de A {\displaystyle {\mathcal {A}}} (a priori non disjoints) on peut écrire :

n N A n = A 0 ( A 1 c A 0 ) ( A 2 c A 0 c A 1 ) ( A 3 c A 0 c A 1 c A 2 ) {\displaystyle \bigcup _{n\in \mathbb {N} }A_{n}=A_{0}\cup (A_{1}\cap {}^{c}A_{0})\cup (A_{2}\cap {}^{c}A_{0}\cap {}^{c}A_{1})\cup (A_{3}\cap {}^{c}A_{0}\cap {}^{c}A_{1}\cap {}^{c}A_{2})\cup \cdots }

D'autres sources fournissent une variante de cette proposition, en posant comme troisième condition la stabilité par réunion dénombrable croissante. Si on est familier du vocabulaire défini à l'article « lemme de classe monotone », cet énoncé peut se dire ainsi : tout λ-système qui est aussi un π-système est une σ-algèbre[13].

Tribu engendrée par un ensemble de parties

Article détaillé : Tribu engendrée.

Si C {\displaystyle {\mathcal {C}}} est un ensemble arbitraire de parties de X {\displaystyle X} , il existe alors une plus petite tribu (au sens de l'inclusion) contenant C {\displaystyle {\mathcal {C}}} , notée σ ( C ) {\displaystyle \sigma ({\mathcal {C}})} et appelée la tribu engendrée par C {\displaystyle {\mathcal {C}}} .

On prouve l'existence de σ ( C ) {\displaystyle \sigma ({\mathcal {C}})} en la définissant comme l'intersection de toutes les tribus sur X {\displaystyle X} qui contiennent C {\displaystyle {\mathcal {C}}} (cette intersection a un sens, puisqu'au moins une telle tribu existe, à savoir la tribu discrète)[14].

Exemples :

  • Soit A P ( X ) , A X {\displaystyle A\in {\mathcal {P}}(X),A\neq X} et A {\displaystyle A\neq \varnothing } , alors σ ( { A } ) = { , A , c A , X } {\displaystyle \sigma (\{A\})=\{\varnothing ,A,{}^{c}A,X\}} . Pour X = { a , b , c , d } {\displaystyle X=\{a,b,c,d\}} et A = { a } {\displaystyle A=\{a\}} , on retrouve l'exemple donné plus haut.
  • Soit L = { { x } , x X } {\displaystyle {\mathcal {L}}=\{\{x\},x\in X\}} l'ensemble des singletons de l'espace de référence X {\displaystyle X\,} . La tribu σ ( L ) {\displaystyle \sigma ({\mathcal {L}})} est égale à { A P ( X ) , A {\displaystyle \{A\in {\mathcal {P}}(X),A} ou c A {\displaystyle {}^{c}A\,} fini ou dénombrable } {\displaystyle \}\,}  : on retrouve là aussi un exemple déjà mentionné.

On dispose d'un procédé un peu plus constructif de production de σ ( C ) {\displaystyle \sigma ({\mathcal {C}})} , par application itérée à partir des éléments de C { X } {\displaystyle {\mathcal {C}}\cup \{X\}} des opérations d'intersection, de réunion dénombrable et de passage au complémentaire. La construction est toutefois techniquement un peu subtile, car il ne suffit pas de répéter cette itération 0 {\displaystyle \aleph _{0}} fois, il faut faire l'itération 1 {\displaystyle \aleph _{1}} fois, pour cela on définit une application f {\displaystyle f} de source 1 + 1 {\displaystyle \aleph _{1}+1} . La définition de f {\displaystyle f} se fait par récurrence transfinie. La σ {\displaystyle \sigma } -algèbre engendrée sera f ( 1 ) {\displaystyle f(\aleph _{1})} .

Deux exemples importants : les tribus de Borel et de Lebesgue

Articles détaillés : Tribu borélienne et Mesure de Lebesgue.

On appelle tribu de Borel ou tribu borélienne sur un espace topologique donné la tribu engendrée par les ensembles ouverts. Dans le cas simple et fondamental de l'espace usuel à n {\displaystyle n} dimensions, la tribu borélienne de R n {\displaystyle \mathbb {R} ^{n}} est engendrée par une famille dénombrable de parties, les pavés dont les sommets sont à coordonnées rationnelles. Par un résultat mentionné plus loin, elle a donc la puissance du continu — ce qui prouve incidemment qu'elle n'est pas égale à l'ensemble de toutes les parties de R n {\displaystyle \mathbb {R} ^{n}} , qui est de cardinal strictement supérieur[15].

En probabilités, ou dans les théories de l'intégration dérivant de celle de la mesure, la tribu de Borel de R {\displaystyle \mathbb {R} } (ou de la droite achevée R ¯ {\displaystyle {\overline {\mathbb {R} }}} ) joue un rôle prééminent : c'est en effet relativement à elle qu'on définit les fonctions mesurables à valeurs réelles ou les variables aléatoires réelles[16].

Les tribus boréliennes sont le cadre naturel où se rencontrent les théories de l'intégration et la théorie de la mesure, notamment par le théorème de représentation de Riesz qui associe une mesure définie sur la tribu de Borel à certaines fonctionnelles sur un espace de fonctions continues.

Bien que les espaces métriques non dénombrables usuels aient des propriétés topologiques extrêmement dissemblables, toutes leurs tribus boréliennes sont indiscernables. Un théorème de Kuratowski affirme en effet que tous ceux appartenant à une très large classe, les espaces de Lusin, ont des tribus boréliennes isomorphes entre elles et en particulier isomorphes à la tribu de Borel sur la droite réelle. Les espaces de Lusin en tant qu'espaces mesurables sont donc classifiés par leur cardinal[17].

Sur l'espace R n {\displaystyle \mathbb {R} ^{n}} , une autre tribu mérite d'être signalée : la tribu de Lebesgue, dont les éléments sont les ensembles mesurables au sens de Lebesgue. Cette tribu contient strictement la tribu de Borel, dont elle est la complétée pour la mesure de Lebesgue. Si on accepte d'utiliser l'axiome du choix, elle ne coïncide pas non plus avec l'ensemble de toutes les parties de R n {\displaystyle \mathbb {R} ^{n}} .

Constructions de tribus

Tribu image réciproque

Proposition et définition — Soit ( Y , B ) {\displaystyle (Y,{\mathcal {B}})} un espace mesurable, X {\displaystyle X} un ensemble et f : X Y {\displaystyle f\,\colon X\to Y} une application.

L'ensemble f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} défini par :

f 1 ( B ) = { f 1 ( B ) B B } {\displaystyle f^{-1}({\mathcal {B}})=\left\{f^{-1}(B)\,\mid B\in {\mathcal {B}}\right\}}

est une tribu sur X {\displaystyle X} . On l'appelle tribu image réciproque ou tribu engendrée par f {\displaystyle f} .

Démonstration

Assurons-nous que f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} est non vide.

Puisqu'on a B {\displaystyle \emptyset \in {\mathcal {B}}} et f 1 ( ) = {\displaystyle f^{-1}(\emptyset )=\emptyset } , on a alors f 1 ( B ) {\displaystyle \emptyset \in f^{-1}({\mathcal {B}})} .

Vérifions que f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} est stable par passage au complémentaire.

Soit A f 1 ( B ) {\displaystyle A\in f^{-1}({\mathcal {B}})} , par définition il existe B B {\displaystyle B\in {\mathcal {B}}} tel que A = f 1 ( B ) {\displaystyle A=f^{-1}(B)} . Puisque B {\displaystyle {\mathcal {B}}} est une tribu, on a Y B B {\displaystyle Y\backslash B\in {\mathcal {B}}} puis f 1 ( Y B ) f 1 ( B ) {\displaystyle f^{-1}(Y\backslash B)\in f^{-1}({\mathcal {B}})} . Puisqu'on a f 1 ( Y B ) = X f 1 ( B ) {\displaystyle f^{-1}(Y\backslash B)=X\backslash f^{-1}(B)} , alors X f 1 ( B ) f 1 ( B ) {\displaystyle X\backslash f^{-1}(B)\in f^{-1}({\mathcal {B}})} et donc f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} est stable par passage au complémentaire.

On vérifie enfin que f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} est stable par réunion dénombrable.

Soit ( A n ) n N {\displaystyle (A_{n})_{n\in \mathbb {N} }} une suite d'éléments de f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} , par définition on a n N , B n B , A n = f 1 ( B n ) {\displaystyle \forall n\in \mathbb {N} ,\exists B_{n}\in {\mathcal {B}},A_{n}=f^{-1}(B_{n})} . Puisque B {\displaystyle {\mathcal {B}}} est stable par réunion dénombrable, alors n N B n B {\displaystyle \bigcup \limits _{n\in \mathbb {N} }B_{n}\in {\mathcal {B}}} puis f 1 ( n N B n ) f 1 ( B ) {\displaystyle f^{-1}(\bigcup \limits _{n\in \mathbb {N} }B_{n})\in f^{-1}({\mathcal {B}})} . Or, on a f 1 ( n N B n ) = n N f 1 ( B n ) {\displaystyle f^{-1}(\bigcup \limits _{n\in \mathbb {N} }B_{n})=\bigcup \limits _{n\in \mathbb {N} }f^{-1}(B_{n})} , donc n N A n = n N f 1 ( B n ) f 1 ( B ) {\displaystyle \bigcup \limits _{n\in \mathbb {N} }A_{n}=\bigcup \limits _{n\in \mathbb {N} }f^{-1}(B_{n})\in f^{-1}({\mathcal {B}})} et donc f 1 ( B ) {\displaystyle f^{-1}({\mathcal {B}})} est stable par réunion dénombrable.

Comme indiqué un peu plus bas, ceci permet notamment de restreindre une tribu à un sous-ensemble de son univers X {\displaystyle X} . Le lemme de transport est un résultat simple mais utile pour manipuler une image réciproque de tribu définie par une partie génératrice, par exemple une tribu borélienne[18].

Lorsque plusieurs fonctions partent de ( X , A ) {\displaystyle (X,{\mathcal {A}})} — typiquement en probabilités, où plusieurs variables aléatoires sont simultanément considérées au départ d'un même espace — il est facile de généraliser la tribu image réciproque : on parle de tribu engendrée par une famille d'applications (qui sont souvent des variables aléatoires). On trouvera cette définition à l'article « tribu engendrée ».

Tribu image

Proposition et définition[18] — Soit ( X , A ) {\displaystyle (X,{\mathcal {A}})} un espace mesurable, Y {\displaystyle Y} un ensemble et f : X Y {\displaystyle f\,\colon X\to Y} une application.

L'ensemble f ( A ) {\displaystyle f({\mathcal {A}})} défini par :

f ( A ) = { B P ( Y ) f 1 ( B ) A } {\displaystyle f({\mathcal {A}})=\left\{B\in {\mathcal {P}}(Y)\,\mid \,f^{-1}(B)\in {\mathcal {A}}\right\}}

est une tribu sur Y {\displaystyle Y} . On l'appelle tribu image.

Démonstration

On note B = { B P ( Y ) f 1 ( B ) A } {\displaystyle {\mathcal {B}}=\{B\in {\mathcal {P}}(Y)\,\mid \,f^{-1}(B)\in {\mathcal {A}}\}} .

On remarque qu'on a P ( Y ) {\displaystyle \emptyset \in {\mathcal {P}}(Y)} avec f 1 ( ) = A {\displaystyle f^{-1}(\emptyset )=\emptyset \in {\mathcal {A}}} . Donc B {\displaystyle \emptyset \in {\mathcal {B}}} et ainsi B {\displaystyle {\mathcal {B}}} est non vide.

Soit B B {\displaystyle B\in {\mathcal {B}}} , on a par définition f 1 ( B ) A {\displaystyle f^{-1}(B)\in {\mathcal {A}}} , puis on a X f 1 ( B ) A {\displaystyle X\backslash f^{-1}(B)\in {\mathcal {A}}} car A {\displaystyle {\mathcal {A}}} est stable par passage au complémentaire. Or on a f 1 ( Y B ) = X f 1 ( B ) {\displaystyle f^{-1}(Y\backslash B)=X\backslash f^{-1}(B)} . Donc f 1 ( Y B ) A {\displaystyle f^{-1}(Y\backslash B)\in {\mathcal {A}}} et par conséquent on a Y B B {\displaystyle Y\backslash B\in {\mathcal {B}}} . Donc B {\displaystyle {\mathcal {B}}} est stable par passage au complémentaire.

Soit ( B n ) n N {\displaystyle (B_{n})_{n\in \mathbb {N} }} une suite d'éléments de B {\displaystyle {\mathcal {B}}} , on a n N , f 1 ( B n ) A {\displaystyle \forall n\in \mathbb {N} ,f^{-1}(B_{n})\in {\mathcal {A}}} . Puisque A {\displaystyle {\mathcal {A}}} est stable par réunion dénombrable, alors n N f 1 ( B n ) A {\displaystyle \bigcup \limits _{n\in \mathbb {N} }f^{-1}(B_{n})\in {\mathcal {A}}} . Or, on a f 1 ( n N B n ) = n N f 1 ( B n ) {\displaystyle f^{-1}(\bigcup \limits _{n\in \mathbb {N} }B_{n})=\bigcup \limits _{n\in \mathbb {N} }f^{-1}(B_{n})} . Donc n N B n B {\displaystyle \bigcup \limits _{n\in \mathbb {N} }B_{n}\in {\mathcal {B}}} et ainsi B {\displaystyle {\mathcal {B}}} est stable par réunion dénombrable.

Tribu engendrée

Article détaillé : Tribu engendrée.

Théorème — Soit X , Y {\displaystyle X,Y} deux ensembles, F P ( Y ) {\displaystyle {\mathcal {F}}\subset {\mathcal {P}}(Y)} et f : X Y {\displaystyle f:X\to Y} une application. On a

σ X ( f 1 ( F ) ) = f 1 ( σ Y ( F ) ) {\displaystyle \sigma _{X}(f^{-1}({\mathcal {F}}))=f^{-1}(\sigma _{Y}({\mathcal {F}}))}
Démonstration

On a f 1 ( F ) f 1 ( σ Y ( F ) ) {\displaystyle f^{-1}({\mathcal {F}})\subset f^{-1}(\sigma _{Y}({\mathcal {F}}))} car F σ Y ( F ) {\displaystyle {\mathcal {F}}\subset \sigma _{Y}({\mathcal {F}})} . De plus, f 1 ( σ Y ( F ) ) {\displaystyle f^{-1}(\sigma _{Y}({\mathcal {F}}))} est une tribu sur X {\displaystyle X} d'après la proposition précédente sur la tribu image réciproque. Puisque f 1 ( F ) {\displaystyle f^{-1}({\mathcal {F}})} est inclus dans cette tribu et que σ X ( f 1 ( F ) ) {\displaystyle \sigma _{X}(f^{-1}({\mathcal {F}}))} est la plus petite tribu contenant f 1 ( F ) {\displaystyle f^{-1}({\mathcal {F}})} , alors on a σ X ( f 1 ( F ) ) f 1 ( σ Y ( F ) ) {\displaystyle \sigma _{X}(f^{-1}({\mathcal {F}}))\subset f^{-1}(\sigma _{Y}({\mathcal {F}}))} .

Réciproquement, posons B = { B P ( Y ) f 1 ( B ) σ X ( f 1 ( F ) ) } {\displaystyle {\mathcal {B}}=\{B\in {\mathcal {P}}(Y)\,\mid \,f^{-1}(B)\in \sigma _{X}(f^{-1}({\mathcal {F}}))\}} . D'après la proposition précédente sur la tribu image, B {\displaystyle {\mathcal {B}}} est une tribu sur Y {\displaystyle Y} . Soit F F {\displaystyle F\in {\mathcal {F}}} , on a f 1 ( F ) f 1 ( F ) σ X ( f 1 ( F ) ) {\displaystyle f^{-1}(F)\in f^{-1}({\mathcal {F}})\subset \sigma _{X}(f^{-1}({\mathcal {F}}))} et donc par définition de B {\displaystyle {\mathcal {B}}} on a F B {\displaystyle F\in {\mathcal {B}}} i.e. F B {\displaystyle {\mathcal {F}}\subset {\mathcal {B}}} .

Puisque σ Y ( F ) {\displaystyle \sigma _{Y}({\mathcal {F}})} est la plus petite tribu contenant F {\displaystyle {\mathcal {F}}} , on a σ Y ( F ) B {\displaystyle \sigma _{Y}({\mathcal {F}})\subset {\mathcal {B}}} puis
f 1 ( σ Y ( F ) ) f 1 ( B ) = { f 1 ( B ) B B } σ X ( f 1 ( F ) ) {\displaystyle f^{-1}(\sigma _{Y}({\mathcal {F}}))\subset f^{-1}({\mathcal {B}})=\{f^{-1}(B)\,\mid \,B\in {\mathcal {B}}\}\subset \sigma _{X}(f^{-1}({\mathcal {F}}))}

Théorème — Soit ( X , A ) , ( Y , B ) {\displaystyle (X,{\mathcal {A}}),(Y,{\mathcal {B}})} deux espaces mesurables et f : X Y {\displaystyle f:X\to Y} une application. Soit F B {\displaystyle {\mathcal {F}}\subset {\mathcal {B}}} telle que σ Y ( F ) = B {\displaystyle \sigma _{Y}({\mathcal {F}})={\mathcal {B}}} , on a

f 1 ( B ) A f 1 ( F ) A {\displaystyle f^{-1}({\mathcal {B}})\subset {\mathcal {A}}\Longleftrightarrow f^{-1}({\mathcal {F}})\subset {\mathcal {A}}}
Démonstration

Si f 1 ( B ) A {\displaystyle f^{-1}({\mathcal {B}})\subset {\mathcal {A}}} , on a directement f 1 ( F ) f 1 ( B ) A {\displaystyle f^{-1}({\mathcal {F}})\subset f^{-1}({\mathcal {B}})\subset {\mathcal {A}}} puisque F B {\displaystyle {\mathcal {F}}\subset {\mathcal {B}}} .

Réciproquement, puisque σ X ( f 1 ( F ) ) {\displaystyle \sigma _{X}(f^{-1}({\mathcal {F}}))} est la plus petite tribu contenant f 1 ( F ) {\displaystyle f^{-1}({\mathcal {F}})} , on a σ X ( f 1 ( F ) ) A {\displaystyle \sigma _{X}(f^{-1}({\mathcal {F}}))\subset {\mathcal {A}}} . Or on sait que f 1 ( σ Y ( F ) ) = σ X ( f 1 ( F ) ) {\displaystyle f^{-1}(\sigma _{Y}({\mathcal {F}}))=\sigma _{X}(f^{-1}({\mathcal {F}}))} d'après le théorème précédent, donc f 1 ( B ) = f 1 ( σ Y ( F ) ) A {\displaystyle f^{-1}({\mathcal {B}})=f^{-1}(\sigma _{Y}({\mathcal {F}}))\subset {\mathcal {A}}} .

Tribu trace

Proposition et définition — Soit ( X , A ) {\displaystyle (X,{\mathcal {A}})} un espace mesurable et E {\displaystyle E} une partie de X {\displaystyle X} .

La trace de A {\displaystyle {\mathcal {A}}} sur E {\displaystyle E} , c'est-à-dire l'ensemble { A E A A } {\displaystyle \left\{A\cap E\,\mid \,A\in {\mathcal {A}}\right\}} , est une tribu sur E {\displaystyle E} . On l'appelle tribu trace.

De plus, si E A {\displaystyle E\in {\mathcal {A}}} , alors A E = { A A A E } {\displaystyle {\mathcal {A}}_{E}=\{A\in {\mathcal {A}}\,\mid \,A\subset E\}} et donc A E A {\displaystyle {\mathcal {A}}_{E}\subset {\mathcal {A}}} .

Démonstration

Soit F P ( X ) {\displaystyle {\mathcal {F}}\subset {\mathcal {P}}(X)} , l'injection canonique i : { E X x x {\displaystyle i:\left\{{\begin{array}{rcl}E&\longrightarrow &X\\x&\longmapsto &x\end{array}}\right.} vérifie pour tout F F {\displaystyle F\in {\mathcal {F}}}

i 1 ( F ) = { x E i ( x ) F } = { x E x F } = E F {\displaystyle i^{-1}(F)=\{x\in E\,\mid \,i(x)\in F\}=\{x\in E\,\mid \,x\in F\}=E\cap F}

Ainsi on a :

i 1 ( F ) = { i 1 ( F ) F F } = { F E F F } = F E {\displaystyle i^{-1}({\mathcal {F}})=\{i^{-1}(F)\,\mid \,F\in {\mathcal {F}}\}=\{F\cap E\,\mid \,F\in {\mathcal {F}}\}={\mathcal {F}}_{E}}

En reprenant l'injection canonique, on a A E = i 1 ( A ) {\displaystyle {\mathcal {A}}_{E}=i^{-1}({\mathcal {A}})} , qui est une tribu d'après la proposition sur la tribu image réciproque.

Si E A {\displaystyle E\in {\mathcal {A}}} , alors A A , A E A {\displaystyle \forall A\in {\mathcal {A}},\,A\cap E\in {\mathcal {A}}} car A {\displaystyle {\mathcal {A}}} est stable par intersection dénombrable. De plus, puisque A E A {\displaystyle A\cap E\in {\mathcal {A}}} et A E E {\displaystyle A\cap E\subset E} , on a
A E = { A E A A } { B A B E } {\displaystyle {\mathcal {A}}_{E}=\{A\cap E\,\mid \,A\in {\mathcal {A}}\}\subset \{B\in {\mathcal {A}}\,\mid \,B\subset E\}}
Or, puisque pour tout C { B A B E } {\displaystyle C\in \{B\in {\mathcal {A}}\,\mid \,B\subset E\}} , on peut écrire C = C E {\displaystyle C=C\cap E} , alors on a C { A E A A } {\displaystyle C\in \{A\cap E\,\mid \,A\in {\mathcal {A}}\}} et donc
{ B A B E } { A E A A } = A E {\displaystyle \{B\in {\mathcal {A}}\,\mid \,B\subset E\}\subset \{A\cap E\,\mid \,A\in {\mathcal {A}}\}={\mathcal {A}}_{E}}

Tribu produit

Article détaillé : Tribu produit.

Définition — Soit ( X 1 , A 1 )   {\displaystyle (X_{1},{\mathcal {A}}_{1})\ } et ( X 2 , A 2 )   {\displaystyle (X_{2},{\mathcal {A}}_{2})\ } deux espaces mesurables. La tribu produit, notée A 1 × A 2   {\displaystyle {\mathcal {A}}_{1}\times {\mathcal {A}}_{2}\ } ou A 1 A 2   {\displaystyle {\mathcal {A}}_{1}\otimes {\mathcal {A}}_{2}\ } , est la tribu de parties du produit cartésien X 1 × X 2   {\displaystyle X_{1}\times X_{2}\ } engendrée par les pavés A 1 × A 2 ,   {\displaystyle A_{1}\times A_{2},\ } A i A i , i { 1 , 2 }   :   {\displaystyle A_{i}\in {\mathcal {A}}_{i},\quad i\in \{1,2\}\ :\ }

A 1 × A 2   =   σ ( { A 1 × A 2   |   A 1 A 1 ,   A 2 A 2 } ) . {\displaystyle {\mathcal {A}}_{1}\times {\mathcal {A}}_{2}\ =\ \sigma \left(\left\{A_{1}\times A_{2}\ |\ A_{1}\in {\mathcal {A}}_{1},\ A_{2}\in {\mathcal {A}}_{2}\right\}\right).}

La définition de la tribu produit est le préalable à celle de la mesure produit dont l'usage permet de généraliser à des espaces abstraits les intégrales multiples[19].

Le concept se généralise à un produit d'une famille infinie d'espaces mesurables[20].

Tribu cylindrique

Définition — Soit ( ( X n , A n ) ) n N {\displaystyle ((X_{n},{\mathcal {A}}_{n}))_{n\in \mathbf {N} ^{*}}} une suite d’espaces mesurables, et X = n N X n {\displaystyle X=\prod \limits _{n\in \mathbf {N} ^{*}}X_{n}} . On appelle tribu cylindrique la tribu sur X {\displaystyle X} engendrée par l’ensemble des cylindres :

C = { A 1 × × A k × n k + 1 X n k N , ( A 1 , , A k ) A 1 × × A k } {\displaystyle C=\left\{A_{1}\times \dots \times A_{k}\times \prod \limits _{n\geqslant k+1}X_{n}\mid k\in \mathbf {N} ,(A_{1},\dots ,A_{k})\in {\mathcal {A}}_{1}\times \dots \times {\mathcal {A}}_{k}\right\}}

La définition se généralise à une famille quelconque d’espaces mesurables.

Comme dans le cas d’un produit fini, on peut alors définir le produit de mesures grâce au théorème d'extension de Carathéodory, mais il faut pour cela des hypothèses sur les espaces mesurables.

Théorème — Si les ( X n , T n ) {\displaystyle (X_{n},{\mathcal {T}}_{n})} sont des espaces topologiques quasi‐compacts dont les A n {\displaystyle {\mathcal {A}}_{n}} sont les tribus boréliennes (en particulier si les X n {\displaystyle X_{n}} sont finis) et que ( μ n ) n N {\displaystyle (\mu _{n})_{n\in \mathbf {N} ^{*}}} est une suite de mesures de probabilité définies sur ces espaces mesurables, alors il existe une unique mesure μ {\displaystyle \mu } sur ( X , σ ( C ) ) {\displaystyle (X,\sigma (C))} telle que :

k N , ( A 1 , , A k ) A 1 × × A k , μ ( A 1 × × A k × n k + 1 X n ) = μ 1 ( A 1 ) × × μ k ( A k ) {\displaystyle \forall k\in \mathbf {N} ,\forall (A_{1},\dots ,A_{k})\in {\mathcal {A}}_{1}\times \dots \times {\mathcal {A}}_{k},\mu \left(A_{1}\times \dots \times A_{k}\times \prod \limits _{n\geqslant k+1}X_{n}\right)=\mu _{1}(A_{1})\times \dots \times \mu _{k}(A_{k})}

Cet outil est plus faible que le précédent mais peut suffire dans certains cas simples, en probabilités notamment. Ainsi, des problèmes tels que le problème du collectionneur de vignettes ou le jeu de pile ou face infini s’étudient sur des espaces probabilisés de la forme (Ω, σ(C), P) où l’on pose Ωn l’univers des possibles au ne tirage ({Pile, Face} pour le pile ou face infini ; [1,k ] pour le problème du collectionneur si les vignettes sont étiquetées de 1 à k), Pn une probabilité (par exemple la loi uniforme) sur l’espace probabilisable ( Ω n , P ( Ω i ) ) {\displaystyle (\Omega _{n},{\mathcal {P}}(\Omega _{i}))} , Ω = n N Ω n {\displaystyle \Omega =\prod \limits _{n\in \mathbb {N} }\Omega _{n}} l’univers des possibles pour l’ensemble du tirage aléatoire, σ(C) et P la tribu cylindrique et la probabilité obtenues par le procédé décrit précédemment.

Tribu complétée

Article détaillé : Complétion d'une mesure.

Proposition et définition — Soit   ( X , A , μ ) {\displaystyle \ (X,{\mathcal {A}},\mu )} un espace mesuré.

L'ensemble A ¯ μ {\displaystyle {\overline {\mathcal {A}}}_{\mu }} défini par :

A ¯ μ = { A N A A ,   N  partie négligeable de  X } {\displaystyle {\overline {\mathcal {A}}}_{\mu }=\{A\cup N\,\mid \,A\in {\mathcal {A}},\ N{\hbox{ partie négligeable de }}X\}}

est une tribu sur X {\displaystyle X} . On l'appelle tribu complétée.

Le résultat de la complétion dépend de μ {\displaystyle \mu } , puisque la notion de partie négligeable n'a de sens que vis-à-vis d'une mesure bien précisée[21].

La construction généralise dans un cadre abstrait la situation de la tribu de Lebesgue relativement à la tribu borélienne de ℝn (sous la mesure de Lebesgue).

Notion d'atomes et cardinalité des tribus

Pour élément x de X, on définit l'atome de x relativement à la tribu par :

C ( x ) = x A A A A . {\displaystyle C(x)=\bigcap _{{x\in A} \atop {A\in {\mathcal {A}}}}A.}

En utilisant seulement la stabilité de A {\displaystyle {\mathcal {A}}} par passage au complémentaire, on vérifie que les atomes constituent une partition de X (les atomes sont donc les classes d'équivalence d'éléments de X, pour la relation d'équivalence : « appartenir exactement aux mêmes éléments de A {\displaystyle {\mathcal {A}}}  »). On voit également que tout élément de A {\displaystyle {\mathcal {A}}} est réunion d'atomes[22] mais qu'un atome n'est pas forcément[23] un élément de A {\displaystyle {\mathcal {A}}} [24].

Ce concept permet notamment de prouver la proposition suivante[25] :

Proposition — Toute tribu infinie a au moins la puissance du continu.

Démonstration

Supposons infinie la tribu A {\displaystyle {\mathcal {A}}} sur l'ensemble X. Comme tout élément de A {\displaystyle {\mathcal {A}}} est réunion d'atomes, les atomes sont eux aussi en nombre infini. Considérons alors ( C ( x i ) ) i N {\displaystyle \left(C(x_{i})\right)_{i\in \mathbb {N} }} une suite d'atomes distincts (donc deux à deux disjoints).

Pour tous indices i j {\displaystyle i\not =j} , la définition de C ( x i ) {\displaystyle C(x_{i})} et le fait que x j C ( x i ) {\displaystyle x_{j}\not \in C(x_{i})} , entraînent l'existence d'un A i j A {\displaystyle A_{ij}\in {\mathcal {A}}} tel que :

( 1 ) x i A i j {\displaystyle (1)\qquad x_{i}\in A_{ij}} mais x j A i j {\displaystyle x_{j}\not \in A_{ij}} .

On définit alors une application Φ : P ( N ) A {\displaystyle \Phi \,\colon \,{\mathcal {P}}(\mathbb {N} )\to {\mathcal {A}}} en posant, pour I N {\displaystyle I\subset \mathbb {N} }  :

Φ ( I ) = i I j i A i j {\displaystyle \Phi (I)=\bigcup _{i\in I}\bigcap _{j\not =i}A_{ij}} .

En utilisant ( 1 ) {\displaystyle (1)} , on vérifie que I = { i N x i Φ ( I ) } {\displaystyle I=\{i\in \mathbb {N} \,\mid \,x_{i}\in \Phi (I)\}} , on conclut que Φ {\displaystyle \Phi } est injective.

La conjonction de ce résultat et de la construction d'une tribu engendrée par récurrence transfinie permet de prouver un résultat plus précis lorsqu'on suppose la tribu dénombrablement engendrée :

Théorème[26] — Soit ( X , A ) {\displaystyle (X,{\mathcal {A}})} un espace mesurable. S'il existe une partie infinie dénombrable de la tribu A {\displaystyle {\mathcal {A}}} qui engendre celle-ci, alors A {\displaystyle {\mathcal {A}}} a la puissance du continu.

Démonstration

Notons C {\displaystyle {\mathcal {C}}} la partie infinie dénombrable de l'énoncé.

Les tribus infinies ont toutes au moins la puissance du continu. A {\displaystyle {\mathcal {A}}} contenant l'ensemble infini C {\displaystyle {\mathcal {C}}} , elle est infinie et son cardinal est donc supérieur ou égal à c {\displaystyle {\mathfrak {c}}} , cardinal du continu.

Montrons l'inégalité inverse. Avec les notations de la section précédente, la classe F 0 {\displaystyle {\mathcal {F}}_{0}} qui initialise l'induction est infinie dénombrable. On construit une réunion dénombrable de parties de F 0 {\displaystyle {\mathcal {F}}_{0}} à partir de chaque suite d'éléments de F 0 {\displaystyle {\mathcal {F}}_{0}} (étant bien sûr entendu que de nombreuses suites fournissent la même réunion). Le cardinal de ( F 0 ) σ {\displaystyle ({\mathcal {F}}_{0})_{\sigma }} est donc inférieur ou égal à celui de ( F 0 ) N {\displaystyle ({\mathcal {F}}_{0})^{\mathbb {N} }} , qui est 0 0 = c {\displaystyle \aleph _{0}^{\aleph _{0}}={\mathfrak {c}}} . Il en est de même avec les intersections et l'on conclut que le cardinal de F 1 {\displaystyle {\mathcal {F}}_{1}} est inférieur ou égal à c {\displaystyle {\mathfrak {c}}} .

En reprenant le même raisonnement, le cardinal de F 2 {\displaystyle {\mathcal {F}}_{2}} est à son tour inférieur ou égal à c 0 = c {\displaystyle {\mathfrak {c}}^{\aleph _{0}}={\mathfrak {c}}} .

On montre alors par récurrence transfinie que pour tout α < ω1 :

c a r d F α c . {\displaystyle \mathrm {card} \,{\mathcal {F}}_{\alpha }\leq {\mathfrak {c}}.}

Quand α est un ordinal successeur c'est la même méthode que celle explicitée sur le passage de F 1 {\displaystyle {\mathcal {F}}_{1}} à F 2 {\displaystyle {\mathcal {F}}_{2}}  ; quand α est un ordinal limite, il est par définition union dénombrable d'ensembles de cardinal inférieur ou égal à c {\displaystyle {\mathfrak {c}}} , donc lui-même de cardinal inférieur ou égal à 0 c = c {\displaystyle \aleph _{0}\,{\mathfrak {c}}={\mathfrak {c}}} .

Enfin, la tribu A {\displaystyle {\mathcal {A}}} est écrite comme une union d'ensembles qui sont tous de la forme F α {\displaystyle {\mathcal {F}}_{\alpha }} , en utilisant un ensemble d'indices de cardinal 1 {\displaystyle \aleph _{1}} . On conclut que c a r d A 1 c = c {\displaystyle \mathrm {card} \,{\mathcal {A}}\leq \aleph _{1}\,{\mathfrak {c}}={\mathfrak {c}}} .

Histoire du concept

La notion de tribu est étroitement liée à celle de mesure, qui est elle-même une généralisation des notions de longueur (sur une droite), d'aire (dans le plan) et de volume (dans l'espace à trois dimensions). Dans la deuxième moitié du XIXe siècle, la question de savoir quels ensembles peuvent être mesurés se pose[27]. La longueur d'un intervalle de bornes a {\displaystyle a} et b {\displaystyle b} est b a {\displaystyle b-a} . Bernhard Riemann, avec l'intégrale qui porte son nom, est le premier à permettre de mesurer des parties de la droite réelle qui ne sont pas des intervalles[28].

À sa suite, d'autres mathématiciens cherchent la meilleure façon de définir les ensembles mesurables : Stolz et Harnack considèrent les réunions finies d'intervalles, dans ℝ. Cependant, Harnack, en 1884, est le premier à évoquer une union dénombrable d'intervalles, il prouve ainsi que tout ensemble dénombrable (dont l'ensemble des nombres rationnels) inclus dans ℝ est de mesure nulle.

« Pour éviter de fausses interprétations, je remarque incidemment que dans un certain sens, tout ensemble “dénombrable” de points peut être confiné dans des intervalles dont la somme des longueurs est arbitrairement petite. Ainsi peut-on par exemple inclure, quoiqu’ils soient denses dans le segment, tous les nombres rationnels entre 0 et 1 dans des intervalles dont la somme des longueurs est aussi petite qu’on veut[29]. »

Cela n'est pas admis par les mathématiciens de l'époque, car paraît contradictoire avec le fait que l'ensemble des nombres rationnels est dense dans celui des réels. En effet, un ensemble de mesure nulle est perçu « très petit » alors qu'un ensemble dense est « très grand »[30].

Ce paradoxe apparent conduit les mathématiciens (dont Camille Jordan en 1892) à ne considérer comme mesurables que les sous-ensembles de ℝ égaux à une union finie d'intervalles[30].

Émile Borel, père de la tribu borélienne de la droite réelle.

En 1898, Émile Borel s'appuie sur les réunions dénombrables d'intervalles ouverts disjoints deux à deux et construit, par récurrence transfinie, l'ensemble de parties qu'on appelle aujourd'hui la tribu borélienne de la droite réelle[31]. Les boréliens ont la propriété suivante : la mesure d'une réunion d'ensembles boréliens deux à deux disjoints est égale à la somme des mesures de chacun de ces ensembles[32].

Les travaux contemporains de René Baire méritent aussi d'être mentionnés. Ils ont en effet nourri l'inspiration de ses contemporains en prouvant l'efficacité des techniques ensemblistes en analyse, même si c'est ailleurs que dans les fondements de l'intégration qu'ils ont révélé leur fécondité[33].

Les années 1901 à 1904 voient la publication par Henri Lebesgue de la théorie de la mesure des parties de l'espace euclidien et de la théorie de l'intégration qui portent son nom. Les ensembles mesurables qu'il définit forment un deuxième exemple de tribu, qui est l'ensemble de définition de la mesure de Lebesgue. On sait rapidement qu'en présence de l'axiome du choix il existe des ensembles non mesurables : il n'est plus question d'espérer mesurer toute partie de l'espace[34].

Les années 1910 voient se développer des recherches où l'accent est mis sur les fondements ensemblistes de la théorie de l'intégration et désormais aussi des probabilités. Felix Hausdorff et surtout Constantin Carathéodory, dont l'axiomatique des mesures extérieures étend à un cadre abstrait les travaux de Lebesgue[35], ont fait progresser ces recherches. En 1915, Maurice Fréchet publie un article qui propose déjà une définition des mesures très voisine de celle admise de nos jours. Il les définit sur ce qu'on appelle aujourd'hui des sigma-anneaux et est le premier à considérer des « ensembles abstraits » sans relation avec les nombres réels[36]. Dans un article de 1927, Wacław Sierpiński introduit ce qu'on nomme aujourd'hui la tribu engendrée[37].

Dans les années 1930, la maturation du formalisme moderne est terminée. Pour la première fois semble-t-il, un article de 1930 d'Otton Nikodým énonce explicitement les définitions de sigma-algèbre et de mesure utilisées aujourd'hui[38]. Deux traités influents parus pendant cette décennie popularisent définitivement la notion : Théorie de l'intégrale de Stanisław Saks pour l'analyse[39] et Fondements de la théorie des probabilités d'Andreï Kolmogorov[40]. Quant au terme de « tribu » utilisé en français pour dénommer les σ-algèbres, il a été introduit dans un article publié en 1936 par René de Possel, membre du groupe Bourbaki[41].

Bibliographie

  • Marc Briane et Gilles Pagès, Théorie de l'intégration, Paris, Vuibert, coll. « Les grands cours Vuibert », , 302 p. (ISBN 2-7117-8946-2).
  • Jean-Paul Pier, Histoire de l'intégration. Vingt-cinq siècles de mathématiques, Masson, , 306 p. (ISBN 978-2-225-85324-1).
  • Daniel Revuz, Mesure et intégration, Paris, Hermann, , 212 p. (ISBN 2-7056-6350-9).

Notes et références

  1. Signalé en note par Albert Tortrat, Calcul des probabilités et introduction aux processus aléatoires, Masson, , p. 31. C'est la terminologie historiquement utilisée par Andreï Kolmogorov dans son axiomatisation de la théorie des probabilités.
  2. Paul Halmos, Measure Theory, Van Nostrand, , p. 28. Des variantes mineures sont possibles, en particulier on trouve souvent pour condition (1) l'appartenance du vide à A {\displaystyle {\mathcal {A}}} (ainsi dans Briane et Pagès 2000, p. 45-45) ou celle de X {\displaystyle X} à A {\displaystyle {\mathcal {A}}} (ainsi dans Donald L. Cohn, Measure theory, Birkhäuser, (ISBN 978-3-7643-3003-3), p. 1-2). Voir la partie Propriétés élémentaires de cet article pour les démonstrations.
  3. Adriaan Zaanen, Integration, North Holland, , 2e éd., p. 25-28 ou Ole A. Nielsen, An Introduction to Integration and Measure Theory, Wiley-interscience, , 473 p. (ISBN 978-0-471-59518-2), p. 123
  4. La définition est par exemple donnée sous cette forme dans (en) Vladimir Bogachev, Measure Theory, Berlin, Springer, , 575 p. (ISBN 978-3-540-34513-8 et 3-540-34513-2), p. 4
  5. Certaines sources relativement anciennes proposent des définitions marginalement différentes : pour Halmos 1950, p. 73, un espace mesurable est un ensemble muni d'un σ-anneau à unité ; pour Sterling Berberian, Measure and Integration, MacMillan, , p. 35, c'est un ensemble muni d'un sigma-anneau (sans condition d'existence d'une unité). Les relations entre les trois définitions sont exposées dans l'ouvrage de S. Berberian, p. 35-36.
  6. Pier 1996, p. 206-207 estime que le « pas décisif est franchi » en 1914, à la publication des Grundzüge der Mengenlehre de Felix Hausdorff en s'appuyant notamment sur une citation de Wilhelm Blaschke.
  7. Pier 1996, p. 163-165.
  8. Pier 1996, p. 170.
  9. a b c et d Étienne Matheron, « Théorie de l’intégration » Accès libre [PDF], sur matheron.perso.math.cnrs.fr (consulté le ), p. 17-19
  10. Pier 1996, p. 208.
  11. L'idée selon laquelle ce type de tribu « représente la connaissance » à un temps donné est explicitement énoncée dans Mircea Gregoriu, Stochastic Calculus : Applications in Science and Engineering, Birkhäuser, , 774 p. (ISBN 978-0-8176-4242-6, lire en ligne), p. 78. On trouve une exposition intuitive des tribus comme ensembles d'« observables » dans I. I. Gihman et A. V. Skorokhod, The theory of stochastic processes I, Springer-Verlag, , p. 143.
  12. Cet énoncé est légèrement adapté du théorème 1-18 de Achim Klenke, Probability theory, a comprehensive course, Springer, (ISBN 978-1-84800-047-6), p.7
  13. L'énoncé est ainsi donné sous cette forme (et les λ-systèmes définis à partir d'unions croissantes) dans Charalambos D. Aliprantis et Kim C. Border, Infinite Dimensional Analysis : A Hitchhiker's Guide, Springer, , 704 p. (ISBN 978-3-540-32696-0, lire en ligne), lemme 4-10, p. 135.
  14. Revuz 1997, p. 26-27.
  15. Revuz 1997, p. 26-27 et 110-111.
  16. Briane et Pagès 2000, p. 265-266 notent qu'il serait « irréaliste » d'essayer de munir l'ensemble d'arrivée de la tribu de Lebesgue.
  17. Sashi Mohan Srivastava, A course on Borel sets, Springer, , 264 p. (ISBN 978-0-387-98412-4, lire en ligne), Théorème 3-3-13, p. 99 (la source ne fournit pas l'attribution à Kuratowski).
  18. a et b Briane et Pagès 2000, p. 48-49.
  19. On trouvera un exposé du produit des tribus et mesures dans la plupart des livres consacrés à la théorie de la mesure, par exemple dans Briane et Pagès 2000, chap.11, p. 191-211.
  20. Klenke 2008, p. 272.
  21. Briane et Pagès 2000, p. 263-264.
  22. Briane et Pagès 2000, exercice 4-5, p. 51.
  23. Cela dit, si l'espace mesurable sous-jacent est séparable i.e. si la tribu A {\displaystyle {\mathcal {A}}} est engendrée par un ensemble dénombrable de parties (notamment s'il s'agit d'un espace métrisable séparable muni de sa tribu borélienne), alors les atomes sont mesurables.
  24. Outre cette notion d'atome, définie sur un espace mesurable indépendamment de toute mesure, il existe une autre notion sur un espace probabilisé ( X , A , P ) {\displaystyle (X,{\mathcal {A}},P)}  : on dit qu'un élément A de A {\displaystyle {\mathcal {A}}} est un P-atome si P ( A ) > 0 {\displaystyle P(A)>0} et si quel que soit B dans A {\displaystyle {\mathcal {A}}} tel que 1 B 1 A {\displaystyle 1_{B}\leq 1_{A}} P presque surement, ou bien 1 B = 1 A {\displaystyle 1_{B}=1_{A}} ou bien 1 B = 0 {\displaystyle 1_{B}=0} . Contrairement aux atomes, les P-atomes appartiennent toujours à A {\displaystyle {\mathcal {A}}} . Pour en savoir plus sur les atomes ainsi que les démonstrations de ce qu'on vient d'énoncer, voir C. Dellacherie et P.-A. Meyer, Probabilité et Potentiel, tome 1 ; quant aux P-atomes, voir par exemple P. Malliavin, Intégration et probabilités, chapitre sur les probabilités.
  25. Briane et Pagès 2000, exercice 4-5, p. 51 précité contient un énoncé voisin. Celui-ci est implicite dans Revuz 1997, p. 110-111.
  26. Revuz 1997, p. 110-111.
  27. A. Dahan-Dalmedico et J. Peiffer, Une histoire des mathématiques : Routes et dédales, [détail des éditions], p. 243.
  28. Dahan-Dalmedico et Peiffer 1986, p. 230.
  29. Bernard Maurey et Jean-Pierre Tacchi, « Ludwig Scheefer et les extensions du théorème des accroissements finis », Séminaire du Luxembourg, Travaux mathématiques, vol. 13,‎ (lire en ligne).
  30. a et b (en) John Stillwell, Mathematics and Its History [détail des éditions], 2010, p. 532, aperçu sur Google Livres.
  31. Pier 1996, p. 115-116 qui renvoie à Émile Borel, Leçons sur la théorie des fonctions, Gauthier-Villars, .
  32. Nicolas Bourbaki, Éléments d'histoire des mathématiques, Springer, , 2e éd., 376 p. (ISBN 3-540-33938-8), p. 279.
  33. Stanisław Saks, Théorie de l'intégrale, Warszawa, Seminar. Matem. Uniw. Warsz., coll. « Monografje Matematyczne », (lire en ligne), iv-v.
  34. Pier 1996, p. 117-122. Les travaux de Lebesgue sont publiés sous forme d'une note : « Sur une généralisation de l'intégrale définie », Comptes Rendus de l'Académie des Sciences de Paris, vol. 132,‎ , p. 1025-1028 suivie d'un article : « Intégrale, longueur, aire », Ann. Mat. Pura Appl. (en), vol. 7,‎ , p. 231-359 et enfin d'un traité : Leçons sur l'intégration et la recherche des fonctions primitives, Gauthier-Villars, .
  35. Pier 1996, p. 169-170 qui renvoie à (de) Constantin Carathéodory, « Über das lineare Maß von Punktmengen - eine Verallgemeinerungdes Längenbegriffs », Nachrichten von der Königlichen Gesellschaft der Wissenschaften zu Göttingen,‎ , p. 404-426.
  36. JPier 1996, p. 165}, qui renvoie à Maurice Fréchet, « Sur l'intégrale d'une fonctionnelle étendue à un ensemble abstrait », Bull. Soc. Math. Fr., vol. 43,‎ , p. 248-265.
  37. Pier 1996, p. 153, qui renvoie à Wacław Sierpiński, « Les ensembles boréliens abstraits », Ann. Soc. Math. Polon., vol. 6,‎ , p. 50-53.
  38. Pier 1996, p. 166, qui renvoie à Otton Nikodým, « Sur une généralisation des intégrales de M. J. Radon », Fund. Math., vol. 15,‎ , p. 131-179.
  39. Saks 1933, annexe p. 247-248 dans l'édition susmentionnée (sous le nom de « famille additive »). L'influence de l'ouvrage est soulignée par Pier 1996, p. 166.
  40. Andrey Kolmogorov, Foundations of the Theory of Probability, Chelsea, , 2e éd. (1re éd. 1933) (lire en ligne), p. 16 dans l'édition mentionnée (sous le nom de « corps de Borel »). L'importance historique de l'ouvrage est un lieu commun, voir par exemple Pier 1996, p. 208. Dans son ouvrage, Andreï Kolmogorov renvoie au Mengenlehre de 1927 de Felix Hausdorff, mais ce dernier ne contient pas de définition explicitement mise en avant d'une sigma-algèbre.
  41. Pier 1996, p. 171, qui renvoie à : René de Possel, « Sur la dérivation abstraite des fonctions d'ensemble », J. Math. Pures Appl., vol. 15,‎ , p. 391-409.
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des mathématiques
  • icône décorative Portail des probabilités et de la statistique
La version du 14 mars 2010 de cet article a été reconnue comme « bon article », c'est-à-dire qu'elle répond à des critères de qualité concernant le style, la clarté, la pertinence, la citation des sources et l'illustration.