Fiche récapitulative générée pour impression / export PDF.

Licence 3 · Probabilités L3 — Convergence et théorèmes limites

Inégalités de concentration

1. Inégalité de Markov

Théorème (Markov) : Si $X$ est une variable aléatoire positive ( $X\geq0$ presque sûrement) admettant une espérance, alors pour tout $a>0$ :

P(X\geq a) \leq \frac{E[X]}{a}

Démonstration : $X\geq a\cdot\mathbb{1}_{\{X\geq a\}}$ presque sûrement (car sur $\{X\geq a\}$ , $X\geq a$ ; ailleurs le membre de droite est nul et $X\geq0$ ). En prenant l'espérance (qui préserve les inégalités) :

E[X] \geq a\cdot E[\mathbb{1}_{\{X\geq a\}}] = a\cdot P(X\geq a)

d'où le résultat en divisant par

a>0

Exemple : si $X\sim\mathcal{E}(\lambda)$ (exponentielle de paramètre $\lambda$ ), $E[X]=1/\lambda$ , donc $P(X\geq a)\leq\dfrac{1}{\lambda a}$ . C'est une borne grossière (la vraie valeur est $e^{-\lambda a}$ , bien plus petite), mais elle ne demande de connaître que l'espérance.

2. Inégalité de Bienaymé-Tchebychev

Théorème (Bienaymé-Tchebychev) : Si $X$ admet une variance $\sigma^2=\text{Var}(X)$ , alors pour tout $\varepsilon>0$ :

P\big(|X-E[X]|\geq\varepsilon\big) \leq \frac{\sigma^2}{\varepsilon^2}

Démonstration : On applique Markov à la variable positive $Y=(X-E[X])^2$ avec le seuil $a=\varepsilon^2$ :

P(Y\geq\varepsilon^2) \leq \frac{E[Y]}{\varepsilon^2} = \frac{\text{Var}(X)}{\varepsilon^2}

\{Y\geq\varepsilon^2\}=\{|X-E[X]|\geq\varepsilon\}

(car

Y=(X-E[X])^2\geq\varepsilon^2 \iff |X-E[X]|\geq\varepsilon

Exemple : $X_1,\dots,X_n$ i.i.d. de loi $\mathcal{E}(1)$ (donc $E[X_i]=1$ , $\text{Var}(X_i)=1$ ). Pour $\overline{X_n}=\frac1n\sum X_i$ , on a $E[\overline{X_n}]=1$ et $\text{Var}(\overline{X_n})=\dfrac{1}{n}$ (variance de la moyenne d'i.i.d.). Avec $n=100$ et $\varepsilon=0{,}1$ :

P\big(|\overline{X_{100}}-1|\geq0{,}1\big) \leq \frac{1/100}{0{,}01} = 1

(borne triviale ici, mais elle devient utile pour

n

grand : avec

n=10\,000

, la borne tombe à

0{,}01

3. Inégalité de Cauchy-Schwarz (rappel probabiliste)

Pour $X,Y$ de carré intégrable :

\big|E[XY]\big| \leq \sqrt{E[X^2]}\sqrt{E[Y^2]}

avec égalité si et seulement si

X

Y

sont proportionnelles presque sûrement. Conséquence : le coefficient de corrélation

\rho(X,Y)=\dfrac{\text{Cov}(X,Y)}{\sigma_X\sigma_Y}

vérifie toujours

|\rho(X,Y)|\leq1

4. Inégalité de Jensen

Théorème (Jensen) : Si $\varphi:\mathbb{R}\to\mathbb{R}$ est convexe et $X$ une variable aléatoire intégrable, alors :

\varphi(E[X]) \leq E[\varphi(X)]

Exemple classique : $\varphi(x)=x^2$ est convexe, donc $E[X]^2\leq E[X^2]$ — c'est exactement la positivité de $\text{Var}(X)=E[X^2]-E[X]^2\geq0$ , retrouvée comme cas particulier de Jensen.

5. Pourquoi ces inégalités sont essentielles

Ces inégalités sont les outils de base pour démontrer les théorèmes limites (lois des grands nombres, paragraphes suivants) : elles permettent de majorer une probabilité de déviation sans connaître la loi exacte de la variable, seulement quelques moments (espérance, variance). C'est le principe de la concentration de la mesure.

6. Récapitulatif

Inégalité

Hypothèse

Conclusion

|---|---|---|

Markov	$X\geq0$ , $E[X]<\infty$	$P(X\geq a)\leq E[X]/a$
Bienaymé-Tchebychev	$\text{Var}(X)<\infty$	$P(\vert X-E[X]\vert\geq\varepsilon)\leq\sigma^2/\varepsilon^2$
Cauchy-Schwarz	$X,Y$ carré intégrable	$\vert E[XY]\vert\leq\sqrt{E[X^2]E[Y^2]}$
Jensen	$\varphi$ convexe	$\varphi(E[X])\leq E[\varphi(X)]$

Exercices de la leçon

Exercice 1

Que dit l'inégalité de Markov pour une variable aléatoire positive $X$ ?

Corrigé

L'inégalité de Markov énonce $P(X\geq a)\leq E[X]/a$ pour $X\geq0$ et $a>0$ . C'est une majoration, pas une égalité, et elle ne fait intervenir que l'espérance (pas la variance, contrairement à Bienaymé-Tchebychev).

Exercice 2

Vrai ou faux : l'inégalité de Bienaymé-Tchebychev nécessite que $X$ admette une variance finie.

Corrigé

Vrai. La démonstration applique Markov à $(X-E[X])^2$ , dont l'espérance est précisément $\text{Var}(X)$ ; il faut donc que cette variance soit finie pour que la borne ait un sens.

Exercice 3

Soit $X\sim\mathcal{E}(2)$ (exponentielle de paramètre $\lambda=2$ , $E[X]=1/2$ ). Quelle borne de Markov obtient-on pour $P(X\geq5)$ ?

Corrigé

Markov donne $P(X\geq a)\leq E[X]/a = (1/2)/5 = 0{,}1$ .

Exercice 4

Soit $X$ telle que $E[X]=10$ et $\text{Var}(X)=4$ . Quelle borne de Bienaymé-Tchebychev obtient-on pour $P(|X-10|\geq4)$ ?

Corrigé

$P(|X-E[X]|\geq\varepsilon)\leq\sigma^2/\varepsilon^2 = 4/16 = 0{,}25$ .

Exercice 5

Vrai ou faux : pour toute variable aléatoire $X$ de carré intégrable, $E[X]^2\leq E[X^2]$ .

Corrigé

Vrai. C'est l'inégalité de Jensen appliquée à la fonction convexe $\varphi(x)=x^2$ , équivalente à $\text{Var}(X)=E[X^2]-E[X]^2\geq0$ .

Exercice 6

On lance $n=10\,000$ fois une pièce équilibrée. Soit $S_n$ le nombre de faces, $E[S_n]=5000$ , $\text{Var}(S_n)=2500$ . Quelle borne de Tchebychev obtient-on pour $P(|S_n-5000|\geq100)$ ?

Corrigé

$\text{Var}(S_n)=np(1-p)=10000\times0{,}5\times0{,}5=2500$ . La borne donne $2500/100^2=2500/10000=0{,}25$ .

Exercice 7

Pourquoi l'inégalité de Markov, appliquée directement à $X\sim\mathcal{E}(\lambda)$ , donne-t-elle une borne nettement plus grossière que la valeur exacte $P(X\geq a)=e^{-\lambda a}$ ?

Corrigé

L'inégalité de Markov est une borne universelle, valable pour n'importe quelle variable positive ayant la même espérance — elle ne « voit » que ce seul moment. Or la loi exponentielle décroît très vite (exponentiellement), alors que la borne de Markov ne décroît qu'en $1/a$ (polynomialement). L'écart entre $1/(\lambda a)$ et $e^{-\lambda a}$ illustre que les bornes générales (valables pour toute une classe de lois) sont nécessairement moins précises qu'un calcul exact exploitant la forme particulière de la loi.

Exercice 8

Soit $X$ de loi uniforme sur $[0,1]$ . Calculer la borne de Tchebychev pour $P(|X-1/2|\geq1/4)$ et comparer à la valeur exacte.

Corrigé

Pour $X\sim\mathcal{U}[0,1]$ , $\text{Var}(X)=\dfrac{1}{12}$ . La borne de Tchebychev donne $P(|X-1/2|\geq1/4)\leq\dfrac{1/12}{(1/4)^2}=\dfrac{1/12}{1/16}=\dfrac{16}{12}=\dfrac{4}{3}>1$ : la borne est triviale (toujours vraie, sans aucune information utile, puisqu'une probabilité est toujours $\leq1$ ).

La valeur exacte se calcule directement : $P(|X-1/2|\geq1/4)=P(X\leq1/4)+P(X\geq3/4)=\dfrac14+\dfrac14=\dfrac12$ .

Cela illustre une limite réelle de Tchebychev : pour des écarts modestes par rapport à l'écart-type, la borne peut être inutile ; elle devient pertinente surtout pour des grandes déviations.

Exercice 9

Vrai ou faux : si $\rho(X,Y)$ désigne le coefficient de corrélation de $X$ et $Y$ , alors $\rho(X,Y)=\pm1$ si et seulement si $Y$ est une fonction affine de $X$ presque sûrement.

Corrigé

Vrai. C'est le cas d'égalité dans Cauchy-Schwarz appliqué à $X-E[X]$ et $Y-E[Y]$ : l'égalité $|\text{Cov}(X,Y)|=\sigma_X\sigma_Y$ équivaut à la proportionnalité presque sûre de $X-E[X]$ et $Y-E[Y]$ , c'est-à-dire $Y=aX+b$ pour des constantes $a,b$ .

Exercice 10

Soit $X_1,\dots,X_n$ i.i.d. de loi $\mathcal{E}(1)$ et $\overline{X_n}=\frac1n\sum X_i$ . À partir de quel $n$ la borne de Tchebychev garantit-elle $P(|\overline{X_n}-1|\geq0{,}1)\leq0{,}05$ ?

Corrigé

$\text{Var}(\overline{X_n})=1/n$ . La borne est $\dfrac{1/n}{0{,}01}=\dfrac{100}{n}$ . On veut $\dfrac{100}{n}\leq0{,}05$ , soit $n\geq100/0{,}05=2000$ .

Exercice 11

Démontrer l'inégalité de Cauchy-Schwarz probabiliste $|E[XY]|\leq\sqrt{E[X^2]}\sqrt{E[Y^2]}$ en étudiant le polynôme $t\mapsto E[(X+tY)^2]$ .

Corrigé

Pour tout réel $t$ , $(X+tY)^2\geq0$ presque sûrement, donc en prenant l'espérance (linéarité) :

P(t)=E[(X+tY)^2]=E[X^2]+2tE[XY]+t^2E[Y^2]\geq0

Si $E[Y^2]=0$ alors $Y=0$ presque sûrement et l'inégalité est triviale ( $0\leq0$ ). Sinon $P$ est un polynôme du second degré en $t$ , à coefficient dominant $E[Y^2]>0$ , qui est toujours positif ou nul : son discriminant doit être négatif ou nul :

\Delta = 4E[XY]^2 - 4E[X^2]E[Y^2] \leq 0

D'où $E[XY]^2\leq E[X^2]\,E[Y^2]$ , et en prenant la racine carrée (les deux membres sont positifs) :

|E[XY]| \leq \sqrt{E[X^2]}\,\sqrt{E[Y^2]} \qquad \square

Exercice 12

Démontrer l'inégalité de Jensen $\varphi(E[X])\leq E[\varphi(X)]$ pour $\varphi$ convexe et dérivable, en utilisant la propriété $\varphi(x)\geq\varphi(m)+\varphi'(m)(x-m)$ (tangente sous le graphe en tout point $m$ ).

Corrigé

Propriété de convexité utilisée : pour une fonction $\varphi$ convexe et dérivable, le graphe est toujours au-dessus de n'importe quelle tangente : pour tout $m$ et tout $x$ ,

\varphi(x) \geq \varphi(m) + \varphi'(m)(x-m)

Application : posons $m=E[X]$ (un réel fixe) et appliquons l'inégalité ci-dessus en $x=X(\omega)$ pour chaque issue $\omega$ — c'est une inégalité presque sûre entre variables aléatoires :

\varphi(X) \geq \varphi(E[X]) + \varphi'(E[X])\cdot(X-E[X]) \quad \text{p.s.}

Passage à l'espérance (qui préserve les inégalités, et $\varphi(E[X])$ , $\varphi'(E[X])$ sont des constantes) :

E[\varphi(X)] \geq \varphi(E[X]) + \varphi'(E[X])\cdot\big(E[X]-E[X]\big) = \varphi(E[X]) + \varphi'(E[X])\cdot0 = \varphi(E[X])

D'où $\varphi(E[X])\leq E[\varphi(X)]$ . $\square$

Exercice 13

Soit $X\geq0$ d'espérance $E[X]=\mu$ . Démontrer que pour tout $a>\mu$ , $P(X\geq a)\leq\dfrac{\mu}{a}$ , puis donner un exemple de loi pour laquelle cette borne est atteinte exactement (égalité).

Corrigé

L'inégalité $P(X\geq a)\leq\mu/a$ est l'inégalité de Markov elle-même (cf. §1), valable pour tout $a>0$ dès que $X\geq0$ et $E[X]=\mu<\infty$ .

Cas d'égalité : prenons $X$ qui ne prend que deux valeurs, $0$ et $a$ , avec $P(X=a)=p$ et $P(X=0)=1-p$ . Alors $E[X]=ap$ . Pour avoir $E[X]=\mu$ , on choisit $p=\mu/a$ (valeur licite si $\mu\leq a$ , donc en particulier pour $a>\mu$ avec $p<1$ ). Dans ce cas :

P(X\geq a) = P(X=a) = p = \frac{\mu}{a}

ce qui réalise l'égalité exacte dans Markov. Cela montre que la borne de Markov est optimale dans le pire cas : il existe toujours une loi (à deux points de masse) pour laquelle l'inégalité devient une égalité.

Exercice 14

Soit $X$ une variable aléatoire bornée, $0\leq X\leq M$ , avec $E[X]=\mu$ . Montrer que $\text{Var}(X)\leq\mu(M-\mu)$ .

Corrigé

Idée clé : comme $0\leq X\leq M$ presque sûrement, on a $(M-X)\cdot X\geq0$ presque sûrement (produit de deux quantités positives), donc $E\big[(M-X)X\big]\geq0$ .

En développant :

E[(M-X)X] = M\,E[X] - E[X^2] \geq 0 \implies E[X^2] \leq M\mu

Or $\text{Var}(X)=E[X^2]-\mu^2$ , donc :

\text{Var}(X) = E[X^2]-\mu^2 \leq M\mu - \mu^2 = \mu(M-\mu) \qquad \square

C'est une borne classique (parfois appelée inégalité de Popoviciu dans un cas voisin) utile pour majorer la variance de variables bornées sans connaître leur loi exacte — par exemple pour les variables de Bernoulli ( $M=1$ ), elle redonne exactement $\text{Var}(X)=p(1-p)\leq p(1-p)$ (égalité).

Exercice 15

Vrai ou faux : si $X_n \to X$ en probabilité et que $(X_n)$ est bornée par une constante $M$ pour tout $n$ , alors $E[X_n]\to E[X]$ .

Corrigé

Vrai. C'est une conséquence du théorème de convergence dominée (ou de sa version pour la convergence en probabilité) : la convergence en probabilité d'une suite uniformément bornée entraîne la convergence des espérances. Sans l'hypothèse de bornitude (ou domination), ce résultat est faux en général — un contre-exemple classique est une suite de variables prenant la valeur $n$ avec probabilité $1/n$ et $0$ sinon : $X_n\to0$ en probabilité mais $E[X_n]=1$ pour tout $n$ , ne convergeant pas vers $E[0]=0$ .

AlphaMath Académie · Inégalités de concentration · Probabilités L3 — Convergence et théorèmes limites