Licence 2

Échantillonnage et estimateurs

50 min15 exercicesSéquence 1.1Licence 2

Vidéo disponible dans la version Premium

Durée : 50 min

Échantillonnage et estimateurs

1. Population, échantillon, statistique

On appelle population l'ensemble des individus sur lequel porte une étude, et l'on cherche à connaître une caractéristique inconnue de cette population, par exemple sa moyenne μ\mu ou sa variance σ2\sigma^2. Comme il est en général impossible d'observer toute la population, on observe un échantillon.

Un échantillon aléatoire simple de taille nn est une suite X1,X2,,XnX_1, X_2, \dots, X_n de variables aléatoires indépendantes et identiquement distribuées (i.i.d.), de même loi que la variable XX étudiée sur la population (de moyenne μ=E[X]\mu = E[X] et de variance σ2=Var(X)\sigma^2 = \text{Var}(X), supposées finies).

Une statistique est une variable aléatoire Tn=g(X1,,Xn)T_n = g(X_1, \dots, X_n), fonction de l'échantillon, qui ne dépend d'aucun paramètre inconnu. Une fois l'échantillon observé (valeurs numériques x1,,xnx_1, \dots, x_n), on obtient une réalisation tn=g(x1,,xn)t_n = g(x_1, \dots, x_n) de la statistique.

Exemples de statistiques :
- La moyenne empirique : Xn=1ni=1nXi\overline{X}_n = \dfrac{1}{n}\displaystyle\sum_{i=1}^{n} X_i
- La variance empirique : σ^n2=1ni=1n(XiXn)2\widehat{\sigma}^2_n = \dfrac{1}{n}\displaystyle\sum_{i=1}^{n} (X_i - \overline{X}_n)^2

2. Estimateur ponctuel

Un estimateur ponctuel d'un paramètre inconnu θ\theta (par exemple μ\mu ou σ2\sigma^2) est une statistique θ^n=g(X1,,Xn)\widehat{\theta}_n = g(X_1, \dots, X_n) destinée à approcher θ\theta. C'est une variable aléatoire (elle dépend de l'échantillon, donc varie d'un échantillon à l'autre) ; sa réalisation numérique sur un échantillon donné s'appelle une estimation.

On évalue la qualité d'un estimateur à l'aide de plusieurs critères : son biais, sa variance, sa convergence, et son erreur quadratique moyenne.

3. Biais d'un estimateur

Définition. Le biais de l'estimateur θ^n\widehat{\theta}_n de θ\theta est :

b(θ^n)=E[θ^n]θb(\widehat{\theta}_n) = E[\widehat{\theta}_n] - \theta

L'estimateur θ^n\widehat{\theta}_n est dit sans biais (ou non biaisé) si b(θ^n)=0b(\widehat{\theta}_n) = 0, c'est-à-dire si E[θ^n]=θE[\widehat{\theta}_n] = \theta pour toute valeur de θ\theta. Sinon, il est dit biaisé.

Théorème — la moyenne empirique est un estimateur sans biais de μ\mu.

Soit X1,,XnX_1, \dots, X_n i.i.d. d'espérance μ\mu. Alors :

E[Xn]=E[1ni=1nXi]=1ni=1nE[Xi]=1nnμ=μE[\overline{X}_n] = E\left[\frac{1}{n}\sum_{i=1}^n X_i\right] = \frac{1}{n}\sum_{i=1}^n E[X_i] = \frac{1}{n} \cdot n\mu = \mu

Donc b(Xn)=E[Xn]μ=0b(\overline{X}_n) = E[\overline{X}_n] - \mu = 0 : Xn\overline{X}_n est un estimateur sans biais de μ\mu.

4. Variance empirique : biaisée vs corrigée

La variance empirique σ^n2=1ni=1n(XiXn)2\widehat{\sigma}^2_n = \dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i - \overline{X}_n)^2 est un estimateur biaisé de σ2\sigma^2.

On démontre (calcul classique, en développant et en utilisant l'indépendance des XiX_i) que :

E[σ^n2]=n1nσ2E[\widehat{\sigma}^2_n] = \frac{n-1}{n}\,\sigma^2

Le biais est donc b(σ^n2)=n1nσ2σ2=σ2n0b(\widehat{\sigma}^2_n) = \dfrac{n-1}{n}\sigma^2 - \sigma^2 = -\dfrac{\sigma^2}{n} \neq 0 : l'estimateur sous-estime systématiquement la variance (en moyenne).

Variance empirique corrigée (estimateur sans biais). On définit :

Sn2=1n1i=1n(XiXn)2=nn1σ^n2S_n^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X}_n)^2 = \frac{n}{n-1}\,\widehat{\sigma}^2_n

Alors E[Sn2]=nn1E[σ^n2]=nn1n1nσ2=σ2E[S_n^2] = \dfrac{n}{n-1} \cdot E[\widehat{\sigma}^2_n] = \dfrac{n}{n-1} \cdot \dfrac{n-1}{n}\sigma^2 = \sigma^2 : Sn2S_n^2 est un estimateur sans biais de σ2\sigma^2. C'est cette correction (division par n1n-1 et non par nn) qui est utilisée en pratique pour estimer une variance à partir d'un échantillon ; le facteur n1n-1 s'appelle le nombre de degrés de liberté.

Exemple numérique. Échantillon x1,,x5=2,4,4,6,9x_1, \dots, x_5 = 2, 4, 4, 6, 9 (population fictive). On a x=2+4+4+6+95=255=5\overline{x} = \dfrac{2+4+4+6+9}{5} = \dfrac{25}{5} = 5. Les écarts au carré : (25)2=9(2-5)^2=9, (45)2=1(4-5)^2=1, (45)2=1(4-5)^2=1, (65)2=1(6-5)^2=1, (95)2=16(9-5)^2=16, somme =28= 28. Donc σ^52=285=5,6\widehat{\sigma}^2_5 = \dfrac{28}{5} = 5{,}6 tandis que s52=284=7s_5^2 = \dfrac{28}{4} = 7 : l'estimation corrigée est bien supérieure, conformément au facteur nn1=54\dfrac{n}{n-1} = \dfrac{5}{4}.

5. Convergence d'un estimateur

Définition. L'estimateur θ^n\widehat{\theta}_n est convergent (ou consistant) si θ^n\widehat{\theta}_n converge en probabilité vers θ\theta quand n+n \to +\infty, c'est-à-dire :

ε>0,limn+P(θ^nθ>ε)=0\forall \varepsilon > 0,\quad \lim_{n\to+\infty} P\big(|\widehat{\theta}_n - \theta| > \varepsilon\big) = 0

Théorème (loi des grands nombres). Si X1,,XnX_1, \dots, X_n sont i.i.d. d'espérance μ\mu finie, alors Xn\overline{X}_n converge en probabilité (et même presque sûrement) vers μ\mu : Xn\overline{X}_n est un estimateur convergent de μ\mu.

On montre de même que σ^n2\widehat{\sigma}^2_n et Sn2S_n^2 sont tous deux des estimateurs convergents de σ2\sigma^2 : bien que σ^n2\widehat{\sigma}^2_n soit biaisé, son biais σ2/n-\sigma^2/n tend vers 00 quand n+n \to +\infty, et sa variance tend également vers 00. Un estimateur biaisé peut donc être convergent (le biais n'empêche pas la convergence, à condition qu'il s'annule asymptotiquement).

6. Erreur quadratique moyenne (EQM)

Pour comparer des estimateurs (notamment lorsque l'un est biaisé), on utilise l'erreur quadratique moyenne :

EQM(θ^n)=E[(θ^nθ)2]\text{EQM}(\widehat{\theta}_n) = E\big[(\widehat{\theta}_n - \theta)^2\big]

Décomposition biais-variance. On a l'identité fondamentale :

EQM(θ^n)=Var(θ^n)+b(θ^n)2\text{EQM}(\widehat{\theta}_n) = \text{Var}(\widehat{\theta}_n) + b(\widehat{\theta}_n)^2

Démonstration. En notant m=E[θ^n]m = E[\widehat\theta_n] :

E[(θ^nθ)2]=E[((θ^nm)+(mθ))2]=E[(θ^nm)2]+2(mθ)E[θ^nm]+(mθ)2E[(\widehat\theta_n-\theta)^2] = E[((\widehat\theta_n - m) + (m-\theta))^2] = E[(\widehat\theta_n-m)^2] + 2(m-\theta)\,E[\widehat\theta_n - m] + (m-\theta)^2

Le terme croisé est nul car E[θ^nm]=0E[\widehat\theta_n - m] = 0, et E[(θ^nm)2]=Var(θ^n)E[(\widehat\theta_n - m)^2] = \text{Var}(\widehat\theta_n), (mθ)2=b(θ^n)2(m-\theta)^2 = b(\widehat\theta_n)^2. D'où le résultat. \square

Conséquence pratique. Si θ^n\widehat\theta_n est sans biais, EQM(θ^n)=Var(θ^n)\text{EQM}(\widehat\theta_n) = \text{Var}(\widehat\theta_n) : pour des estimateurs sans biais, minimiser l'EQM équivaut à minimiser la variance. Mais un estimateur légèrement biaisé peut avoir une EQM plus petite qu'un estimateur sans biais s'il a une variance beaucoup plus faible — ce compromis biais/variance est central en statistique.

7. Variance de la moyenne empirique

Pour X1,,XnX_1, \dots, X_n i.i.d. de variance σ2\sigma^2, par indépendance :

Var(Xn)=Var(1ni=1nXi)=1n2i=1nVar(Xi)=1n2nσ2=σ2n\text{Var}(\overline{X}_n) = \text{Var}\left(\frac{1}{n}\sum_{i=1}^n X_i\right) = \frac{1}{n^2}\sum_{i=1}^n \text{Var}(X_i) = \frac{1}{n^2}\cdot n\sigma^2 = \frac{\sigma^2}{n}

On retrouve ainsi que EQM(Xn)=Var(Xn)=σ2n\text{EQM}(\overline{X}_n) = \text{Var}(\overline{X}_n) = \dfrac{\sigma^2}{n} (puisque Xn\overline{X}_n est sans biais), qui tend vers 00 quand n+n \to +\infty : ceci redémontre la convergence de Xn\overline{X}_n vers μ\mu (via l'inégalité de Bienaymé-Tchebychev). L'écart-type de l'estimateur, σn\dfrac{\sigma}{\sqrt n}, s'appelle l'erreur-type (standard error) de la moyenne empirique ; c'est elle qui contrôlera la largeur des intervalles de confiance étudiés dans la leçon suivante.

8. Synthèse


EstimateurParamètre estiméBiaisConvergent ?
|---|---|---|---|



Xn\overline{X}_nμ\musans biaisoui
σ^n2=1n(XiXn)2\widehat\sigma^2_n = \frac1n\sum(X_i-\overline X_n)^2σ2\sigma^2biaisé (σ2/n-\sigma^2/n)oui
Sn2=1n1(XiXn)2S_n^2 = \frac{1}{n-1}\sum(X_i-\overline X_n)^2σ2\sigma^2sans biaisoui

Retenir : pour estimer une variance à partir de données, on utilise toujours Sn2S_n^2 (division par n1n-1) en pratique, car c'est l'estimateur sans biais ; c'est lui qui apparaît dans les formules d'intervalles de confiance et de tests basés sur la loi de Student, objets des deux prochaines leçons.

Exercices

Qu'est-ce qu'une statistique Tn=g(X1,,Xn)T_n = g(X_1, \dots, X_n) ?

Quelle est la formule de la moyenne empirique Xn\overline{X}_n ?

Vrai ou faux : la moyenne empirique Xn\overline{X}_n est un estimateur sans biais de μ=E[X]\mu = E[X].

Quelle est la formule de la variance empirique corrigée Sn2S_n^2 ?

Que signifie « θ^n\widehat{\theta}_n est un estimateur sans biais de θ\theta » ?

Suivez votre progression

Connectez-vous pour sauvegarder votre avancement et gagner des XP.

Se connecter