Licence 2Analyse

Matrice hessienne

50 min15 exercicesSéquence 2.2Licence 2

Vidéo disponible dans la version Premium

Durée : 50 min

Matrice hessienne

1. Dérivées partielles secondes

Soit f:R2Rf:\mathbb{R}^2\to\mathbb{R} admettant des dérivées partielles. On peut dériver à nouveau ces dérivées partielles : on obtient les dérivées partielles secondes, notées

2fx2,2fy2,2fxy=x(fy),2fyx=y(fx)\frac{\partial^2 f}{\partial x^2}, \quad \frac{\partial^2 f}{\partial y^2}, \quad \frac{\partial^2 f}{\partial x\partial y} = \frac{\partial}{\partial x}\left(\frac{\partial f}{\partial y}\right), \quad \frac{\partial^2 f}{\partial y\partial x} = \frac{\partial}{\partial y}\left(\frac{\partial f}{\partial x}\right)

On note aussi fxxf_{xx}, fyyf_{yy}, fxyf_{xy}, fyxf_{yx}.

Exemple : f(x,y)=x3y2f(x,y) = x^3y^2. On a fx=3x2y2f_x = 3x^2y^2, fy=2x3yf_y=2x^3y. Puis fxx=6xy2f_{xx} = 6xy^2, fyy=2x3f_{yy}=2x^3, fxy=x(2x3y)=6x2yf_{xy} = \frac{\partial}{\partial x}(2x^3y) = 6x^2y, et fyx=y(3x2y2)=6x2yf_{yx} = \frac{\partial}{\partial y}(3x^2y^2) = 6x^2y. On remarque fxy=fyxf_{xy}=f_{yx}.

2. Théorème de Schwarz

Théorème (Schwarz) : si ff admet des dérivées partielles secondes fxyf_{xy} et fyxf_{yx} continues au voisinage d'un point aa, alors elles sont égales en aa :

2fxy(a)=2fyx(a)\frac{\partial^2 f}{\partial x\partial y}(a) = \frac{\partial^2 f}{\partial y\partial x}(a)

On dit que les dérivées croisées coïncident. Pour toutes les fonctions usuelles (polynômes, exponentielles, fonctions trigonométriques et leurs combinaisons), cette hypothèse de continuité est automatiquement satisfaite, donc on a toujours fxy=fyxf_{xy}=f_{yx} en pratique dans ce cours.

Contre-exemple (hors hypothèses de Schwarz, pour la culture) : il existe des fonctions exotiques pour lesquelles fxy(0,0)fyx(0,0)f_{xy}(0,0)\neq f_{yx}(0,0) — cela ne peut se produire que lorsque ces dérivées secondes ne sont pas continues en ce point.

3. La matrice hessienne

La matrice hessienne de f:RnRf:\mathbb{R}^n\to\mathbb{R} en un point aa est la matrice carrée n×nn\times n des dérivées partielles secondes :

Hf(a)=(2fx12(a)2fx1xn(a)2fxnx1(a)2fxn2(a))H_f(a) = \begin{pmatrix} \dfrac{\partial^2 f}{\partial x_1^2}(a) & \cdots & \dfrac{\partial^2 f}{\partial x_1\partial x_n}(a) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial^2 f}{\partial x_n\partial x_1}(a) & \cdots & \dfrac{\partial^2 f}{\partial x_n^2}(a) \end{pmatrix}

Par le théorème de Schwarz (sous hypothèse de continuité, presque toujours vérifiée en pratique), Hf(a)H_f(a) est une matrice symétrique.

Exemple (suite) : pour f(x,y)=x3y2f(x,y)=x^3y^2, en un point général (x,y)(x,y) :

Hf(x,y)=(6xy26x2y6x2y2x3)H_f(x,y) = \begin{pmatrix} 6xy^2 & 6x^2y \\ 6x^2y & 2x^3 \end{pmatrix}

4. Formule de Taylor à l'ordre 2

Si ff est deux fois différentiable en aa, on a le développement de Taylor :

f(a+h)=f(a)+f(a)h+12hTHf(a)h+o(h2)f(a+h) = f(a) + \nabla f(a)\cdot h + \frac12\, h^T H_f(a)\, h + o(\|h\|^2)

hTHf(a)hh^T H_f(a) h est une forme quadratique en hh. C'est cette forme quadratique qui va déterminer, au voisinage d'un point critique (f(a)=0\nabla f(a)=0), si ff présente un minimum, un maximum, ou un point-selle — c'est l'objet de la leçon suivante.

5. Signe d'une forme quadratique en dimension 2

Pour n=2n=2, Hf(a)=(rsst)H_f(a) = \begin{pmatrix} r & s \\ s & t\end{pmatrix} avec r=fxx(a)r=f_{xx}(a), s=fxy(a)s=f_{xy}(a), t=fyy(a)t=f_{yy}(a). On définit le déterminant (parfois noté Δ\Delta ou disc\operatorname{disc}) :

detHf(a)=rts2\det H_f(a) = rt - s^2

- Si detHf(a)>0\det H_f(a) > 0 et r>0r>0 (ou t>0t>0, même signe) : la forme quadratique est définie positive.
- Si detHf(a)>0\det H_f(a) > 0 et r<0r<0 : la forme quadratique est définie négative.
- Si detHf(a)<0\det H_f(a) < 0 : la forme quadratique est indéfinie (signature mixte).
- Si detHf(a)=0\det H_f(a) = 0 : cas dégénéré, non concluant à cet ordre.

Cette classification se retrouve aussi via les valeurs propres de Hf(a)H_f(a) (matrice symétrique, donc diagonalisable avec valeurs propres réelles) : définie positive     \iff les deux valeurs propres sont >0>0 ; définie négative     \iff les deux sont <0<0 ; indéfinie     \iff les deux valeurs propres sont de signes opposés.

6. Lien avec la convexité locale

Convexité locale : si Hf(a)H_f(a) est définie positive (resp. semi-définie positive sur tout un voisinage), le graphe de ff est localement convexe autour de aa (il se courbe "vers le haut", comme un bol). Si HfH_f est définie positive sur tout l'espace, ff est convexe globalement.

Exemple résolu : soit f(x,y)=x2+4y2f(x,y) = x^2+4y^2. Hf(x,y)=(2008)H_f(x,y) = \begin{pmatrix}2&0\\0&8\end{pmatrix} en tout point (matrice constante car ff est un polynôme de degré 22). detHf=16>0\det H_f = 16>0 et r=2>0r=2>0 : la hessienne est définie positive partout. ff est donc convexe sur tout R2\mathbb{R}^2, et son graphe est un paraboloïde elliptique tourné "vers le haut".

Exercices

Calculer la matrice hessienne de f(x,y)=x2+y2f(x,y) = x^2+y^2.

Vrai ou faux : la matrice hessienne d'une fonction C2\mathcal{C}^2 est toujours symétrique.

Pour f(x,y)=x2y2f(x,y) = x^2 - y^2, calculer detHf\det H_f et en déduire le signe de la forme quadratique associée.

Calculer fxyf_{xy} et fyxf_{yx} pour f(x,y)=sin(xy)f(x,y)=\sin(xy), et vérifier qu'elles coïncident.

Vrai ou faux : une matrice hessienne avec detHf=0\det H_f=0 et fxx0f_{xx}\neq0 ne donne aucune information sur le comportement local de ff (cas dégénéré).

Suivez votre progression

Connectez-vous pour sauvegarder votre avancement et gagner des XP.

Se connecter