Fiche récapitulative générée pour impression / export PDF.

Licence 2 · Calcul différentiel L2 — Fonctions de plusieurs variables et optimisation

Matrice hessienne

1. Dérivées partielles secondes

Soit $f:\mathbb{R}^2\to\mathbb{R}$ admettant des dérivées partielles. On peut dériver à nouveau ces dérivées partielles : on obtient les dérivées partielles secondes, notées

\frac{\partial^2 f}{\partial x^2}, \quad \frac{\partial^2 f}{\partial y^2}, \quad \frac{\partial^2 f}{\partial x\partial y} = \frac{\partial}{\partial x}\left(\frac{\partial f}{\partial y}\right), \quad \frac{\partial^2 f}{\partial y\partial x} = \frac{\partial}{\partial y}\left(\frac{\partial f}{\partial x}\right)

On note aussi

f_{xx}

f_{yy}

f_{xy}

f_{yx}

Exemple : $f(x,y) = x^3y^2$ . On a $f_x = 3x^2y^2$ , $f_y=2x^3y$ . Puis $f_{xx} = 6xy^2$ , $f_{yy}=2x^3$ , $f_{xy} = \frac{\partial}{\partial x}(2x^3y) = 6x^2y$ , et $f_{yx} = \frac{\partial}{\partial y}(3x^2y^2) = 6x^2y$ . On remarque $f_{xy}=f_{yx}$ .

2. Théorème de Schwarz

Théorème (Schwarz) : si $f$ admet des dérivées partielles secondes $f_{xy}$ et $f_{yx}$ continues au voisinage d'un point $a$ , alors elles sont égales en $a$ :

\frac{\partial^2 f}{\partial x\partial y}(a) = \frac{\partial^2 f}{\partial y\partial x}(a)

On dit que les dérivées croisées coïncident. Pour toutes les fonctions usuelles (polynômes, exponentielles, fonctions trigonométriques et leurs combinaisons), cette hypothèse de continuité est automatiquement satisfaite, donc on a toujours

f_{xy}=f_{yx}

en pratique dans ce cours.

Contre-exemple (hors hypothèses de Schwarz, pour la culture) : il existe des fonctions exotiques pour lesquelles $f_{xy}(0,0)\neq f_{yx}(0,0)$ — cela ne peut se produire que lorsque ces dérivées secondes ne sont pas continues en ce point.

3. La matrice hessienne

La matrice hessienne de $f:\mathbb{R}^n\to\mathbb{R}$ en un point $a$ est la matrice carrée $n\times n$ des dérivées partielles secondes :

H_f(a) = \begin{pmatrix} \dfrac{\partial^2 f}{\partial x_1^2}(a) & \cdots & \dfrac{\partial^2 f}{\partial x_1\partial x_n}(a) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial^2 f}{\partial x_n\partial x_1}(a) & \cdots & \dfrac{\partial^2 f}{\partial x_n^2}(a) \end{pmatrix}

Par le théorème de Schwarz (sous hypothèse de continuité, presque toujours vérifiée en pratique),

H_f(a)

est une matrice symétrique.

Exemple (suite) : pour $f(x,y)=x^3y^2$ , en un point général $(x,y)$ :

H_f(x,y) = \begin{pmatrix} 6xy^2 & 6x^2y \\ 6x^2y & 2x^3 \end{pmatrix}

4. Formule de Taylor à l'ordre 2

Si $f$ est deux fois différentiable en $a$ , on a le développement de Taylor :

f(a+h) = f(a) + \nabla f(a)\cdot h + \frac12\, h^T H_f(a)\, h + o(\|h\|^2)

où

h^T H_f(a) h

est une forme quadratique en

h

. C'est cette forme quadratique qui va déterminer, au voisinage d'un point critique (

\nabla f(a)=0

), si

f

présente un minimum, un maximum, ou un point-selle — c'est l'objet de la leçon suivante.

5. Signe d'une forme quadratique en dimension 2

Pour $n=2$ , $H_f(a) = \begin{pmatrix} r & s \\ s & t\end{pmatrix}$ avec $r=f_{xx}(a)$ , $s=f_{xy}(a)$ , $t=f_{yy}(a)$ . On définit le déterminant (parfois noté $\Delta$ ou $\operatorname{disc}$ ) :

\det H_f(a) = rt - s^2

- Si $\det H_f(a) > 0$ et $r>0$ (ou $t>0$ , même signe) : la forme quadratique est définie positive.
- Si $\det H_f(a) > 0$ et $r<0$ : la forme quadratique est définie négative.
- Si $\det H_f(a) < 0$ : la forme quadratique est indéfinie (signature mixte).
- Si $\det H_f(a) = 0$ : cas dégénéré, non concluant à cet ordre.

Cette classification se retrouve aussi via les valeurs propres de $H_f(a)$ (matrice symétrique, donc diagonalisable avec valeurs propres réelles) : définie positive $\iff$ les deux valeurs propres sont $>0$ ; définie négative $\iff$ les deux sont $<0$ ; indéfinie $\iff$ les deux valeurs propres sont de signes opposés.

6. Lien avec la convexité locale

Convexité locale : si $H_f(a)$ est définie positive (resp. semi-définie positive sur tout un voisinage), le graphe de $f$ est localement convexe autour de $a$ (il se courbe "vers le haut", comme un bol). Si $H_f$ est définie positive sur tout l'espace, $f$ est convexe globalement.

Exemple résolu : soit $f(x,y) = x^2+4y^2$ . $H_f(x,y) = \begin{pmatrix}2&0\\0&8\end{pmatrix}$ en tout point (matrice constante car $f$ est un polynôme de degré $2$ ). $\det H_f = 16>0$ et $r=2>0$ : la hessienne est définie positive partout. $f$ est donc convexe sur tout $\mathbb{R}^2$ , et son graphe est un paraboloïde elliptique tourné "vers le haut".

Exercices de la leçon

Exercice 1

Calculer la matrice hessienne de $f(x,y) = x^2+y^2$ .

Corrigé

$f_x=2x$ , $f_y=2y$ . Puis $f_{xx}=2$ , $f_{yy}=2$ , $f_{xy}=f_{yx}=0$ . $H_f = \begin{pmatrix}2&0\\0&2\end{pmatrix}$ (matrice constante, indépendante du point).

Exercice 2

Vrai ou faux : la matrice hessienne d'une fonction $\mathcal{C}^2$ est toujours symétrique.

Corrigé

Vrai. C'est une conséquence directe du théorème de Schwarz : si les dérivées secondes croisées sont continues (c'est le cas pour une fonction $\mathcal{C}^2$ ), alors $f_{xy}=f_{yx}$ , ce qui rend la matrice hessienne symétrique.

Exercice 3

Pour $f(x,y) = x^2 - y^2$ , calculer $\det H_f$ et en déduire le signe de la forme quadratique associée.

Corrigé

$f_{xx}=2$ , $f_{yy}=-2$ , $f_{xy}=0$ . $H_f=\begin{pmatrix}2&0\\0&-2\end{pmatrix}$ . $\det H_f = 2\times(-2)-0^2=-4<0$ : la forme quadratique est indéfinite (valeurs propres $2$ et $-2$ , de signes opposés).

Exercice 4

Calculer $f_{xy}$ et $f_{yx}$ pour $f(x,y)=\sin(xy)$ , et vérifier qu'elles coïncident.

Corrigé

$f_x = y\cos(xy)$ . $f_{xy} = \dfrac{\partial}{\partial y}[y\cos(xy)] = \cos(xy) + y\times(-x\sin(xy)) = \cos(xy) - xy\sin(xy)$ . De même $f_y=x\cos(xy)$ , et $f_{yx} = \dfrac{\partial}{\partial x}[x\cos(xy)] = \cos(xy) - xy\sin(xy)$ . On a bien $f_{xy}=f_{yx}$ , conformément au théorème de Schwarz ( $\sin(xy)$ est $\mathcal C^\infty$ ).

Exercice 5

Vrai ou faux : si $\det H_f(a) > 0$ et $f_{xx}(a) < 0$ , alors la hessienne est définie négative.

Corrigé

Vrai. Lorsque $\det H_f(a)>0$ , les deux valeurs propres sont de même signe (leur produit est positif). Si de plus $f_{xx}(a)<0$ (qui, combiné avec $\det>0$ , force aussi $f_{yy}(a)<0$ ), les deux valeurs propres sont négatives : la hessienne est définie négative.

Exercice 6

Calculer la matrice hessienne de $f(x,y,z) = x^2+y^2+z^2-2xy$ .

Corrigé

$f_x=2x-2y$ , $f_y=2y-2x$ , $f_z=2z$ . Dérivées secondes : $f_{xx}=2$ , $f_{yy}=2$ , $f_{zz}=2$ , $f_{xy}=f_{yx}=-2$ , $f_{xz}=f_{zx}=0$ , $f_{yz}=f_{zy}=0$ . $H_f = \begin{pmatrix}2&-2&0\\-2&2&0\\0&0&2\end{pmatrix}$ — matrice constante et symétrique.

Exercice 7

Pour $f(x,y)=x^4+y^4$ , calculer $H_f(0,0)$ . Cette matrice est-elle définie positive ?

Corrigé

$f_x=4x^3$ , $f_y=4y^3$ . $f_{xx}=12x^2$ , $f_{yy}=12y^2$ , $f_{xy}=0$ . En $(0,0)$ , $H_f(0,0) = \begin{pmatrix}0&0\\0&0\end{pmatrix}$ — la matrice nulle, qui n'est pas définie positive (elle est seulement semi-définie positive, au sens large). Pourtant $(0,0)$ est bien un minimum global de $f$ (car $f(x,y)=x^4+y^4\geq0=f(0,0)$ ). Cet exemple illustre que le critère de la hessienne définie positive est suffisant mais pas nécessaire pour un minimum : quand $\det H_f=0$ , il faut une étude plus fine (ici directe, par positivité de $f$ ).

Exercice 8

Montrer que pour $f(x,y) = ax^2+2bxy+cy^2$ (forme quadratique générale), la hessienne est constante et égale à $H_f = \begin{pmatrix}2a&2b\\2b&2c\end{pmatrix}$ , puis donner la condition sur $a,b,c$ pour qu'elle soit définie positive.

Corrigé

$f_x = 2ax+2by$ , $f_y=2bx+2cy$ (en utilisant la symétrie du terme croisé $2bxy$ ). Puis $f_{xx}=2a$ , $f_{yy}=2c$ , $f_{xy}=f_{yx}=2b$ . $H_f = \begin{pmatrix}2a&2b\\2b&2c\end{pmatrix}$ , indépendante de $(x,y)$ car $f$ est un polynôme homogène de degré $2$ . Condition de définie positivité : $\det H_f = 4ac-4b^2 = 4(ac-b^2) > 0$ et $a>0$ (équivalent à $f_{xx}>0$ ), soit $ac>b^2$ et $a>0$ .

Exercice 9

Vrai ou faux : une matrice hessienne avec $\det H_f=0$ et $f_{xx}\neq0$ ne donne aucune information sur le comportement local de $f$ (cas dégénéré).

Corrigé

Vrai. Lorsque $\det H_f=0$ , une des valeurs propres est nulle : la forme quadratique du second ordre ne suffit plus à trancher (il faut étudier des termes d'ordre supérieur ou la fonction directement). C'est le cas \"dégénéré\" du critère de classification des points critiques.

Exercice 10

Calculer les valeurs propres de $H_f(1,1)$ pour $f(x,y) = x^2+3xy+y^2$ , et déterminer si la forme quadratique est définie positive, négative ou indéfinie.

Corrigé

$f_x=2x+3y$ , $f_y=3x+2y$ . $f_{xx}=2$ , $f_{yy}=2$ , $f_{xy}=f_{yx}=3$ (constantes, donc $H_f$ identique en tout point, en particulier en $(1,1)$ ). $H_f=\begin{pmatrix}2&3\\3&2\end{pmatrix}$ . Polynôme caractéristique : $(2-\lambda)^2-9=0 \iff (2-\lambda)^2=9 \iff 2-\lambda=\pm3 \iff \lambda = 2\mp3$ , soit $\lambda_1=5$ et $\lambda_2=-1$ . Signes opposés : la forme quadratique est indéfinie (cohérent avec $\det H_f = 4-9=-5<0$ ).

Exercice 11

Soit $f:\mathbb{R}^2\to\mathbb{R}$ , $\mathcal{C}^2$ , telle que $H_f(a)$ soit définie positive en un point $a$ . Que peut-on dire de $f$ au voisinage immédiat de $a$ par rapport au plan tangent ?

Corrigé

D'après la formule de Taylor à l'ordre $2$ : $f(a+h) = f(a) + \nabla f(a)\cdot h + \frac12 h^T H_f(a) h + o(\|h\|^2)$ . Le plan tangent est donné par $P(h) = f(a)+\nabla f(a)\cdot h$ . Donc $f(a+h) - P(h) = \frac12 h^T H_f(a) h + o(\|h\|^2)$ . Si $H_f(a)$ est définie positive, $h^T H_f(a) h \geq \lambda_{\min}\|h\|^2 > 0$ pour $h\neq0$ ( $\lambda_{\min}>0$ la plus petite valeur propre), donc pour $h$ assez petit le terme quadratique domine le $o(\|h\|^2)$ : $f(a+h) > P(h)$ . Conclusion : le graphe de $f$ reste au-dessus de son plan tangent au voisinage de $a$ — c'est la traduction géométrique de la convexité locale stricte.

Exercice 12

Vrai ou faux : si $f_{xx}(a)>0$ et $f_{yy}(a)>0$ , alors $H_f(a)$ est nécessairement définie positive.

Corrigé

Faux. Il faut aussi $\det H_f(a) = f_{xx}f_{yy}-f_{xy}^2 > 0$ . Contre-exemple : $f_{xx}=1$ , $f_{yy}=1$ , $f_{xy}=10$ : les termes diagonaux sont positifs mais $\det = 1-100=-99<0$ , donc la matrice est en réalité indéfinie (pas définie positive), à cause d'un terme croisé trop grand.

Exercice 13

Soit $f(x,y) = \ln(1+x^2+y^2)$ . Calculer $H_f(0,0)$ .

Corrigé

$f_x = \dfrac{2x}{1+x^2+y^2}$ , $f_y=\dfrac{2y}{1+x^2+y^2}$ . En dérivant à nouveau (quotient), $f_{xx} = \dfrac{2(1+x^2+y^2) - 2x\cdot2x}{(1+x^2+y^2)^2}$ , qui en $(0,0)$ donne $\dfrac{2\times1-0}{1}=2$ . Par symétrie des rôles de $x,y$ , $f_{yy}(0,0)=2$ . Pour $f_{xy} = \dfrac{\partial}{\partial y}\left(\dfrac{2x}{1+x^2+y^2}\right) = \dfrac{-2x\times2y}{(1+x^2+y^2)^2}$ , qui s'annule en $(0,0)$ . Donc $H_f(0,0) = \begin{pmatrix}2&0\\0&2\end{pmatrix}$ , définie positive : $(0,0)$ est bien un minimum local (et global) de $f$ , cohérent avec $\ln(1+x^2+y^2)\geq\ln(1)=0=f(0,0)$ .

Exercice 14

Soit $H_f(a) = \begin{pmatrix} 4 & 2 \\ 2 & 1\end{pmatrix}$ . Calculer $\det H_f(a)$ et conclure sur la nature de la forme quadratique (en précisant le cas limite).

Corrigé

$\det H_f(a) = 4\times1 - 2\times2 = 4-4=0$ . C'est le cas dégénéré : une des deux valeurs propres est nulle (la trace est $4+1=5$ , donc les valeurs propres sont $0$ et $5$ , qui se vérifie aussi car $H_f$ a pour vecteur propre $(1,-2)$ associé à la valeur propre $0$ : $H_f(1,-2)^T = (4-4,\,2-2)=(0,0)$ ). La forme quadratique est semi-définie positive (positive ou nulle, jamais négative), mais pas strictement définie positive. Ce cas ne permet pas de conclure directement sur la nature du point critique par le seul critère de la hessienne : il faut examiner des ordres supérieurs ou la fonction directement.

Exercice 15

Expliquer pourquoi, pour une fonction de classe $\mathcal C^2$ , la connaissance de $H_f(a)$ permet d'approcher localement $f$ par une fonction quadratique, et pourquoi cette approximation est dite \"d'ordre 2\".

Corrigé

La formule de Taylor à l'ordre $2$ écrit $f(a+h) = f(a) + \nabla f(a)\cdot h + \frac12 h^T H_f(a) h + o(\|h\|^2)$ . Le terme de degré $0$ ( $f(a)$ ), le terme de degré $1$ (linéaire en $h$ , via le gradient) et le terme de degré $2$ (quadratique en $h$ , via la hessienne) forment ensemble un polynôme de degré $2$ en $h$ qui approche $f$ au voisinage de $a$ avec une erreur négligeable devant $\|h\|^2$ (et pas seulement devant $\|h\|$ , comme c'était le cas pour le plan tangent à l'ordre $1$ ). C'est en ce sens que l'on parle d'approximation \"d'ordre 2\" : elle utilise les informations de dérivation jusqu'à l'ordre $2$ et offre une précision supérieure, indispensable pour classifier finement les points critiques (un gradient nul à lui seul ne suffit pas, voir leçon suivante).

AlphaMath Académie · Matrice hessienne · Calcul différentiel L2 — Fonctions de plusieurs variables et optimisation