Fiche récapitulative générée pour impression / export PDF.

Licence 2 · Calcul différentiel L2 — Fonctions de plusieurs variables et optimisation

Dérivées partielles et gradient

Dérivées partielles et gradient

1. Fonctions de plusieurs variables

On étudie ici des fonctions f:RnRf:\mathbb{R}^n\to\mathbb{R}, le plus souvent n=2n=2 ou n=3n=3 pour fixer les idées (par exemple f(x,y)f(x,y) ou f(x,y,z)f(x,y,z)). Une telle fonction associe un nombre réel à un point de Rn\mathbb{R}^n — pensez à une altitude f(x,y)f(x,y) au-dessus d'un point (x,y)(x,y) d'une carte.

2. Dérivée partielle

Soit f:R2Rf:\mathbb{R}^2\to\mathbb{R} et (a,b)R2(a,b)\in\mathbb{R}^2. La dérivée partielle de ff par rapport à xx en (a,b)(a,b) est

fx(a,b)=limh0f(a+h,b)f(a,b)h\frac{\partial f}{\partial x}(a,b) = \lim_{h\to0} \frac{f(a+h,b)-f(a,b)}{h}

quand cette limite existe. C'est la dérivée usuelle de la fonction d'une seule variable xf(x,b)x\mapsto f(x,b) obtenue en figeant y=by=b. De même pour fy(a,b)\frac{\partial f}{\partial y}(a,b), en figeant x=ax=a.

Méthode pratique : pour calculer f/x\partial f/\partial x, on dérive ff par rapport à xx en traitant yy (et les autres variables) comme des constantes.

Exemple : f(x,y)=x2y+3y3f(x,y) = x^2y + 3y^3. On a fx=2xy\dfrac{\partial f}{\partial x} = 2xy (on dérive x2yx^2y comme x2×(constante y)x^2\times(\text{constante } y), et 3y33y^3 est constant en xx donc sa dérivée par rapport à xx est nulle). Et fy=x2+9y2\dfrac{\partial f}{\partial y} = x^2 + 9y^2 (on dérive x2yx^2y comme (constante x2)×y(\text{constante } x^2)\times y, et 3y33y^3 donne 9y29y^2).

3. Le vecteur gradient

Le gradient de f:RnRf:\mathbb{R}^n\to\mathbb{R} en un point aa, lorsque toutes les dérivées partielles existent, est le vecteur

f(a)=(fx1(a),,fxn(a))\nabla f(a) = \left(\frac{\partial f}{\partial x_1}(a), \ldots, \frac{\partial f}{\partial x_n}(a)\right)

Pour n=2n=2 : f(a,b)=(fx(a,b),fy(a,b))\nabla f(a,b) = \left(\dfrac{\partial f}{\partial x}(a,b), \dfrac{\partial f}{\partial y}(a,b)\right).

Exemple (suite) : pour f(x,y)=x2y+3y3f(x,y)=x^2y+3y^3, f(x,y)=(2xy,x2+9y2)\nabla f(x,y) = (2xy,\, x^2+9y^2). Au point (1,2)(1,2) : f(1,2)=(2×1×2,1+9×4)=(4,37)\nabla f(1,2) = (2\times1\times2,\, 1+9\times4) = (4, 37).

4. Interprétation géométrique du gradient

Direction de plus forte pente : f(a)\nabla f(a) pointe dans la direction où ff croît le plus rapidement au voisinage de aa, et f(a)\|\nabla f(a)\| mesure cette pente maximale. C'est pourquoi en optimisation, on utilise l'algorithme de "descente de gradient" : pour minimiser ff, on se déplace dans la direction f-\nabla f.

Dérivée directionnelle : dans une direction unitaire u\vec{u}, le taux de variation de ff en aa est

Duf(a)=f(a)uD_{\vec u}f(a) = \nabla f(a)\cdot \vec u

(produit scalaire). Cette quantité est maximale (égale à f(a)\|\nabla f(a)\|) lorsque u\vec u est colinéaire à f(a)\nabla f(a) et de même sens, et minimale (vaut f(a)-\|\nabla f(a)\|) dans le sens opposé.

Lien avec les lignes de niveau : le gradient f(a)\nabla f(a) est orthogonal à la ligne (ou surface) de niveau de ff passant par aa, c'est-à-dire à l'ensemble {x:f(x)=f(a)}\{x : f(x)=f(a)\}.

5. Différentiabilité

ff est différentiable en aa s'il existe une application linéaire L:RnRL:\mathbb{R}^n\to\mathbb{R} (nécessairement L(h)=f(a)hL(h) = \nabla f(a)\cdot h si elle existe) telle que

f(a+h)=f(a)+L(h)+o(h)quand h0f(a+h) = f(a) + L(h) + o(\|h\|) \quad \text{quand } h\to0

Autrement dit, ff admet une "meilleure approximation affine" au voisinage de aa : le plan tangent au graphe de ff en aa.

Lien différentiabilité \Leftrightarrow dérivées partielles :
- Si ff est différentiable en aa, alors ff admet toutes ses dérivées partielles en aa, et L(h)=f(a)hL(h)=\nabla f(a)\cdot h.
- La réciproque est fausse en général : l'existence des dérivées partielles n'entraîne pas la différentiabilité.
- Théorème (condition suffisante pratique) : si les dérivées partielles de ff existent et sont continues sur un voisinage de aa, alors ff est différentiable en aa. On dit alors que ff est de classe C1\mathcal{C}^1. C'est le critère utilisé en pratique dans la quasi-totalité des exemples concrets (polynômes, fonctions usuelles).

Exemple de non-différentiabilité malgré l'existence des dérivées partielles : f(x,y)=xyx2+y2f(x,y) = \dfrac{xy}{x^2+y^2} pour (x,y)(0,0)(x,y)\neq(0,0), f(0,0)=0f(0,0)=0. On calcule fx(0,0)=limh0f(h,0)f(0,0)h=limh000h=0\frac{\partial f}{\partial x}(0,0) = \lim_{h\to0}\frac{f(h,0)-f(0,0)}{h} = \lim_{h\to0}\frac{0-0}{h}=0 (car f(h,0)=0f(h,0)=0 pour h0h\neq0). De même fy(0,0)=0\frac{\partial f}{\partial y}(0,0)=0. Pourtant ff n'est même pas continue en (0,0)(0,0) (en suivant y=xy=x, f(x,x)=x22x2=12f(x,x)=\frac{x^2}{2x^2}=\frac12 ne tend pas vers f(0,0)=0f(0,0)=0), donc ff ne peut pas être différentiable en (0,0)(0,0) (la différentiabilité implique la continuité).

6. Plan tangent

Si f:R2Rf:\mathbb{R}^2\to\mathbb{R} est différentiable en (a,b)(a,b), le graphe de ff admet un plan tangent en (a,b,f(a,b))(a,b,f(a,b)) d'équation

z=f(a,b)+fx(a,b)(xa)+fy(a,b)(yb)z = f(a,b) + \frac{\partial f}{\partial x}(a,b)(x-a) + \frac{\partial f}{\partial y}(a,b)(y-b)

Exemple résolu : soit f(x,y)=x2+y2f(x,y) = x^2+y^2. Au point (1,1)(1,1) : f(1,1)=2f(1,1)=2, f(1,1)=(2,2)\nabla f(1,1) = (2,2). Le plan tangent a pour équation z=2+2(x1)+2(y1)=2x+2y2z = 2 + 2(x-1)+2(y-1) = 2x+2y-2.

Exercices de la leçon

Exercice 1

Calculer fx\dfrac{\partial f}{\partial x} et fy\dfrac{\partial f}{\partial y} pour f(x,y)=3x2y2y3f(x,y) = 3x^2y - 2y^3.

Corrigé

On dérive par rapport à xx en traitant yy comme constant : fx=6xy\dfrac{\partial f}{\partial x} = 6xy. On dérive par rapport à yy en traitant xx comme constant : fy=3x26y2\dfrac{\partial f}{\partial y} = 3x^2 - 6y^2.

Exercice 2

Le gradient de f(x,y)=x2+y2f(x,y)=x^2+y^2 au point (3,4)(3,4) est :

Corrigé

f(x,y)=(2x,2y)\nabla f(x,y) = (2x, 2y). Au point (3,4)(3,4) : f(3,4)=(6,8)\nabla f(3,4) = (6,8).

Exercice 3

Vrai ou faux : le gradient d'une fonction pointe dans la direction de plus forte décroissance.

Corrigé

Faux. Le gradient pointe dans la direction de plus forte croissance. C'est l'opposé du gradient, f-\nabla f, qui pointe dans la direction de plus forte décroissance (utilisé en descente de gradient).

Exercice 4

Calculer le gradient de f(x,y,z)=xyzf(x,y,z) = xyz au point (1,2,3)(1,2,3).

Corrigé

fx=yz\dfrac{\partial f}{\partial x}=yz, fy=xz\dfrac{\partial f}{\partial y}=xz, fz=xy\dfrac{\partial f}{\partial z}=xy. Au point (1,2,3)(1,2,3) : f(1,2,3)=(2×3,1×3,1×2)=(6,3,2)\nabla f(1,2,3) = (2\times3,\,1\times3,\,1\times2) = (6,3,2).

Exercice 5

Vrai ou faux : si ff est différentiable en aa, alors ff est continue en aa.

Corrigé

Vrai. La différentiabilité s'écrit f(a+h)=f(a)+L(h)+o(h)f(a+h)=f(a)+L(h)+o(\|h\|) ; quand h0h\to0, L(h)0L(h)\to0 (application linéaire continue en dimension finie) et o(h)0o(\|h\|)\to0, donc f(a+h)f(a)f(a+h)\to f(a) : ff est continue en aa.

Exercice 6

Calculer la dérivée directionnelle de f(x,y)=x2+2y2f(x,y)=x^2+2y^2 en (1,1)(1,1) dans la direction du vecteur unitaire u=(1/2,1/2)\vec u = (1/\sqrt2, 1/\sqrt2).

Corrigé

f(1,1)=(2x,4y)(1,1)=(2,4)\nabla f(1,1) = (2x,4y)|_{(1,1)} = (2,4). Duf(1,1)=f(1,1)u=2×12+4×12=62=32D_{\vec u}f(1,1) = \nabla f(1,1)\cdot\vec u = 2\times\frac{1}{\sqrt2} + 4\times\frac{1}{\sqrt2} = \frac{6}{\sqrt2} = 3\sqrt2.

Exercice 7

Donner l'équation du plan tangent au graphe de f(x,y)=x2y2f(x,y)=x^2-y^2 au point (2,1)(2,1).

Corrigé

f(2,1)=41=3f(2,1)=4-1=3. f(x,y)=(2x,2y)\nabla f(x,y)=(2x,-2y), donc f(2,1)=(4,2)\nabla f(2,1)=(4,-2). Le plan tangent : z=f(2,1)+4(x2)2(y1)=3+4x82y+2=4x2y3z = f(2,1) + 4(x-2) -2(y-1) = 3+4x-8-2y+2 = 4x-2y-3.

Exercice 8

Dans quelle direction unitaire la dérivée directionnelle de f(x,y)=xyf(x,y)=xy en (2,3)(2,3) est-elle maximale, et quelle est sa valeur ?

Corrigé

f(2,3)=(y,x)(2,3)=(3,2)\nabla f(2,3) = (y,x)|_{(2,3)} = (3,2). La direction de plus forte croissance est u=(3,2)(3,2)=(3,2)13\vec u = \dfrac{(3,2)}{\|(3,2)\|} = \dfrac{(3,2)}{\sqrt{13}}, et la valeur maximale de la dérivée directionnelle est f(2,3)=9+4=13\|\nabla f(2,3)\| = \sqrt{9+4}=\sqrt{13}.

Exercice 9

Vrai ou faux : si les dérivées partielles de ff existent en un point aa, alors ff est nécessairement différentiable en aa.

Corrigé

Faux. L'existence des dérivées partielles ne suffit pas. Contre-exemple classique : f(x,y)=xyx2+y2f(x,y)=\frac{xy}{x^2+y^2} (prolongée par 00 en l'origine) admet des dérivées partielles nulles en (0,0)(0,0) mais n'est même pas continue en (0,0)(0,0), donc pas différentiable.

Exercice 10

Soit f(x,y)=x2+y2f(x,y) = \sqrt{x^2+y^2}. Calculer f\nabla f en un point (x,y)(0,0)(x,y)\neq(0,0) et interpréter géométriquement sa direction.

Corrigé

fx=xx2+y2\dfrac{\partial f}{\partial x} = \dfrac{x}{\sqrt{x^2+y^2}}, fy=yx2+y2\dfrac{\partial f}{\partial y} = \dfrac{y}{\sqrt{x^2+y^2}} (dérivation de u\sqrt{u}). Donc f(x,y)=(x,y)(x,y)\nabla f(x,y) = \dfrac{(x,y)}{\|(x,y)\|} : c'est le vecteur unitaire radial. Géométriquement, ff représente la distance à l'origine, dont les lignes de niveau sont des cercles ; le gradient, orthogonal aux lignes de niveau, pointe donc radialement vers l'extérieur — la direction où l'on s'éloigne le plus vite de l'origine.

Exercice 11

Montrer, en utilisant la définition par la limite, que f(x,y)=x2+y2f(x,y)=x^2+y^2 est différentiable en (0,0)(0,0) avec L(h1,h2)=0L(h_1,h_2)=0.

Corrigé

On veut écrire f(h1,h2)=f(0,0)+L(h1,h2)+o(h)f(h_1,h_2) = f(0,0) + L(h_1,h_2) + o(\|h\|) avec L=0L=0 (car f(0,0)=(0,0)\nabla f(0,0)=(0,0) pour f(x,y)=x2+y2f(x,y)=x^2+y^2). On calcule le reste : f(h1,h2)f(0,0)0=h12+h22=h2f(h_1,h_2) - f(0,0) - 0 = h_1^2+h_2^2 = \|h\|^2. Or h2h=hh00\dfrac{\|h\|^2}{\|h\|} = \|h\| \xrightarrow[h\to0]{} 0, donc le reste est bien un o(h)o(\|h\|). La définition de la différentiabilité est vérifiée avec L=0L=0, ce qui est cohérent avec le fait que (0,0)(0,0) est un minimum de ff (le plan tangent y est horizontal).

Exercice 12

Soit f(x,y)=x33xy2f(x,y) = x^3 - 3xy^2. Montrer que les courbes de niveau de ff et les directions du gradient sont orthogonales en tout point où f0\nabla f \neq 0, en illustrant sur le point (1,1)(1,1).

Corrigé

Propriété générale : si γ(t)\gamma(t) est une courbe paramétrée incluse dans la ligne de niveau {f=c}\{f=c\} (donc f(γ(t))=cf(\gamma(t))=c constant), alors en dérivant par rapport à tt via la règle de la chaîne, f(γ(t))γ(t)=0\nabla f(\gamma(t))\cdot\gamma'(t) = 0 : le gradient est orthogonal au vecteur tangent γ(t)\gamma'(t) de la ligne de niveau, donc orthogonal à la ligne de niveau elle-même. Vérification numérique en (1,1)(1,1) : fx=3x23y2\dfrac{\partial f}{\partial x}=3x^2-3y^2, qui vaut 33=03-3=0 en (1,1)(1,1) ; fy=6xy\dfrac{\partial f}{\partial y}=-6xy, qui vaut 6-6 en (1,1)(1,1). Donc f(1,1)=(0,6)\nabla f(1,1)=(0,-6), vecteur vertical, qui serait bien orthogonal à la tangente horizontale de la ligne de niveau si celle-ci était horizontale en ce point (ce que l'on peut vérifier en dérivant implicitement f(x,y)=cf(x,y)=c).

Exercice 13

Vrai ou faux : pour une fonction C1\mathcal C^1 sur R2\mathbb{R}^2, le plan tangent au graphe en un point aa est l'unique plan affine tel que f(a+h)[plan](a+h)0f(a+h)-[\text{plan}](a+h) \to 0 plus vite que h\|h\|.

Corrigé

Vrai. C'est précisément la définition de la différentiabilité : le plan tangent (donné par l'approximation affine f(a)+f(a)hf(a)+\nabla f(a)\cdot h) est l'unique approximation affine telle que le reste soit un o(h)o(\|h\|). Cette unicité justifie le nom \"meilleure approximation affine\".

Exercice 14

Soit f(x,y)=xf(x,y) = |x|. Étudier la différentiabilité de ff en (0,0)(0,0).

Corrigé

fx(0,0)=limh0h0h\dfrac{\partial f}{\partial x}(0,0) = \lim_{h\to0}\dfrac{|h|-0}{h}, qui n'existe pas car cette limite vaut 11 si h0+h\to0^+ et 1-1 si h0h\to0^-. Comme une dérivée partielle nécessaire à la différentiabilité fait déjà défaut, ff n'est pas différentiable en (0,0)(0,0) (bien que fy(0,0)=0\dfrac{\partial f}{\partial y}(0,0)=0 existe, car ff ne dépend pas de yy). Géométriquement, le graphe de ff présente une arête vive le long de l'axe yy, donc aucun plan tangent n'y est défini.

Exercice 15

Calculer le gradient de f(x,y)=exyf(x,y) = e^{xy} et déterminer en quels points f=(0,0)\nabla f = (0,0).

Corrigé

fx=yexy\dfrac{\partial f}{\partial x} = y\,e^{xy}, fy=xexy\dfrac{\partial f}{\partial y} = x\,e^{xy} (dérivation de l'exponentielle composée). Comme exy>0e^{xy}>0 pour tout (x,y)(x,y), on a f(x,y)=(0,0)    yexy=0 et xexy=0    y=0 et x=0\nabla f(x,y)=(0,0) \iff y\,e^{xy}=0 \text{ et } x\,e^{xy}=0 \iff y=0 \text{ et } x=0 (puisque exy0e^{xy}\neq0). Le seul point critique de ff est donc (0,0)(0,0), où f(0,0)=1f(0,0)=1.

AlphaMath Académie · Dérivées partielles et gradient · Calcul différentiel L2 — Fonctions de plusieurs variables et optimisation