Lien de la note Hackmd
Bienvenue dans le merveilleux monde de la differentielle <3
BUT: Etudier les extrema d’une fonction convexe
Exemple
f(x)=ax2+bx+ca>0On derive f, f′(x)=2ax+b
On cherche x∗ tel que f′(x∗)=0
f′(x∗)=0=2ax∗+bPoint optimal:
x∗=−b2aValeur optimale:
f∗=f(x∗)=a(−b2a)2+b(−b2a)+c=b24a−b22a+c=−b24a+cf∗=minx∈Rf(x)x∗=argminx∈Rf(x)
On a envie de faire pareil pour f:Rn→Rx=(x1,x2,...,xn)↦f(x)
On a besoin de generaliser la notion de derive pour des fonctions de plusieurs variables.
Rappel
On dit que f:R→R est derivable en x0 ssi limx→x0f(x)−f(x0)x−x0 existe et est finie.
Si c’est le cas, f′(x0)=limx→x0f(x)−f(x0)x−x0 est le nombre derive de f en x0.
f′(x0)≡ pente de la tangente au point (x0,f(x0)).
Equation de la tangente: Elle passe par le point (x0,f(x0)) et →u=(1,f(x0)) est un vecteur directeur
→y=f(x0)+(x−x0)f′(x0)Si f est convexe → le graphe de f est toujours au dessus de la tangente, quelque soit le point ou on trace la tangente
∀x0∈R,f(x)≥f(x0)+(x−x0)f′(x0)C’est la caracterisation a l’ordre 1 de la convexite.
On peut reecrire le nombre derive comme f′(x0)=limh→0f(x0+h)−f(x0)h en posant h=x−x0
Petit rappel: On dit que fθa(g) s’il existe ε:R→R avec ε(x)→x→a0 et f(x)=g(x)ε(x),x∈V(a)
f(x)g(x)→x→a0limh→0f(x0+h)−f(x0)h=f′(x0)⇔limh→0f(x0+h)−f(x0)−hf′(x0)h=0⇔f(x0+h)−f(x0)−hf′(x0)={θa(h)hε(h)⇔f(x0+h)=f(x0)+h→hf′(x0) lineaire en hhf′(x0)+hε(x)DL a l'ordre 1 en 0En quoi c’est faux ?
limx→x0f(x)−f(x0)x−x0∈Rn=limh→0f(x)−f(x0)x−x0∈RnOn divise par des vecteurs !
Wait that’s illegal
On pourrait regarder axe par axe (coordonnee par coordonnee) ⇒ derivees partielles
Definition: Si la fonction ϕ:t↦f(x1,…,xk+t,…,xn) est derivable en 0, on dit que la ke derivee partielle de f existe en x=(x1,…,xn), et ϕ′(0)=δfδxk(x) (se note δnf(x))
ϕ(t)=f(x1,...,xk+t,...,xn)=f(x+t(0,...0,1,0,...0))On regarde ce qu’il se passe pour la ke coordonnee en “bloquant” les autres.
Pour f:R→R, f′(x0) existe ⇔ f derivable en x0 ⇒ f continue en x0
Manque de bol, l’existence des derivees partielles en un point donne ⇏ continuite de f
Exemple
f:R2→R(x,y)↦{xyx2+y2(x,y)≠(0,0)0(x,y)=(0,0)On va regarder ϕx:t→f((0,0)+t(1,0))ϕx(t)=f(t,0)=0∀t→ϕ′x(0)=0δfδx(0,0)
Idem pour y
ϕy:t→f((0,0)+t(0,1))=f(0,t)=0∀t→ϕ′y(0)=0=δfδy(0,0)δfδx et δfδy existent en (0,0), mais f n’est pas continue
Derivee directionnelle
On peut generaliser la notion de derivee en un vecteur → On dit que f est derivable en x0 selon un vecteur v∈Rn∖0 si la fonction ϕ:t↦f(x0+tv) est derivable en 0. On note ϕ′(0)=limt→0f(x0+tv)−f(x0)t=Dvf(x0)
δfδxi(x0)=Deif(x0)Exemple
f:R2→R(x,y)↦x2+y2Que vaut la derivee selon v=(2,0) et x0=(1,0) ?
ϕ:t→f(x0+tv)=f((1,0)+t(2,0))=f(1+2t,0)=(1+2t)2+02=4t2+4t+1→ϕ(t)=4t2+4t+1→ϕ′(t)=8t+4→phi′(0)=Dvf(x0)=4Et De1=δfδx(x0)=2{D(2,0)f(x0)=4D(1,0)f(x0)=δfδx(x0)=2D'une maniere generale, Dαvf(x0)=αDvf(x0)Si ∥v∥=1→ derivee en x0 en vecteur v ≡ derivee directionnelle en x0 selon v
Est-ce que les derivees directionnelles sont la solution ?
Est-ce que l’existence des derivees directionnelles en x0 selon tout vecteur v∈Rn∖0 garantit la continuite ?
Exemple
f:R2→R(x,y)↦{y2xx≠0yx=0En (0,0) selon v=(v1,v2)≠(0,0)
ϕ:t→f(x0+tv)=f((0,0)+t(v1,v2))=f(tv1,tv2)ϕ(t)={(tv2)2tv1v1≠0tv2v1=0ϕ(t)={tv22v1v≠0tv2v1=0ϕ′(t)={v22v1v1≠0v2v1=0ϕ′(0)={v22v1v1≠0v2v1=0→ existe ∀v∈R2∖{0}f admet une derivee en 0 quelque soit le vecteur v∈R2∖0
Pourant, f n’est pas continue en (0,0).
Si on regarde le parametrage ψ:t→(t2,t)
f∘ψ(t)=f(ψ(t))=f(t2,t)={t2t2t≠00t=0→ f∘ψ n’est pas continue en 0 → f n’est pas continue en 0
Nouvelle approche
On va changer l’angle d’attaque Pour f:R→R, on a vu: f derivable en x0 ⇔limh→0f(x0+h)−f(x0)h⇔f(x0+h)=f(x0)la variable c'est h+hf′(x0)fonction lineaire par rapport a h+θa(h)hε(h)
Definition: On dit que f est differentiable en x0 s’il existe une application lineaire dx0fse note aussi df(x0),dfx0:Rn→R telle que
f(x0)+dx0f(h)+θa(∥h∥)∥h∥ε(h)
Pour f:R→R, f derivable en x0 ⇔ f(x0+h)=f(x0)+hf′(x0)dx0f avec dx0f:h→hf′(X0)+hε(h)
dx0f s’appelle la differentielle de f en x0
differentielle = application lineaire = fonction ≠ f′(x0) = valeur
Proposition: Si f est differentiable en x0, f est continue en x0 preuve → admise
Exemple
f:R→Rx↦x2En x0
f(x0+h)=(x0)2=x20f(x0)+fonction lineaire par rapport a h→dx0f(h)=2hx0→dx0h↦2x0hf(x0)2hx0+h2θa(h)→h2h=h→h→00 f:Rn→Rx↦xTxEn x0:
f(x0+h)=(x0+h)T(x0+h)=xT0x0+xT0h+hTx0(hTx0)T=xT0h+hTh=xT0x0f(x0)+2xT0h+hThθa(∥h∥)hTh=<h,h>=∥h∥2hTh∥h∥=∥h∥2∥h∥=∥h∥→h→00Et 2xT0h est lineaire (2xT0(h1+λh2))=2xT0h1+2λxT0h
Propriete: Si f differentielle en x0, alors f admet des derivees selon tout vecteur h∈Rn∖0 et Dhf(x0)=dx0f(h)
Lien entre differentielle et vecteur gradient
f differentielle en x0, f admet des derivees selon tout vecteur h∈Rn∖0, en particulier selon les vecteurs de la base canonique (e1,…,en) → toutes les derivees partielles δfδx(x0) existent
h∈Rnh=⎛⎜
⎜⎝h1⋮hn⎞⎟
⎟⎠h=n∑i=1hieidx0f(h)=dx0f(n∑i=1hiei){hi∈R∀iei∈Rnf lineaire f(λx+μy)=λf(x)+μf(y)=n∑i=1hidx0f(ei)=n∑i=1hiDeif(x0)=n∑i=1hiδfδxi(x0)Definition: On appelle vecteur gradient de f en x0
∇x0f=∇f(x0)=⎛⎜
⎜
⎜
⎜⎝δfδxi(x0)⋮δfδxn(x0)⎞⎟
⎟
⎟
⎟⎠ dx0f(h)=n∑i=1hiδfδxi(x0)=(δfδx1(x0),...,δfδxn(x0)∇x0fT)⎛⎜
⎜⎝h1⋮hn⎞⎟
⎟⎠=∇x0fTh=<∇x0,h>f differentielle en x0, dx0=<∇x0f,h>=∇x0fTh
La differentielle est donc
dx0f:h↦<∇x0f,h>=∇x0fTh
f:R→R3x↦(2x,x2,3x+2)f differentiable en x0 ⇔ f1,…,fp sont differentiables en x0
f(x0+h)=⎛⎜
⎜⎝f1(x0+h)⋮fp(x0+h)⎞⎟
⎟⎠=⎛⎜
⎜⎝f1(x0)+dx0f1(h)+θa(∥h∥)⋮fp(x0)+dx0fp(h)+θa(∥h∥)⎞⎟
⎟⎠=⎛⎜
⎜⎝f1(x0)⋮fp(x0)⎞⎟
⎟⎠f(x0)+⎛⎜
⎜⎝dx0f1(h)⋮dx0fp(h)⎞⎟
⎟⎠?+θ(∥h∥)∈RpLes fi,i=1,…,p sont des fonctions differentiables de Rn→R
dx0fi(h)=<∇x0fi,h>=∇x0fTih=(δf1δx1(x0),...,δfnδxn(x0))h⎛⎜
⎜⎝dx0f1(h)⋮dx0fp(h)⎞⎟
⎟⎠Rp=⎛⎜
⎜⎝∇x0fT1h⋮∇x0fTph⎞⎟
⎟⎠Rp=⎛⎜
⎜
⎜
⎜⎝(δf1δx1,...,δf1δxn)h⋮(δfpδx1,...,δfpδxn)h⎞⎟
⎟
⎟
⎟⎠Rp=⎡⎢
⎢
⎢
⎢⎣δf1δx1,...,δf1δxn⋮δfpδx1,...,δfpδxn⎤⎥
⎥
⎥
⎥⎦Rp×nmatrice jacobiennehRnPour une fonction f:Rn→Rp, on appelle matrice jacobienne en x0, et on note Jacx0f, la matrice des derivees partielles [Jacx0f]ij=δfiδxj
dx0f(h)=Jacx0f×h La differentielle de f:Rn→Rp en x0 est l’application lineaire dx0f:h↦Jacx0f×h f differentielle en x0, f(x0+h)=f(x0)+dx0dx0f application lineaire+θa(∥h∥)
- f:R→R3dx0f:h↦hf′(x0)
- f:Rn→Rdx0f:h↦<∇x0f,h>=∇x0fTh
- f:Rn→Rpdx0f:h↦Jacx0f×h