Lien de la note Hackmd
Feuille 4 Exercice 2
Partie A
La variable aleatoire X suit une loi de densite:
f(x,θ)=θxθ−11[0;1](x)ou le parametre θ est strictement positif.
En d’autres termes, f(x,θ)=0 si x∉[0;1] et f(x,θ)=θxθ−1 si x∈[0;1].
- Justifier que, pour tout θ>0, f(.,θ) definit bien une densite sur R.
- Calculer E(X)
- Determiner l’estimateur du maximum de vraisemblance ˆθ du parametre θ.
- Considerons maintenant la variable aleatoire Y:=−lnX.
- Pourquoi est-elle bien definie ?
- Montrer que la variable aleatoire Y suit une loi Γ(1,θ).
Solution
1.
Comme θ>0 et x∈[0;1], f(x,θ) est strictement positive.
∫10f(x,θ)=[xθ]10=1θ−0=1On a donc bien une densite.
2.
E(X)=∫10xf(x,θ)1[0;1]dx=∫10θxθdx=[θxθ+1θ+1]=θtheta+1>03.
Considerons:
L(x1,…,xn,θ)=n∏i=1θxθ−1i1[0;1](xi)=θnn∏i=1xθ−1in∏i=11[0;1](xi)Pourquoi est-ce que les indicatrices ne posent pas de problemes ?
Car nos observations sont entre 0 et 1
Pour determiner le maximum, nous pouvons nous restreindre au cas: (x1,…,xn)∈[0;1] car les xi sont des observations.
Passons au logarithme:
ln(L(x1,…,xn,θ))=nln(θ)+(θ−1)n∑i=1xiCalculons la derivee partielle:
∂ln(x1,…,xn,θ)∂θ=nθ+n∑i=1ln(Xi)∂ln(x1,…,xn)∂θ=0⇔θ=−n∑ni=1ln(Xi)Verifions la conditions du second ordre:
∂2ln(L(x1,…,xn,θ))∂θ2=−nθ2<0∀θ>0ˆθ est bien l’EMV!
4.
Question 1.
Elle est bien definie car comme X∈[0;1], ln(X)<0 donc −ln(X)>0
2.
Pourquoi on parle de loi Γ au lieu de loi exponentielle ?
y=−lnxlnx=−yx=e−yCar c’est facile d’additionner les loi Γ.
On pose ϕ(x)=−ln(x)
ϕ′(x)=−1xϕ−1(x)=e−xfY(y)=−1ϕ′(ϕ−1(y))⋅f(ϕ−1(y))ϕ′(ϕ−1(y))=−1e−x=e−y⋅θϕ−1(y)θ−1=e−y⋅e−y(θ−1)=θe−θyDonc Y⇝
car fonction caracteristique de la loi exponentielle
Qu’est-ce qu’on a oublie dans notre formule ?
La valeur absolue du Jacobien
Partie B
Considerons n variables aleatoires independantes X_i suivant la loi de X. Nous souhaitons tester l’hypothese H_0 : \theta = \theta_0 contre H_1 : \theta = \theta_1 avec \theta_0 < \theta_1 a l’aide d’observations x_i issues de l’echantillon precedent.
- Nous noterons, dans la suite de l’exercice, Y_i = − \ln X_i. Montrer que la statistique de Neyman-Pearson est: T_n:=\sum_{i=1}^nY_i
- Determiner la loi de la variable aleatoire T_n puis celle de la variable aleatoire U_n:=\frac{T_n}{\theta}
- Exprimer les risques de premiere et de seconde espece \alpha et \beta en fonction du seuil S_{\alpha}, des parametres \theta_0 et \theta_1 et de la fonction de repartition de la variable aleatoire U_n.
Solution
1.
\begin{aligned} \frac{L(X_1,\dots,X_n\theta_1)}{L(X_1,\dots,X_n\theta_0)}&=\frac{\prod_{i=1}^n\theta_1x_i^{\theta_1-1}}{\prod_{i=1}^n\theta_0x_i^{\theta_0-1}}\\ &= \biggr(\frac{\theta_1}{\theta_2}\biggr)^n\prod_{i=1}^nX_i^{\theta_1-\theta_0} \end{aligned}(H_0) est rejetee si:
\begin{aligned} T&\gt C_{\alpha}\\ \ln(T_n)=n\ln(\frac{\theta_1}{\theta_0})+(\theta_n-\theta_0)\sum_{i=1}^n\ln(X_i)&\gt\ln(C_{\alpha})\\ \sum_{i=1}^n\ln(X_i)&\gt\underbrace{\frac{\ln(C_{\alpha})-n\ln(\frac{\theta_1}{\theta_0})}{\theta_n-\theta_0}}_{S_{\alpha}'}\\ -\sum\ln(X_i)&\lt -S_{\alpha}'\\ T_n=-\sum_{i=1}^n\ln(X_i)&\lt S_{\alpha}\quad \text{ou } S_{\alpha}=-S_{\alpha}' \end{aligned}2.
Quel loi suit T_n ?
On sait que X_i\sim P(1,\theta)
Donc \phi_X(t)=\frac{\theta}{\theta-it}
T_n=\sum_{i=1}^n Y_iDonc
\phi_{T_n}=(\phi_{Y_i}(t))^ncar les Y_i sont independants.
Donc:
- T_n\sim\Gamma(n, \theta_0) sous (H_0)
- T_n\sim\Gamma(n, \theta_1) sous (H_1)
On va calculer la densite de U_n
U_n=\theta T_n\\ \phi:]0;+\infty[\to]0;+\infty[\phi est derivable et bijective:
\phi^{-1}(x)=\frac{x}{\theta}\quad\text{et}\quad\phi'(x)=\theta\\ \begin{aligned} f_{U_n}(u)&=\frac{1}{\theta}\times\frac{1}{\Gamma(n)}\biggr(\frac{u}{\theta}\biggr)^{\alpha-1}\theta^{\alpha}e^{-\theta\frac{u}{\theta}} \end{aligned}Donc la loi de U_n ne depend pas de \theta
3.
Notons H_n la fonction de repartition de U_n.
\begin{aligned} \alpha&=P(\text{Rejeter }H_0\vert H_0\text{ vraie})\\ &= P(T_n\lt S_{\alpha}\vert H_0\text{ vraie})\\ &= P(\theta_0 T_n\le\theta_0 S_{\alpha}\vert\theta=\theta_0)\\ &= \color{red}{P}(U_n\lt\theta_0 S_{\alpha})\quad\color{red}{\text{Sous } H_0}\\ &= H_n(\theta_0S_{\alpha}) \end{aligned}\\ S_{\alpha}=\frac{H_n^{-1}(\alpha)}{\theta_0}Si x\lt y alors:
H_n(y)-H_n(x)=\int_x^y\frac{1}{\Gamma(n)}t^{\alpha-1}e^{-t}dt\gt0Donc (H_n) est strictement croissante sur [0;+\infty[
Par consequence, elle est strictement croissante