Lien de la note Hackmd
Fichier excel deja pret ou on devra mettre nom + prenom + uid. Format CSV fr, separation des champs avec ,
Jouons avec R
1
2
3
4
5
6
7
| UID<-20254 #UID de l'etudiant
X<-runif(1000) #Loi uniforme pour une variable X et on en prend mille
plot(X) #Affiche X
Z<-1:1000 #Vecteur Z
plot(Z)
alpha<-UID/23000
K<-UID/7500
|
Ces nombres sont differents pour tout le monde
1
2
3
4
5
| V<-K*X^alpha
W<-K*Z^alpha
sort(V) #Loi uniforme de V
sort(W) #Loi uniforme de W
|
Le vecteur W a ete construit par vous, il depend de votre numero. Vous devez etre capable de decrire W.
1
| boxplot(W) #Ne sera pa demande au partiel
|
1
| summary(W) #Decrit des valeurs utiles
|
1
2
| Min 1st Qu. Median Mean 3rd Qu. Max
2.7 350.1 643.5 630.1 919.1 1193.8
|
1
2
| sd(W) #Ecart type
var(W) #Variance
|
On aura la commande dans l’enonce.
1
| cor(V, W) #Correlation entre V et W
|
1
2
3
4
| K<-2.5
alpha<-2.1
W<-K*Y^alpha
summary(W)
|
Jouez avec mean
, sd
, boxplot
, summary
, var
, cov
, cor
.
1
2
3
| X<-1:100
Y<-X^2
plot(X, Y)
|
Le coefficient de correlation de X et Y au pif ? Plutot proche de 1 car la courbe ressemble a une droite. :snail:
Intervalle de confiance
On va s’interesser au poids d’un nouveau-ne. :snail:
- On en a pese 49
- On a trouve une moyenne de 3.6 Kgs
Je sais que l’ecart-type est de 0.5 Kg. Je souhaite avoir un intervalle de confiance a $95\%$ du poids moyen.
Derniere hypothese: le poids suit une loi normale.
Il y a 2 facons de faire:
- Rappeler le raisonnement
- Apprendre la formule du cours
Rappelons le raisonnement
En general “Observation = moyen + ecart = moyenne + k * ecart type” sauf qu’on doit faire une deduction sur la moyenne.
Estimation de moyenne de type moyenne observee +- k * ecart type. Quand on connait l’ecart type K depend de la distribution de la loi normale.
1
2
3
4
| x.barre<-3.6
sigma<-0.5
n<-49
|
Un intervalle de confiance a $95\%$, $\alpha = 5\%$, $\frac{\alpha}{2} = 2.5\%$ et $1-\frac{\alpha}{2} = 0.975$
On utilise qnorm
1
2
| mu.inferieur<-x.barre-u*sigma0/sqrt(n) #Formule du cours
mu.superieur<-x.barre+u*sigma0/sqrt(n)
|
L’intervalle de confiance a $95\%$ est $[3.46, 3.74]$.
On a mesure un ecart type de 0.53 Kgs. Quel est l’intervalle de confiance? On a mesure une moyenne de 3.6 Kgs et un ecart type de 0,53 Kgs sur 49 bebes.
1
| ecart<-v*0.53/sqrt(n-1)
|
1
2
| mu.inferieur<-x.barre-ecart
mu.superieur<-x.barre+ecart
|
Patients malades
Pour une maladie donnee, un traitement gueri $90\%$ des patients. J’ai fait un test avec 1000 patients et 850 sont gueris au bout de 2 semaines. :snail:
J’accepte le 90% sur cette base? Un test de chi2, dans le cours.
Ici : k=2 classes
- patients gueris, p1 = 0.9
- patients non gueris, p2 = 0.1
1
2
3
4
5
| n<-1000
N1<-850
N2<-150
p1<-0.9
p2<-0.1
|
1
2
| Z<-(N1-n*p1)^2/(n*p1) + (N2-n*p2)/(n*p2)
Z
|
La valeur de Z est trop grande, les ecarts de Z sont trop grands. En principe Z doit rester petit, on va refuser l’hypothese de guerison a $90\%$. :snail:
H0: la proba de guerison est de $90\%$, la proba de non guerison est $10\%$.
Regression lineaire
On veut appliquer ces formules
1
2
3
4
5
6
7
| mX<-mean(X)
mY<-mean(Y)
sX<-sd(X)
sY<-sd(Y)
rho<-cor(X, Y)
|
1
2
| beta<-rho*sY/sX
alpha<-mY-beta*mX
|
1
| points(X,PREV,col="red",pch=19,cex=0.8)
|
1
2
| var(PREV)
var(ECARTS)
|
1
| var(PREV) + var(ECARTS)
|
:snail: