Professional Documents
Culture Documents
Gratuitement sur :
www.coursdefsjes.com
Semestre : IV
Sections : A, B, C et D
RAPPELS STATISTIQUES
2 Adil ELMARHOUM
Echantillonnage et estimations
I. DEFINITION
Une variable alatoire X est une variable associe une exprience ou un groupe
d'expriences alatoires et servant caractriser le rsultat de cette exprience ou de ce
groupe d'expriences.
Une variable alatoire est discrte si elle varie de faon discontinue, la variable ne peut
prendre que des valeurs entires.
Exemple :
Soit X la variable alatoire qui caractrise le rsultat de l'exprience alatoire "jet d'un d
homogne".
X est une variable alatoire discrte, elle peut prendre les valeurs entires 1, 2, 3, 4, 5, et 6.
Soit X la variable alatoire qui caractrise le nombre de garons dans une famille de
quatre enfants.
X est une variable alatoire discrte, elle peut prendre les valeurs entires 0, 1, 2, 3, et 4.
chacune des valeurs x que peut prendre une variable alatoire X, correspond une probabilit
p(x), c'est la probabilit que la variable alatoire X prenne la valeur x :
p(x) = p(X = x)
Lensemble des valeurs admissibles x et des probabilits correspondantes p(x) constitue une
distribution de probabilit discontinue. La relation entre x et p(x) est appele loi de
probabilit.
Pour toutes les distributions de probabilits dont les valeurs x correspondent des vnements
complmentaires, le total des probabilits est gal 1.
p( x) 1
3 Adil ELMARHOUM
Echantillonnage et estimations
x
F (x) = p (X x) = p( x)
0 F(x) 1
Exemple :
Soit X la variable alatoire qui caractrise le rsultat de l'exprience alatoire "jet d'un d
homogne".
X est une variable alatoire discrte, elle peut prendre les valeurs entires 1, 2, 3, 4, 5, et 6
avec la probabilit constante 1/6.
Distribution de probabilit de X
x p(x) F(x)
1 1/6 1/6
2 1/6 2/6
3 1/6 3/6
4 1/6 4/6
5 1/6 5/6
6 1/6 6/6
Total 1
Exemple :
p ( X x) 0
La notion de distribution de probabilit n'a donc plus de sens dans le cas continu. Par contre la
fonction de rpartition conserve toute sa signification.
4 Adil ELMARHOUM
Echantillonnage et estimations
Pour une variable alatoire continue, on calcule la probabilit d'observer une valeur comprise
dans un intervalle donn [x ; x+x].
lim p( x X x x) lim F ( x x) F ( x)
x 0 x 0
F ( x x ) F ( x ) F dF
lim
x 0 x
lim x dx F ' ( x) f ( x)
x 0
La fonction f(x), drive de la fonction de rpartition F(x), est appele fonction de densit de
probabilit.
L'ensemble des valeurs admissibles pour une variable alatoire continue et la fonction de
densit de probabilit correspondante dfinissent une distribution de probabilit thorique
continue.
Le produit f(x)dx est appel lment de probabilit, c'est l'quivalent de la probabilit p(x)
pour une variable alatoire discontinue.
Pour une variable alatoire continue, le cumul de la fonction de densit de probabilit est gal
1:
f ( x)dx 1
x
F(x) = f ( x)dx
b
P(a X b) = F(b) - F(a) = f ( x)dx
a
Exemple :
Soit une variable alatoire continue X dfinie par la fonction de densit de probabilit :
k si 0 x 1
f ( x)
0 sinon
5 Adil ELMARHOUM
Echantillonnage et estimations
f ( x)dx 1
1
k dx 1
0
1
kx ] 0
1
k 1
1 si 0 x 1
f (x)
0 sinon
Si x < 0 :
x 0
F(x) = f ( x )dx 0 dx 0
Si 0 x 1 :
x 0 x
F(x) = f ( x )dx
0 dx 1 dx x
0
Si x > 1 :
x 0 1 x
F(x) = f ( x )dx
0 dx 1 dx 0 dx 1
0 1
0 si x 0
F (x) x si 0 x 1
1 si x 1
6 Adil ELMARHOUM
Echantillonnage et estimations
I. ESPERANCE MATHEMATIQUE
1.1. Dfinition
On appelle esprance mathmatique la valeur moyenne de la variable, elle remplace la
moyenne arithmtique dans le cas d'une variable statistique.
Cas discret : E( X ) x p( x)
Cas continu : E( X ) x f ( x)dx
Exemple :
Soit X la variable alatoire qui caractrise le nombre de garons dans une famille de
quatre enfants.
Distribution de probabilit de X
x p(x) F(x)
0 0,0625 0,0625
1 0,2500 0,3125
2 0,3750 0,6875
3 0,2500 0,9375
4 0,0625 1
Total 1
Dans une famille de quatre enfants on doit s'attendre avoir deux garons.
Exemple :
Soit une variable alatoire continue X dfinie par la fonction de densit de probabilit :
1 si 0 x 1
f (x)
0 sinon
1
1
x 1
E ( X ) x dx ]
0 2 2 0
7 Adil ELMARHOUM
Echantillonnage et estimations
1.2. Proprits
Cas discret : E ( g ( X )) g ( x) p ( x )
Cas continu : E ( g ( X )) g ( x) f ( x)dx
Exemple :
Cas discret : E ( X ) x p( x)
Cas continu : E ( X ) x f ( x )dx
L'esprance d'un produit est le produit des esprances si les variables sont indpendantes :
8 Adil ELMARHOUM
Echantillonnage et estimations
V (X )
La variance est donc gale la diffrence entre l'esprance mathmatique des carrs et le
carr de l'esprance mathmatique.
Exemple :
Soit X la variable alatoire qui caractrise le nombre de garons dans une famille de
quatre enfants.
Distribution de probabilit de X
x p(x) F(x)
0 0,0625 0,0625
1 0,2500 0,3125
2 0,3750 0,6875
3 0,2500 0,9375
4 0,0625 1
Total 1
1 1
9 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
Soit une variable alatoire continue X dfinie par la fonction de densit de probabilit :
1 si 0 x 1
f (x)
0 sinon
1
1
x 1
E ( X ) x dx ] 2
0 2 0
1
1
x3 1
E ( X ) x dx ]
0 3 3 0
1 1 1
V ( X ) E ( X ) E ( X )
3 4 12
1
12
2.2. Proprits
V (aX b) E[ a ( X E ( X ))]
V (aX b) a V ( X )
La variance d'une somme est la somme des variances si les variables sont indpendantes :
10 Adil ELMARHOUM
Echantillonnage et estimations
La variance d'une diffrence est la somme des variances si les variables sont
indpendantes :
Une variable alatoire est dite centre si son esprance mathmatique est nulle, elle est dite
rduite si son cart-type est gal 1.
Toute variable alatoire peut tre transforme en une variable centre rduite par le
X E( X )
changement de variable .
0, lim P( X n a ) = 0
n
Ceci signifie que lcart entre le paramtre calcul partir de lchantillon et la vraie valeur
du paramtre de la population est trs faible quand la taille de lchantillon est grande. Cet
cart peut tre mesur par la variance. Ainsi on parle de convergence en probabilit si :
limV(X n) = 0
n
11 Adil ELMARHOUM
Echantillonnage et estimations
Exemple 1 :
Soit Xn une variable alatoire qui dsigne le nombre de succs obtenus lors de n prlvements
dans une population finie de taille N et dont la proportion de succs est p.
Xn
Dsignons par Fn la frquence relative (pourcentage) des succs.
n
On sait que :
E(Xn) = n p et V(Xn) = N n n p q
N 1
On dmontre :
E( Fn ) = E( X n ) = 1 E( X n ) = 1 n p = p
n n n
pq
V( Fn ) = V( X n ) = 1 V( X n ) = 1 N n n p q = N n
n n n N 1 N 1 n
lim V ( Fn ) = 0
n
On sait que :
E(Xn) = n p et V(Xn) = n p q
On dmontre :
E( Fn ) = E( X n ) = 1 E( X n ) = 1 n p = p
n n n
pq
V( Fn ) = V( X n ) = 1 V( X n ) = 1 n p q =
n n n n
lim V ( Fn ) = 0
n
12 Adil ELMARHOUM
Echantillonnage et estimations
Exemple 2 :
E(Xi) = m et V(Xi) =
Xi
Dsignons par : X n i 1 la moyenne calcule partir dun chantillon de taille n.
n
On dmontre :
n
Xi n
E( X n ) = E( i 1
) = 1 E(Xi) = 1 nm = m
n n i 1 n
Xi n
V( X n ) = V( i 1
) = 1 V(Xi) = 1 n N n = N n
n n i 1 n N 1 N 1 n
limV(X n) = 0
n
Xi
La moyenne X n i 1 calcule partir dun chantillon de taille n converge en probabilit
n
vers m.
On dmontre :
n
Xi n
E( X n ) = E( i 1
) = 1 E(Xi) = 1 nm = m
n n i 1 n
Xi n
V( X n ) = V( i 1
) = 1 V(Xi) = 1 n =
n n i 1 n n
limV(X n) = 0
n
Xi
La moyenne X n i 1 calcule partir dun chantillon de taille n converge en probabilit
n
vers m.
13 Adil ELMARHOUM
Echantillonnage et estimations
Quelle que soit la variable alatoire X, la probabilit d'un intervalle [E(X)-k , E(X)+k] a
1
pour borne infrieure 1 .
k
1
P(E(X)-k < X < E(X)+k) 1
k
Si on pose k = lingalit peut tre crite :
V(X) V(X)
P(E(X)- < X < E(X)+ ) 1 ou P( X E(X) < ) 1
Demonstration :
V (X ) ( x E( X )) p( x)
On peut dcomposer la variance en trois sommes :
V ( X ) S1 S 2 S 3
avec :
V ( X ) S1 S 2 S 3
V ( X ) S1 S 3
x - E(X) < - k
(x - E(X)) > k
( x E ( X )) p ( x) k p ( x)
1 1
S1 k p ( x)
1
14 Adil ELMARHOUM
Echantillonnage et estimations
x - E(X) > k
(x - E(X)) > k
( x E ( X )) p ( x) k p ( x)
3 3
S 3 k p ( x)
3
V ( X ) S1 S 3
V ( X ) k p ( x) k p ( x)
1 3
V ( X ) k ( p ( x) p ( x))
1 3
p ( x ) p ( x) 1 p
1 3 2 ( x)
On note : p 2 ( x) p
p 2 ( x) p( E ( X ) k X E ( X ) k )
Or V ( X )
On a donc :
k (1 p)
1 k (1 p)
1
1 p
k
1
p 1
k
15 Adil ELMARHOUM
Echantillonnage et estimations
1
p ( E ( X ) k X E ( X ) k ) 1
k
ou encore :
V(X) V(X)
P(E(X)- < X < E(X)+ ) 1 ou P( X E(X) < ) 1
Xi
moyenne X n i 1 on obtient :
n
pq
P( f n p < ) 1 et P( X m < ) 1
n n
16 Adil ELMARHOUM
Echantillonnage et estimations
I. INTRODUCTION
Le but des lois thoriques est la description des phnomnes statistiques dont le but de
calculer la probabilit de certains vnements et donc d'avoir une certaine reprsentation de
l'avenir.
Nous tudierons au cours de ce chapitre les lois de probabilits les plus courantes qui vont
nous permettre la description d'un phnomne alatoire dtermin. Nous prsenterons ainsi la
loi de Bernoulli, la loi binomiale, la loi hypergomtrique, et la loi de poisson.
q=1-p
La variable alatoire X qui caractrise le nombre de succs au cours d'une seule exprience
alatoire est appele variable de Bernoulli, elle prend les valeurs entires 0 et 1 avec les
probabilits respectives q et p.
x p(x)
0 q
1 P
Total 1
Esprance mathmatique
E(X) = xp( x) 0 q 1 p p
Variance
E(X) = x p( x) 0 q 1 p p
V(X) = E(X) - E(X) = p - p = p (1 - p) = pq
17 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
On lance une pice de monnaie une seule fois. Soit X la variable alatoire qui caractrise le
nombre de piles obtenues. X est une variable de Bernoulli, elle prend les valeurs entires 0 et
1 avec la probabilit constante 0,5.
Loi de probabilit de X
x p(x)
0 0,5
1 0,5
Total 1
x
p( x) C n
p x q nx
X = B(n , p)
18 Adil ELMARHOUM
Echantillonnage et estimations
La variable Bernoulli est un cas particulier de la loi binomiale, elle correspond la loi
binomiale de paramtres 1 et p.
Une variable binomiale de paramtres n et p, peut tre considre comme tant la somme de n
variables de Bernoulli identiques et indpendantes de mme paramtre p.
X = B(n , p)
X = X1 + X2 + + Xn
E(Xi) = p et V(Xi) = pq
Esprance mathmatique
E(X) = p + p + + p
E(X) = np
Variance et cart-type
V(X) = pq + pq + + pq
V(X) = npq
Exemple :
19 Adil ELMARHOUM
Echantillonnage et estimations
On dfinit la variable alatoire X comme tant le nombre de pices dfectueuses qu'on peut
obtenir dans l'chantillon. La variable X peut prendre les valeurs entires de 0 20.
La population des pices peut tre considre comme une population pratiquement infinie. La
probabilit de succs, c'est dire la probabilit qu'une pice choisie soit dfectueuse, est
constante et gale 0,1. La variable alatoire X suit donc une loi binomiale de paramtre 20 et
0,1.
X = B(20 ; 0,1)
0 1 2
p ( X 2) 1 C 20
0,10 0,9 20 C 20
0,11 0,919 C 20
0,12 0,918
L'esprance mathmatique :
La variance :
3.3. Proprits
Additivit
X1 + X2 + + Xk = B(n1 + n2 + + nk , p)
Formule de rcurrence
p ( n x)
p ( x 1) p( x)
q ( x 1)
20 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
x p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
Total 1
La probabilit de succs varie d'une exprience alatoire l'autre. C'est le cas des
prlvements d'individus au hasard dans une population finie, lorsque les individus ne sont
pas remis en place au fur et mesure des prlvements.
Dsignons par N l'effectif total de la population dans laquelle on prlve au hasard et sans
remise n individus. La population est compose d'individus qui possdent le caractre tudi,
le nombre de ces individus sera dsign par n1 . n2 dsigne le nombre d'individus de la
population qui ne possdent pas le caractre tudi.
N = n1 + n2
x nx
p( x)
C C
n1 n2
n
C N
21 Adil ELMARHOUM
Echantillonnage et estimations
Une variable alatoire X qui sui une loi hypergomtrique de paramtres N, n1, et n est
dsigne par :
X = H(N, n1 , n)
n1
p
N
La proportion des individus de la population qui ne possdent pas le caractre tudi est :
n2
q
N
Exemple :
Dans une population de 40 personnes, dont 6 personnes sont originaires du Sud, 14 du Nord,
12 de l'Est et 8 de l'Ouest, on choisit au hasard un chantillon de 4 personnes.
La population tant finie et les prlvements s'effectuent sans remise, la variable X suit donc
une loi hypergomtrique de paramtres :
X = H(40, 14, 4)
22 Adil ELMARHOUM
Echantillonnage et estimations
0 4
p (0)
C C14 26
0,1636
4
C 40
1 3
p (1)
C C14 26
0,3983
4
C 40
2 2
p ( 2)
C C
14 26
0,3236
4
C 40
3 1
p (3)
C C14 26
0,1036
4
C 40
4 0
p ( 4)
C C
14 26
0,0110
4
C 40
Distribution de probabilit de X
x p(x)
0 0,1636
1 0,3983
2 0,3236
3 0,1036
4 0,0110
Total 1
14
p 0,35
40
La proportion des individus de la population qui ne sont pas originaires du Nord est :
26
q 0,65
40
n
0,05 ou N 20 n
N
Exemple :
x 4 x
p( x)
C C 30 70
4
C 100
x p(x)
0 0,2338
1 0,4188
2 0,2679
3 0,0725
4 0,0070
Total 1
La distribution de cette variable peut tre calcule l'aide de l'approximation par la loi
binomiale de paramtres 4 et 0,3. Les probabilits approximatives sont telle que, pour x = 0,
1, 2, 3, 4 :
x
p( x) C 4
0,3 x 0,7 4 x
V. LOI DE POISSON
5.1. Dfinition
La loi de poisson intervient pour des phnomnes statistiques dont le nombre de ralisation
varie de 0 l'infini et dont la frquence moyenne de ralisation est connue.
Exemple :
em m x
p( x)
x!
Une variable alatoire X qui suit une loi de poisson de paramtre m est dsigne par :
X = P(m)
Exemple :
Un port a les moyens techniques de recevoir au maximum 4 bateaux ptroliers par jour. Le
reste est envoy vers un autre port. Quelle est la probabilit qu'un jour donn, le port ne puisse
recevoir tous les bateaux qui se prsentent, si on sait qu'en moyenne 3 bateaux se prsentent
par jour.
Dsignons par la variable alatoire X, le nombre de bateaux qui se prsentent un jour donn.
X suit une loi de poisson de paramtre 3.
X = P(3)
25 Adil ELMARHOUM
Echantillonnage et estimations
La probabilit qu'un jour donn, le port ne puisse recevoir tous les bateaux qui se prsentent
est :
e 3 3 0 e 3 31 e 3 3 2 e 3 33 e 3 3 4
p ( X 4) 1
0! 1! 2! 3! 4!
On peut dmontrer que l'esprance mathmatique d'une variable de poisson est gale sa
variance est gale au paramtre m :
E(X) = V(X) = m
X1 + X2 + + Xk = P(m1 + m2 + + mk)
m
p ( x 1) p ( x )
x 1
Exemple :
X = P(3)
e 3 3 x
p( x)
x!
26 Adil ELMARHOUM
Echantillonnage et estimations
Les probabilits p(x) peuvent tre calcules par rcurrence de la manire suivante :
3
p (1) 0,0498 0,1494
1
3
p (2) 0,1494 0,2240
2
3
p (3) 0, 2240 0,2240
3
3
p (4) 0, 2240 0,1680
4
Exemple :
Une machine fabrique des ampoules avec une proportion d'ampoules dfectueuses de 5 %.
Pour contrler la qualit des ampoules, on a prlev au hasard, dans un lot important
d'ampoules, un chantillon de 20 ampoules.
Quelle est la probabilit que sur les 20 ampoules prleves, on ait plus d'une ampoule
dfectueuse ?
La population des ampoules peut tre considre comme une population pratiquement infinie.
La probabilit de succs, c'est dire la probabilit qu'une ampoule choisie soit dfectueuse,
est constante et gale 0,05. La variable alatoire X suit donc une loi binomiale de paramtre
20 et 0,05.
X = B(20 ; 0,05)
27 Adil ELMARHOUM
Echantillonnage et estimations
0 1
p ( X 1) 1 C 20
0,05 0 0,95 20 C 20
0,051 0,9519
La probabilit d'avoir plus d'une ampoule dfectueuse dans l'chantillon peut tre calcule de
faon approximative l'aide de la loi de poisson de paramtre 200,05 = 1, puisque la
probabilit p est infrieure 0,1 (0,05) et le produit np est infrieur 5 (200,05 = 1) :
e 1 10 e 1 11
p ( X 1) 1
0! 1!
28 Adil ELMARHOUM
Echantillonnage et estimations
I. INTRODUCTION
Le but des lois thoriques est la description des phnomnes statistiques. Nous tudierons au
cours de ce chapitre les lois de probabilits continues les plus courantes. Nous prsenterons
ainsi la loi Normale dont le principal but est de calculer la probabilit de certains vnements
et donc d'avoir une certaine reprsentation des phnomnes. La loi Khi deux de Pearson, la loi
de Student et la loi de Fisher qui ont un rle trs important dans les problmes d'estimation et
les tests d'hypothses.
La loi normale est la loi continue la plus importante et la plus utilise dans le calcul de
probabilit. Elle est aussi appele loi de LAPLACE GAUSS1.
On appelle variable normale toute variable alatoire continue X dfinie dans l'intervalle
, par la fonction de densit de probabilit suivante :
1 xm
1 (
2
)
f ( x) e
2
f ( x)dx 1
La loi normale dpend de deux paramtres m et . Une variable alatoire X qui suit une loi
normale de paramtres m et est dsigne par :
X = N(m , )
Z = N(0 , 1)
1
Laplace, Pierre Simon (1749-1827)
29 Adil ELMARHOUM
Echantillonnage et estimations
Une variable normale rduite est dfinie par la fonction de densit de probabilit suivante :
f(z) 1 e z2
2
Toute variable normale X de paramtres m et peut tre transforme en une variable normale
rduite par le changement de variable suivant :
Z X m
En particulier la loi normale rduite est symtrique par rapport l'axe des abscisses et
1
caractrise par l'existence d'un maximum en z = 0 et f(z) = 0,40 .
2
La fonction de rpartition correspond l'aire comprise entre cette courbe et l'axe des
abscisses.
30 Adil ELMARHOUM
Echantillonnage et estimations
Cette table donne les valeurs de la fonction de rpartition (z) pour des valeurs positives z
d'une variable normale rduite. En raison de la symtrie de f(z), on peut dduire les valeurs
(z) pour les valeurs ngatives de z :
(-z) = 1 - (z)
F(x) = (z)
Pour lire une valeur (z) dans la table, il suffit de lire l'intersection entre la ligne
correspondante la valeur de z et la colonne correspondante au deuxime chiffre aprs la
virgule de z.
31 Adil ELMARHOUM
Echantillonnage et estimations
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 05359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 05753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 06141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 06517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 06879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 07224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 07549
0,7 0,7580 0,7611 0,7642 0,7673 0,7703 0,7734 0,7764 0,7794 0,7823 07852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 08133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 08389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 08621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 08830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 090147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981 0,99982 0,99983 0,99983
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99992
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
Exemple :
32 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
Pour qu'une pice fabrique par une machine soit utilisable, sa longueur doit tre comprise
entre 14,7 et 15,3 cm, sinon elle est rejete. Sachant que la longueur de cette pice est une
variable normale de paramtres 15 cm et 0,2 cm, quelle proportion de pices peuvent tre
rejetes.
Si on dsigne par la variable X la longueur des pices, X suit une loi normale :
X = N(15 ; 0,2)
p(rejet) = 1 p(accepter)
15,315 14,715
p(accepter) = p( X 15 ) - p( X 15 )
0,2 0,2 0,2 0,2
Chaque pice a une probabilit de 0,13362 d'tre rejete ou il y a un risque de rejet de 13%
des pices fabriques.
Soient X1, X2, ,Xn n variables normales de paramtres respectivement m1, m2, , mn et 1,
2, ,n.
X 1 X 2 X n N (m1 m 2 mn , 1 2 n )
Exemple :
Pour se rendre son travail un ouvrier prend deux bus. La dure du trajet du premier bus est
une variable normale de paramtres 27 minutes et 5 minutes. La dure du trajet du deuxime
bus est une variable normale de paramtres 30 minutes et 2 minutes. Quelle est la probabilit
que cet ouvrier n'arrive pas en retard s'il dispose d'une heure ?
33 Adil ELMARHOUM
Echantillonnage et estimations
La variable X est la somme de deux variables normales indpendantes, elle suit donc une loi
normale :
Pour ne pas arriver en retard la dure totale des deux trajets ne doit pas dpasser 60 minutes.
p(X 60)(0,56)0,7123
Quelles que soient les variables alatoires indpendantes X1, X2, , Xn de moyennes
respectivement m1, m2, , mn et d'carts type respectivement 1, 2, , n. La somme de ces
variables tend suivre une loi normale de moyenne la somme des moyennes et d'cart type la
racine carre de la somme des variances des variables initiales.
X1 X 2 X n N(m1 m2 mn, 1 2 n)
Exemple :
Une caisse d'assurance maladie reoit 120 personnes pour l'obtention de remboursements. On
suppose que la somme rembourser chaque personne est une variable alatoire de moyenne
1000 dirhams et d'cart type 600 dirhams. La caisse dispose de 130000 dirhams. Quelle est le
risque que cette somme ne soit pas suffisante pour rembourser toutes les personnes ?
X = X1 + X2 + + X120
D'aprs le thorme central limite, on peut affirmer que X suit une loi normale de moyenne la
somme des moyennes et d'cart type la racine carre de la somme des variances.
34 Adil ELMARHOUM
Echantillonnage et estimations
La somme de 130000 dh ne sera pas suffisante si la somme totale rembourser aux 120
personnes dpasse 130000 dh :
Il y a donc un risque de 6,5 % que la somme de 130000 dirhams ne soit pas suffisante
pour rembourser toutes les personnes.
La recherche de ces probabilits est souvent longue, car il faut dterminer individuellement et
d'additionner les diffrentes probabilits p(X = x).
Lorsque le paramtre n de la loi binomiale est grand et les probabilits de succs p et d'chec
q ne sont pas trop petites, on peut effectuer ce calcul d'une manire approche l'aide de la loi
normale de paramtres np et npq .
Pour amliorer la qualit de l'approximation de la loi binomiale, qui est discrte, par la loi
normale, qui est continue, on introduit gnralement une correction de continuit de 0,5. Les
diffrentes probabilits deviennent :
Exemple :
On suppose que la probabilit qu'un tudiant russisse un examen est de 0,8. Quelle est la
probabilit qu'au moins 75 tudiants parmi 100 tudiants russissent l'examen ?
35 Adil ELMARHOUM
Echantillonnage et estimations
X est une variable discrte qui prend les valeurs entires de 0 100. Elle suit une loi
binomiale de paramtres 100 et 0,8.
X = B(100 ; 0,8)
La probabilit qu'au moins 75 tudiants parmi 100 tudiants russissent l'examen est :
p(X 75)
Les produits np et nq sont respectivement 1000,8 = 80 et 1000,2 = 20, ils sont suprieurs
5. On peut donc effectuer le calcul de cette probabilit d'une manire approche l'aide de la
loi normale de paramtres np = 80 et npq = 4.
75,580
p(X 75,5)1 p( X 80 )1 p(Z 1,13)
4 4
La probabilit qu'au moins 75 tudiants parmi 100 tudiants russissent l'examen est peu
prs 0,8708.
Le calcul exact partir de la loi binomiale donne un rsultat de 0,8686. On constate que
l'approximation est trs satisfaisante.
36 Adil ELMARHOUM
Echantillonnage et estimations
Cet ensemble de lois de rpartition est particulirement utile dans les problmes
destimations et les tests statistiques.
3.1.1. Dfinition
On appelle variable Khi deux de Pearson, la variable qui varie entre 0 et + et dfinie par
la fonction de densit de probabilit :
k x
1
f ( x) c x 2 e 2
Le paramtre k est une constante entire positive appele nombre de degrs de libert, on dit
variable Khi carr k degr de libert, dsigne par k dl.
c est une constante telle que : f ( x)dx 1
0
La variable Khi deux de Pearson correspond aussi la somme des carrs de k variables
normales rduites indpendantes.
k dl = Z1 + Z2 + + Zk
Variance : V( k dl) = 2 k
La somme de deux ou plusieurs variables Khi carr indpendantes est une variable Khi carre.
k1 dl + k2 dl + + kn dl = (k1+k2++kn) dl
Une variable Khi carr k degr de libert peut donc tre considre comme tant la somme
37 Adil ELMARHOUM
Echantillonnage et estimations
La table de la loi Khi carr dpend du paramtre k, elle donne les valeurs de k dl pour les
valeurs de la fonction de rpartition F( k dl).
38 Adil ELMARHOUM
Echantillonnage et estimations
k/p 0,0005 0,001 0,005 0,01 0,025 0,05 0,1 0,2 0,3 0,4
1 0,06393 0,05157 0,04393 0,03157 0,03982 0,02393 0,0158 0,0642 0,148 0,275
2 0,02100 0,02200 0,0100 0,0201 0,0506 0,103 0,211 0,446 0,713 1,02
3 0,0153 0,0243 0,0717 0,115 0,216 0,352 0,584 1,00 1,42 1,87
4 0,0639 0,0908 0,207 0,297 0,484 0,711 1,06 1,65 2,19 2,75
5 0,158 0,210 0,412 0,554 0,831 1,15 1,61 2,34 3,00 3,66
6 0,299 0,381 0,676 0,872 1,24 1,64 2,20 3,07 3,83 4,57
7 0,485 0,598 0,989 1,24 1,69 2,17 2,83 3,82 4,67 5,49
8 0,710 0,857 1,34 1,65 2,18 2,73 3,49 4,59 5,53 6,42
9 0,972 1,15 1,73 2,09 2,70 3,33 4,17 5,38 6,39 7,36
10 1,26 1,48 2,16 2,56 3,25 3,94 4,87 6,18 7,27 8,30
11 1,59 1,83 2,60 3,05 3,82 4,57 5,58 6,99 8,15 9,24
12 1,93 2,21 3,07 3,57 4,40 5,23 6,30 7,81 9,03 10,2
13 2,31 2,62 3,57 4,11 5,01 5,89 7,04 8,63 9,93 11,1
14 2,70 3,04 4,07 4,66 5,63 6,57 7,79 9,47 10,8 12,1
15 3,11 3,48 4,60 5,23 6,26 7,26 8,55 10,3 11,7 13,0
16 3,54 3,94 5,14 5,81 6,91 7,96 9,31 11,2 12,6 14,0
17 3,98 4,42 5,70 6,41 7,56 8,67 10,1 12,0 13,5 14,9
18 4,44 4,90 6,26 7,01 8,23 9,39 10,9 12,9 14,4 15,9
19 4,91 5,41 6,84 7,63 8,91 10,1 11,7 13,7 15,4 16,9
20 5,40 5,92 7,43 8,26 9,59 10,9 12,4 14,6 16,3 17,8
21 5,90 6,45 8,03 8,90 10,3 11,6 13,2 15,4 17,2 18,8
22 6,40 6,98 8,64 9,54 11,0 12,3 14,0 16,3 18,1 19,7
23 6,92 7,53 9,26 10,2 11,7 13,1 14,8 17,2 19,0 20,7
24 7,45 8,08 9,89 10,9 12,4 13,8 15,7 18,1 19,9 21,7
25 7,99 8,65 10,5 11,5 13,1 14,6 16,5 18,9 20,9 22,6
26 8,54 9,22 11,2 12,2 13,8 15,4 17,3 19,8 21,8 23,6
27 9,09 9,80 11,8 12,9 14,6 16,2 18,1 20,7 22,7 24,5
28 9,66 10,4 12,5 13,6 15,3 16,9 18,9 21,6 23,6 25,5
29 10,2 11,0 13,1 14,3 16,0 17,7 19,8 22,5 24,6 26,5
30 10,8 11,6 13,8 15,0 16,8 18,5 20,6 23,4 25,5 27,4
39 Adil ELMARHOUM
Echantillonnage et estimations
k/p 0,5 0,6 0,7 0,8 0,9 0,95 0,975 0,99 0,995 0,999 0,9995
1 0,455 0,708 1,07 1,64 2,71 3,84 5,02 6,63 7,88 10,8 12,1
2 1,39 1,83 2,41 3,22 4,61 5,99 7,38 9,21 10,6 13,8 15,2
3 2,37 2,95 3,67 4,64 6,25 7,81 9,35 11,3 12,8 16,3 17,7
4 3,36 4,04 4,88 5,99 7,78 9,49 11,1 13,3 14,9 18,5 20,0
5 4,35 5,13 6,06 7,29 9,24 11,1 12,8 15,1 16,7 20,5 22,1
6 5,35 6,21 7,23 8,56 10,6 12,6 14,4 16,8 18,5 22,5 24,1
7 6,35 7,28 8,38 9,80 12,0 14,1 16,0 18,5 20,3 24,3 26,0
8 7,34 8,35 9,52 11,0 13,4 15,5 17,5 20,1 22,0 26,1 27,9
9 8,34 9,41 10,7 12,2 14,7 16,9 19,0 21,7 23,6 27,9 29,7
10 9,34 10,5 11,8 13,4 16,0 18,3 20,5 23,2 25,2 29,6 31,4
11 10,3 11,5 12,9 14,6 17,3 19,7 21,9 24,7 26,8 31,3 33,1
12 11,3 12,6 14,0 15,8 18,5 21,0 23,3 26,2 28,3 32,9 34,8
13 12,3 13,6 15,1 17,0 19,8 22,4 24,7 27,7 29,8 34,5 36,5
14 13,3 14,7 16,2 18,2 21,1 23,7 26,1 29,1 31,3 36,1 38,1
15 14,3 15,7 17,3 19,3 22,3 25,0 27,5 30,6 32,8 37,7 39,7
16 15,3 16,8 18,4 20,5 23,5 26,3 28,8 32,0 34,3 39,3 41,3
17 16,3 17,8 19,5 21,6 24,8 27,6 30,2 33,4 35,7 40,8 42,9
18 17,3 18,9 20,6 22,8 26,0 28,9 31,5 34,8 37,2 42,3 44,4
19 18,3 19,9 21,7 23,9 27,2 30,1 32,9 36,2 38,6 43,8 46,0
20 19,3 21,0 22,8 25,0 28,4 31,4 34,2 37,6 40,0 45,3 47,5
21 20,3 22,0 23,9 26,2 29,6 32,7 35,5 38,9 41,4 46,8 49,0
22 21,3 23,0 24,9 27,3 30,8 33,9 36,8 40,3 42,8 48,3 50,5
23 22,3 24,1 26,0 28,4 32,0 35,2 38,1 41,6 44,2 49,7 52,0
24 23,3 25,1 27,1 29,6 33,2 36,4 39,4 43,0 45,6 51,2 53,5
25 24,3 26,1 28,2 30,7 34,4 37,7 40,6 44,3 46,9 52,6 54,9
26 25,3 27,2 29,2 31,8 35,6 38,9 41,9 45,6 48,3 54,1 56,4
27 26,3 28,2 30,3 32,9 36,7 40,1 43,2 47,0 49,6 55,5 57,9
28 27,3 29,2 31,4 34,0 37,9 41,3 44,5 48,3 51,0 56,9 59,3
29 28,3 30,3 32,5 35,1 39,1 42,6 45,7 49,6 52,3 58,3 60,7
30 29,3 31,3 33,5 36,3 40,3 43,8 47,0 50,9 53,7 59,7 62,2
Pour lire une valeur k dl dans la table, il suffit de lire l'intersection entre la colonne
correspondante la valeur de la probabilit cumule F( k dl) et la ligne correspondante aux
degrs de libert k.
Exemple :
0,95 10 dl = 18,3
0,05 20 dl = 10,9
40 Adil ELMARHOUM
Echantillonnage et estimations
Une variable Khi carr k degrs de libert peut donc tre considre comme tant la somme
de k variables Khi carr 1 degr de libert indpendantes.
De ce fait, et par application du thorme central limite, on peut affirmer que la loi Khi deux
tend vers une loi normale de paramtres k et 2k . Ce qui permet de rsoudre les problmes
relatifs aux distributions de nombre de degrs de libert k lev. Toutefois, la convergence
vers la loi normale est relativement lente, l'approximation est gnralement satisfaisante
lorsque k est suprieur 100. pour un nombre de degr de libert compris entre 30 et 100, on
prfre faire usage de la racine carre. On peut en effet dmonter que la transformation :
Z = 2 2k 1
est trs proche de la loi normale centre rduite. On peut aussi utiliser la transformation
inverse :
(Z 2k 1)
2
Exemple 1 :
0,95 30 dl = 43,8
(Z0.95 2301)
2
La lecture de la table de la fonction de rpartition de la loi normale rduite montre que la
valeur de z pour F(z) = 0,95 est gale 1,65.
(1.65 59)
43.8
2
41 Adil ELMARHOUM
Echantillonnage et estimations
Exemple 2 :
La valeur de 0,95 150 dl ne se trouve pas dans la table statistique. Le nombre de degrs de
libert tant trs grand, on peut utiliser lapproximation par la loi normale de moyenne 150 et
dcart type 2150 17,32 .
0,95150dl 150
= Z0,95
17,32
do :
3.2.1. Dfinition
On appelle variable t de Student, la variable t qui varie entre - et + et dfinie par la
fonction de densit de probabilit :
k 1
t 2
f (t ) c (1 )
k
Le paramtre k est une constante entire positive appele nombre de degrs de libert, on dit
variable t k degr de libert, dsigne par t k dl.
c est une constante telle que : f (t )dt 1
La variable t de Student correspond aussi au quotient dune variable normale rduite par la
racine carre d'une variable k dl indpendante de la premire variable.
Soient Z une variable normale rduite et k dl une variable Khi carr k degrs de libert,
indpendantes. On peut dmontrer :
tkdl Z
kdl
k
42 Adil ELMARHOUM
Echantillonnage et estimations
La table de la loi t de Student dpend du paramtre k, elle donne les valeurs de t k dl pour les
valeurs de la fonction de rpartition F(t k dl).
43 Adil ELMARHOUM
Echantillonnage et estimations
k/p 0,6 0,7 0,8 0,9 0,95 0,975 0,99 0,995 0,999 0,9995
1 0,325 0,727 1,376 3,078 6,314 12,71 31,82 63,66 318,3 636,6
2 0,289 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,33 31,60
3 0,277 0,584 0,978 1,638 2,353 3,182 4,541 5,841 10,22 12,94
4 0,271 0,569 0,941 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 0,267 0,559 0,920 1,476 2,015 2,571 3,365 4,032 5,893 6,859
6 0,265 0,553 0,906 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 0,263 0,549 0,896 1,415 1,895 2,365 2,998 3,499 4,785 5,405
8 0,262 0,546 0,889 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 0,261 0,543 0,883 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 0,260 0,542 0,879 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 0,260 0,540 0,876 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 0,259 0,539 0,873 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 0,259 0,538 0,870 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 0,258 0,537 0,868 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 0,258 0,536 0,866 1,341 1,753 2,131 2,602 2,947 3,733 4,073
16 0,258 0,535 0,865 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 0,257 0,534 0,863 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 0,257 0,534 0,862 1,330 1,734 2,101 2,552 2,878 3,611 3,922
19 0,257 0,533 0,861 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 0,257 0,533 0,860 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 0,257 0,532 0,859 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 0,256 0,532 0,858 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 0,256 0,532 0,858 1,319 1,714 2,069 2,500 2,807 3,485 3,767
24 0,256 0,531 0,857 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 0,256 0,531 0,856 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 0,256 0,531 0,856 1,315 1,706 2,056 2,479 2,779 3,435 3,707
27 0,256 0,531 0,855 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 0,256 0,530 0,855 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 0,256 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,659
30 0,256 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646
40 0,255 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551
60 0,254 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460
80 0,254 0,527 0,846 1,292 1,664 1,990 2,374 2,639 3,195 3,415
100 0,254 0,526 0,845 1,290 1,660 1,984 2,365 2,626 3,174 3,389
200 0,254 0,525 0,843 1,286 1,653 1,972 2,345 2,601 3,131 3,339
500 0,253 0,525 0,842 1,283 1,648 1,965 2,334 2,586 3,106 3,310
0,253 0,524 0,842 1,282 1,645 1,960 2,326 2,576 3,090 3,291
Pour lire une valeur tkdl dans la table, il suffit de lire l'intersection entre la colonne
correspondante la valeur de la probabilit cumule F(t k dl) et la ligne correspondante aux
degrs de libert k.
Exemple :
t 0,95 10 dl = 1,812
t 0,7 20 dl = 0,533
44 Adil ELMARHOUM
Echantillonnage et estimations
Lorsque le nombre de degrs de libert k est trs lev, la loi t de Student peut tre
directement assimile la loi normale rduite sans effectuer aucun changement de variable.
Ce qui permet de rsoudre les problmes relatifs aux distributions t de nombre de degrs de
libert lev. L'approximation est gnralement satisfaisante lorsque k est suprieur 30.
Exemple :
En utilisant l'approximation de la loi t par la loi normale rduite, on peut lire dans la table de
la fonction de rpartition de la loi normale rduite la valeur de z pour F(z) = 0,95 qui est gale
1,65.
3.3.1. Dfinition
On appelle variable F de Fisher, la variable F qui varie entre 0 et + et dfinie par la
fonction de densit de probabilit :
k1 k 1 k 2
1
f ( x) c x2 ( k1 x k 2 ) 2
Les paramtres k1 et k2 sont deux constantes entires positives appeles nombre de degrs de
libert, on dit variable F k1 et k2 degrs de libert, dsigne par F k1 et k2 dl.
c est une constante telle que : f ( x)dx 1
0
45 Adil ELMARHOUM
Echantillonnage et estimations
k1dl
Fk1etk 2 dl k1
k 2dl
k2
1
Il en rsulte que si F est une variable F k1 et k2 dl, son inverse est une variable F k2 et k1 dl.
F
k2
Esprance mathmatique : E(F k1 et k2 dl) = pour k2 > 2.
k2 2
2k 2 ( k1 k 2 )
Variance : V(F k1 et k2 dl) = pour k2 > 4.
k1 ( k 2 2)(k 2 4)
Chaque table de la loi F de Fisher dpend des paramtres k1 et k2, elle donne les valeurs de F
k1 et k2 dl pour la valeur de la fonction de rpartition F(F k1 et k2 dl).
46 Adil ELMARHOUM
Echantillonnage et estimations
47 Adil ELMARHOUM
Echantillonnage et estimations
Pour lire une valeur F k1 et k2 dl dans la table, il suffit de lire l'intersection entre la colonne
correspondante la valeur de k1 et la ligne correspondante la valeur de k2.
Exemple :
La valeur de F 10 et 15 dl pour une probabilit de 0,95 correspond dans la table de la loi F pour
p=0,95, l'intersection entre la colonne correspondante 10 et la ligne correspondante 15,
on peut lire la valeur 2,54.
F 0,95 10 et 15 dl = 2,54
F 0,975 15 et 20 dl = 2,57
48 Adil ELMARHOUM
Echantillonnage et estimations
2. Une machine met du sucre en poudre en sachet. Elle peut tre rgle au moyen d'un dispositif
gradu en gramme, tel que lorsque la machine est rgle sur le poids moyen par sachet m, la
probabilit que les sachets psent au moins 1 Kg est gale 98,5 %. Sachant que le poids par
sachet suit une loi normale d'cart type 10 grammes, sur quelle valeur m faut-il rgler le
dispositif ?
3. Une machine est rgle pour faire remplir des bouteilles d'un volume moyen de 255 cm3. Si la
distribution des volumes est normale et l'cart type est gal 4 cm3 : (a) dans quelle
proportion des cas le volume sera infrieur 250 cm3 ? (b) quelle valeur faut-il donner au
volume moyen pour que cette proportion soit de 5 % ?
4. Dans le cadre de la gestion d'un stock de marchandise, on doit lancer une commande destine
couvrir quatre semaines de fourniture d'un produit donn. On admet que la demande
hebdomadaire de ce produit suit une loi normale de moyenne, 50 et d'cart type 10. Combien
d'units doit-on commander pour que la probabilit dtre en rupture de stock soit infrieure
1 % si on considre que les demandes des semaines successives sont indpendantes ?
8. Si Z1, Z2, , Zk sont k variables alatoires normales rduites indpendantes, que valent la
moyenne et la variance de la variable :
X Z1
k
Zi
i 2
et quelle est, pour k = 10, la valeur de x telle que : P(X > x) = 0,1?
10. Pour une variable Khi carr 40 degrs de libert, dterminez les valeurs 1 et 2 telles
que : F(1) = 0,05 et F(2) = 0,95.
49 Adil ELMARHOUM
Echantillonnage et estimations
PREMIERE PARTIE
THEORIE DECHANTILLONNAGE
50 Adil ELMARHOUM
Echantillonnage et estimations
THEORIE DECHANTILLONNAGE
I. Rle de lchantillonnage
Lorsquon souhaite collecter les informations sur une population, deux possibilits soffrent :
La premire solution consiste observer ou interroger tous les lments de la population,
cest ce quon appelle une enqute complte ou enqute exhaustive ou recensement. La
seconde solution consiste observer ou interroger une partie de la population, cest ce quon
appelle enqute partielle ou sondage. Les lments de la population qui sont rellement
observs constituent lchantillon et lopration qui consiste choisir ces lments est appele
chantillonnage.
Par rapport lenqute complte, lenqute partielle offre une srie davantages. Le cot
global de lenqute partielle est en gnral plus rduit que le cot global dune enqute
complte. Lenqute par sondage est plus rapide que lenqute complte, surtout lorsque la
caractristique tudie prsente des modifications assez importantes au cours du temps. Les
erreurs dobservations sont plus rduites que dans lenqute exhaustive. En fin dans certaines
situations particulires, lenqute partielle est la seule solution possible, cest le cas lorsque
lobservation prsente un caractre destructif.
II. VOCABULAIRE
Enqute : ensemble des oprations de collecte et de traitement de donnes relatives
quelques domaines que ce soit.
51 Adil ELMARHOUM
Echantillonnage et estimations
Erreur dchantillonnage : cart entre les rsultats obtenus auprs dun chantillon et ce que
nous apprendrait un recensement comparable de la population. Plus la taille de lchantillon
est grande plus lerreur dchantillonnage diminue.
Fraction ou taux de sondage : proportion des units de la population qui font partie de
lchantillon. Cest le rapport entre la taille de lchantillon n, et la taille de la population N.
f n x100
N
Lchantillon choisi doit tre le plus reprsentatif possible de la population tudie, cest
dire le degr de correspondance entre linformation recueillie et ce que nous apprendrait un
recensement comparable de la population dpend en grande partie de la faon dont
lchantillon a t choisi.
Un chantillonnage est alatoire si tous les individus de la population ont la mme chance de
faire partie de lchantillon; il est simple si les prlvements des individus sont raliss
indpendamment les uns des autres.
En particulier, si la population est finie, cette dfinition correspond au tirage alatoire avec
remise, qui permet de traiter les populations finies comme des populations infinies.
- Constituer la base de sondage qui correspond la liste complte et sans rptition des
lments de la population ;
- Numroter ces lments de 1 N ;
- Procder, laide dune table de nombres alatoires ou dun gnrateur de nombres
pseudo alatoires la slection des units diffrentes qui constitueront lchantillon.
52 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
fn wi N i
N N
le nombre dunits choisir dans chacune des strates est donc :
ni wi n f Ni
53 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
Dans une population de 10000 entreprises, rparties en 500 petites entreprises, 3000
moyennes entreprises et 2000 grandes entreprises, on souhaite avoir un chantillon de 500
entreprises.
Fraction de sondage constante : f = 500 / 1000 = 0.05 %
ni k w i i avec k G
ci w i i ci
Exemple :
Dans la population des 10000 entreprises, on a pu avoir les informations suivantes :
Strate Poids de la strate Cot de la collecte de Dispersion lintrieur
wi linformation dans la de la strate, mesure par
strate, ci lcart type i.
Petite 0,5 50 0,8
Moyenne 0,3 75 1,5
Grande 0,2 100 2,2
le nombre dentreprises choisir dans chacune des strates est donn par :
k G = 5000 = 449,42
w i i ci 0,50,8 50 0,31,5 75 0,22,2 100
0,5 0,8
n1 449,42 = 26 petites entreprises
50
0,3 1,5
n1 449,42 = 24 moyennes entreprises
75
0,2 2,2
n1 449,42 = 20 grandes entreprises
100
54 Adil ELMARHOUM
Echantillonnage et estimations
Lchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractriss
par un systme ramifi et hirarchis dunits.
Dans le cas de deux degrs, par exemple, on considre que la population est constitue dun
certain nombre dunits de sondage du premier degr (units primaires), chacune de ces units
tant constitue dun certain nombre dunits du second degr. (units secondaires)
On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unit
slectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode
de slection pouvant varier dun degr lautre.
Lchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments de
toute la population et quil est possible dnumrer les units prleves au premier degr. Il
permet une concentration du travail sur le terrain et donc une rduction des cots.
Pour un mme nombre total dobservations, il faut citer sa plus faible efficacit que
lchantillonnage alatoire et simple.
Exemple :
Lchantillonnage systmatique est une technique qui consiste prlever des units
dchantillonnage situes intervalles gaux. Le choix du premier individu dtermine la
composition de tout lchantillon.
Connaissant k, on choisit le plus souvent, pour dbuter, un nombre alatoire, i, compris entre
1 et k. le rang des units slectionnes est alors i, i+2k, i+3k,
Lchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit
le temps consacr la localisation des units slectionnes.
55 Adil ELMARHOUM
Echantillonnage et estimations
Exemple :
k 1800 60
30
Ainsi on va tirer une entreprise toutes les 60 en partant dun nombre tir alatoirement entre 1
et 60.
Supposons ce nombre est le 15. On va donc slectionner la 15me entreprise puis la 75me, la
135me. jusqu la 1755me ce qui nous donnera lchantillon de 30 entreprises.
Exemple :
- Enquts ralises dans la rue, les lieux publics, en sortie de super march
- Questionnaires figurant dans les magasines et renvoys spontanment.
Cest un chantillonnage par jugement priori. Il consiste slectionner des individus dont
on pense, avant de les interroger, quils peuvent dtenir linformation.
Cette mthode est rserve aux populations composes dindividus dont lidentification est
difficile ou qui possdent des caractristiques rares.
La mthode consiste faire construire lchantillon par les individus eux-mmes. Il suffit den
identifier un petit nombre initial et de leur demander de faire appel dautres individus
possdant les mmes caractristiques.
56 Adil ELMARHOUM
Echantillonnage et estimations
Lchantillonnage par quotas consiste tudier la structure de la population selon des critres
choisis (quotas) empiriquement. Lchantillon est ensuite construit de manire constituer
une reproduction en miniature de la population sur ces critres.
Lchantillonnage par quotas est une forme simplifie de lchantillonnage stratifi fraction
de sondage constante. Les quotas reprsentent les variables de stratification.
Une fois les quotas sont fixs, les individus sont slectionns la convenance de lenquteur.
Les critres servant de base la dfinition des quotas ne doivent pas tre nombreux. Au-del
de 3 critres, la dmarche devient complexe. Les quotas doivent tre construits sur une base
de donnes fiables ( statistiques disponibles ) indiquant la rpartition de la population sur les
critres choisis. Les critres les plus utiliss dans les tudes de march sont conomiques et
socio-dmographiques en particulier lge, le sexe, la catgorie socioprofessionnelle,
Exemple :
1) Age
2) Sexe x Age
Structure de la population
Rpartition de lchantillon
Structure de la population
AGE CSP Sans Etudiant Agric Artisans Prof Employs Ouvriers Total
Sexe librales
20-29 M 10% 30% 5% 6% 9% 25% 15% 100%
F 15% 25% 2% 10% 8% 30% 10% 100%
30-49 M 8% 5% 15% 22% 15% 15% 20% 100%
F 20% 4% 10% 16% 14% 24% 12% 100%
50-60 M 6% 2% 25% 22% 18% 17% 10% 100%
F 35% 1% 20% 20% 6% 13% 5% 100%
Rpartition de lchantillon
AGE CSP Sans Etudiant Agric Artisans Prof Employs Ouvriers Total
Sexe librales
20-29 M 19 58 10 12 17 48 28 192
F 31 52 4 21 17 62 21 208
30-49 M 14 9 26 38 26 26 33 172
F 36 7 18 28 25 43 21 178
50-60 M 7 2 28 25 20 19 12 113
F 48 1 27 27 8 18 8 137
58 Adil ELMARHOUM
Echantillonnage et estimations
P( X m < ) 1
n
avec :
n : taille de lchantillon ;
: prcision souhaite ;
X : moyenne de lchantillon ;
m : moyenne de la population.
: Ecart- type dchantillon, il est souvent inconnu, il faut avoir des informations
antrieures ou mener une tude pilote.
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte. On se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas de
la moyenne de la population de plus de . Ceci scrit :
P( X m < ) 1-
1 = 1-
n
et donc :
n
Exemple :
Un parc de loisirs souhaite estimer 10dh prs le montant moyen dachats effectus par
chaque visiteur, cest dire on se fixe une marge d'erreur de 10 dans l'analyse des rsultats :
= 10
Une tude pilote mene sur 50 visiteurs choisis au hasard a montr que lcart- type des
achats est : = 100 dh.
59 Adil ELMARHOUM
Echantillonnage et estimations
n 100 2000
100,05
pq
P( f n p < ) 1
n
avec :
n : taille de lchantillon ;
: prcision souhaite ;
fn : proportion ou frquence relative dans lchantillon ;
p : proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir des
informations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte. On se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas de
la proportion dans la population de plus de . Ceci scrit :
P( f n p < ) 1-
pq
En rapprochant les deux formules on obtient : 1
n = 1-
et donc :
pq
n
Exemple :
Le parc souhaite estimer la proportion des visiteurs qui font des achats cinq points prs,
cest dire on se fixe une marge d'erreur de 5% dans l'analyse des rsultats :
= 0,05
60 Adil ELMARHOUM
Echantillonnage et estimations
n 0,650,35 1820
0,050,05
4.2. UTILISATION DE LA LOI NORMALE
On applique cette mthode si la variable suit une loi normale ou si elle peut tre approche par
la loi normale.
a) Cas des prlvements dans une population finie avec remise ou dans une
population infinie sans remise :
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte. On se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas de
la moyenne de la population de plus de . Ceci scrit :
P( X m < ) 1-
avec :
: prcision souhaite ;
X : moyenne de lchantillon ;
m : moyenne de la population.
Daprs le thorme central limite, la variable alatoire X suit une loi normale dont les
paramtres sont :
E( X n ) = m
V( X n ) =
n
P( X m < ) 1-
P( X m) 1-
61 Adil ELMARHOUM
Echantillonnage et estimations
P( X m ) 1-
n n n
P( n Z n ) 1-
( n ) ( n ) 1-
( n )[1( n )] 1-
2( n )1 1-
( n ) 1-
2
n Z
= 1 2
n Z12
Exemple :
Reprenons lexemple du parc de loisirs qui souhaite estimer 10dh prs le montant moyen
dachats effectus par chaque visiteur, cest dire on se fixe une marge d'erreur de 10 dans
l'analyse des rsultats : = 10
Une tude pilote mene sur 50 visiteurs choisis au hasard a montr que lcart- type des
achats est : = 100 dh.
62 Adil ELMARHOUM
Echantillonnage et estimations
E( X n ) = m
V( X n ) = N n
N 1 n
Lcart type de la moyenne est donc : X N n 1 n
N 1 n n N
De la mme manire, on arrive :
n N Z1
=
N n 2
n Z
N n 1 2 N
n Z
N n 1 2 N
n Z1 n Z1
2 2 N
n(1 Z1 ) Z1
2 N 2
Z1-2 N
n
N Z1-2
P( f n p < ) 1-
avec :
n : taille de lchantillon ;
: prcision souhaite ;
fn : proportion ou frquence relative dans lchantillon ;
p : proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir des
informations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.
63 Adil ELMARHOUM
Echantillonnage et estimations
Daprs le thorme central limite, la variable alatoire fn suit une loi normale dont les
paramtres sont :
a) Cas des prlvements dans une population finie avec remise ou dans une
population infinie sans remise :
E( fn ) = p
pq
V( fn ) =
n
pq
Lcart type de la frquence est donc : fn
n
P( f n p < ) 1-
P( fn p) 1-
fn p
P( ) 1-
pq pq pq
n n n
P( n Z n ) 1-
pq pq
( n ) ( n ) 1-
pq pq
( n )[1 ( n )] 1-
pq pq
2( n )1 1-
pq
( n ) 1-
pq 2
64 Adil ELMARHOUM
Echantillonnage et estimations
On a alors :
n Z
= 1
pq 2
n Z12 pq
Exemple :
= 0,05
E( fn ) = p
pq
V( fn ) = N n
N 1 n
pq N n pq
Lcart type de la frquence est donc : fn 1 n
n N 1 n N
n N = Z
1
pq N n 2
n Z pq
N n 1 2 N
65 Adil ELMARHOUM
Echantillonnage et estimations
n Z pq
1
N n 2 N
pq pq
nZ1 n Z1
2 2 N
pq pq
n(1 Z1 ) Z1
2 N 2
Z1-2 p q N
n
N Z1-2 p q
V. DISTRIBUTIONS DECHANTILLONNAGE
La notion de distribution dchantillonnage est la base des mthodes dinfrence statistique
dont les deux principales applications sont les problmes destimation et les tests
dhypothses. Les premiers ont pour but destimer, partir dun chantillon, la valeur
numrique dun ou de plusieurs paramtres de la population, et de dterminer la prcision de
cette ou de ces estimations. Les seconds ont pour but de vrifier la vracit dune hypothse
mise au dpart au sujet dune ou de plusieurs populations.
A tout paramtre de population , on peut associer une srie infinie de valeurs observes t, t,
t , , calcules partir dchantillons successifs de mme effectif, prlevs dans des
conditions identiques. Ces valeurs peuvent tre considres comme des valeurs observes
dune mme variable alatoire T, et cette variable est fonction des diffrentes variables
alatoires correspondant chacun des individus de lchantillon :
En supposant que lchantillon est alatoire et simple, la variable alatoire T possde une
distribution de probabilit, dite distribution d chantillonnage. On peut donc calculer
lesprance E(T) et la variance V(T) de cette distribution.
La distribution dchantillonnage est donc la distribution des diffrentes valeurs que peut
prendre la variable alatoire T, pour les diffrents chantillons possibles. Son cart type T est
appel erreur standard.
66 Adil ELMARHOUM
Echantillonnage et estimations
xi
i 1
et quon ait calcul la moyenne : x
n
Si on prlve, dans les mmes conditions, un deuxime chantillon de mme effectif :
x'i
La moyenne correspondante x' i1 sera gnralement diffrente de la premire moyenne
n
observe.
Il en sera de mme pour les moyennes dautres chantillons prlevs dans les mmes
conditions :
x1, x2, x3, ., xn
n
xi''
x'' i 1
n
On peut considrer la suite des premires observations x1, x1, x1, des diffrents
chantillons comme des valeurs observes dune mme variable alatoire X1, la suite des
deuximes observations des diffrents chantillons comme des valeurs observes dune mme
variable alatoire X2, etc.
Les moyennes observes x, x' , x'' , sont alors des valeurs observes dune mme variable
alatoire X qui est fonction de X1, X2, , Xn.
n
Xi
X i 1
n
Comme X1, X2, , Xn, la variable alatoire X possde une distribution de probabilit, dite
distribution d chantillonnage de la moyenne. On peut donc calculer lesprance et la
variance de cette distribution, en supposant que lchantillon est alatoire et simple, les
variables alatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la
moyenne est dsigne par m et la variance par .
67 Adil ELMARHOUM
Echantillonnage et estimations
E(Xi) = m et V(Xi) =
On dmontre alors :
n
Xi n
E( X ) = E( i 1
) = 1 E(Xi) = 1 nm = m
n n i 1 n
n
Xi n
V( X ) = V( i 1
) = 1 V(Xi) = 1 n =
n n i 1 n n
X est appel erreur standard de la moyenne dun chantillon alatoire est simple
n
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire est simple deffectif n, la variance de la moyenne est :
V( X ) = N n
N 1 n
Si par exemple, la population parent possde une distribution normale, on peut affirmer que la
distribution de la moyenne est elle-mme normale de moyenne m et dcart type X .
n
Si la distribution de la population parent est inconnue, le thorme central limite permet
daffirmer que la distribution de la moyenne est asymptotiquement normale. Pour un effectif
suffisamment lev, la moyenne dun chantillon peut toujours tre considre comme une
variable approximativement normale. Cest gnralement le cas lorsque leffectif est suprieur
30. Dans le cas contraire (n < 30), la moyenne dun chantillon peut toujours tre considre
comme une variable de Student (n-1) degr de libert.
De la mme manire que la moyenne, chacun des chantillons possde une variance :
n
(x x) i
v(x) i 1
n
68 Adil ELMARHOUM
Echantillonnage et estimations
n
(x ' x') i
v(x') i 1
n
n
(x " x") i
v(x") i 1
n
Ces variances peuvent tre considres comme des valeurs observes dune mme variable
alatoire :
n
(X i X )
V(X) i 1
n
Comme X1, X2, , Xn, la variable alatoire V(X) possde une distribution de probabilit, dite
distribution d chantillonnage de la variance. On peut donc calculer lesprance
mathmatique et la variance de cette distribution, en supposant que lchantillon est alatoire
et simple, les variables alatoires X1, X2, , Xn ont toutes la mme distribution de
probabilit, dont la moyenne est dsigne par m et la variance par .
E(Xi) = m et V(Xi) =
n n n
(X i X )
i 1
(X i m X m)
i 1
[(X m)(X m)]
i 1
i
E(V(X)) = E( ) = E( ) = E( )
n n n
n
[(X m)2(X m)(X m)(X m)]
i 1
i i
E(V(X)) = E( )
n
n n n
(X i m)2(X m)(X i m)(X m)
i 1 i 1 i 1
E(V(X)) = E( )
n
n n n
(X i m)
(X i m) (X m)
E(V(X)) = E( i 1 2(X m) i1 i1 )
n n n
n
(X i m)
E(V(X)) = E( i 1 2(X m)(X m) (X m) )
n
E(V(X)) = E( (X m) )
69 Adil ELMARHOUM
Echantillonnage et estimations
E(V(X)) = E( ) E( (X m) )
E(V(X)) = -
n
E(V(X)) n1
n
Pour la variance de la distribution dchantillonnage de la variance, on dmontre, dans le cas
dune population normale :
2(n1) 4
V(V(X)) = E[(V(X) E(V(X)))] = E[(V(X) n1 )] = .
n n
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire est simple deffectif n, lesprance mathmatique de la variance est :
E(V(X)) N n1
N 1 n
En ce qui concerne la forme de la distribution dchantillonnage de la variance, on peut
dmontrer que dans le cas particulier dune population normale, la variable alatoire
n
(xi x)
i 1 possde une distribution khi deux (n-1) degr de libert.
De la mme manire que la moyenne et la variance, chacun des chantillons possde une
frquence :
fn X n
n
70 Adil ELMARHOUM
Echantillonnage et estimations
fn' X n'
n
fn" X n"
n
Ces frquences peuvent tre considres comme des valeurs observes dune mme variable
alatoire :
Fn X n
n
La variable alatoire Fn possde une distribution de probabilit, dite distribution
d chantillonnage de la proportion. On peut donc calculer lesprance et la variance de cette
distribution, en supposant que lchantillon est alatoire et simple.
E(Fn) = E( X n ) = 1 E( X n ) = 1 n p = p
n n n
pq
V(Fn) = V( X n ) = 1 V( X n ) = 1 n p q =
n n n n
pq
Fn est appel erreur standard de la frquence dun chantillon alatoire est simple
n
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire est simple deffectif n, la variance de la frquence est :
pq
V(Fn) = V( X n ) = 1 V( X n ) = 1 N n n p q = N n
n n n N 1 N 1 n
71 Adil ELMARHOUM
Echantillonnage et estimations
2. Quelle est la probabilit que la moyenne d'un chantillon de 12 observations provenant d'une
population de distribution uniforme dfinie dans l'intervalle (0, 1) soit comprise entre 0,4 et
0,6 ?
3. Calculez la moyenne et l'cart type de la variance S, ainsi que la probabilit P(10 < S<20),
en supposant que S dsigne la variance observe d'chantillons alatoires et simples d'effectif
10 extraits d'une population normale de moyenne gale 15 et cart type gal 4.
4. On suppose que les poids de 3000 tudiants d'une universit suivent une loi normale de
moyenne 68,0 kilogrammes et cart type 3,0 kilogrammes. Si l'on extrait 80 chantillons de
25 tudiants chacun, quelle est la moyenne et cart type thoriques de la distribution
d'chantillonnage des moyennes pour (a) un chantillonnage non exhaustif, (b) un
chantillonnage exhaustif ?
5. Pour combien d'chantillons du Problme 4 peut-on s'attendre trouver une moyenne (a)
comprise entre 66,8 et 68,3 kilogrammes, (b) infrieure 66,4 kilogrammes ?
6. 500 pignons ont un poids moyen de 5,02 grammes et un cart type de 0,30 grammes. Trouver
la probabilit pour quun chantillon de 100 pignons choisi au hasard ait un poids total (a)
compris entre 496 et 500 grammes. (b) plus grand que 510 grammes.
7. Chacune des personnes dun groupe de 500 individus lance 120 fois une pice de monnaie
parfaite. Combien de personnes signaleront-elles que (a) le nombre de faces quelles
obtiennent se trouve compris entre 40 et 60. (b) 5 sur 8 ou plus de leurs jets correspondent
des faces ?
8. Lors dlections, les rsultats ont montr quun des candidats a obtenu 46 % des voix.
Dterminer la probabilit pour que le vote de (a) 200 (b) 1000 personnes choisies au hasard
parmi le corps lectoral donne une majorit de voix en faveur de ce candidat.
9. Les ampoules lectriques d'un fabricant A ont une dure de vie moyenne de 1400 heures avec
un cart-type de 200 heures, et celles d'un fabricant B ont une dure de vie moyenne de 1200
heures avec un cart-type de 100 heures. Si l'on teste des chantillons de 125 ampoules pour
chaque marque, quelle est la probabilit pour que la marque d'ampoules A ait une dure de vie
moyenne qui soit au moins suprieure de (a) 160 heures, (b) 250 heures celle de la marque
d'ampoules B ?
10. Les pignons d'une marque donne psent 0,50 gramme avec un cart-type de 0,02 gramme.
Quelle est la probabilit pour que deux lots de 1000 pignons chacun diffrent entre eux de
plus de 2 grammes ?
72 Adil ELMARHOUM
Echantillonnage et estimations
11. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et un cart
type de 150 heures. Trois ampoules sont branches de telle manire que, si lune delles est
grille, les autres continuent fonctionner. En supposant que les dures de vie suivent une loi
de Laplace Gauss, quelle est la probabilit pour que lclairage fonctionne (a) au moins
pendant 5000 heures. (b) au plus pendant 4200 heures ?
12. Lcart type des poids dune trs grande population de personnes est 10 kg On extrait de cette
population des chantillons de 200 personnes chacun. On calcule alors les carts types pour
chaque chantillon. (a) Trouver la moyenne et lcart type de la distribution dchantillonnage
des carts types. (b) Quel est le pourcentage dchantillons qui a un cart type plus grand que
11 Kg ?
13. Les poids de 1500 pignons suivent une loi de Laplace-Gauss de moyenne 22,40 kg et cart
type 0,048 kg Dterminer pour 300 chantillons alatoires de taille 36 de cette population la
moyenne et l'cart-type thoriques de la distribution d'chantillonnage des moyennes,
l'chantillonnage tant (a) non exhaustif, (b) exhaustif.
14. Combien d'chantillons alatoires du Problme 13 ont-ils leur moyenne (a) comprise entre
22,39 et 22,41 Kg, (b) plus grande que 22,42 Kg, (c) plus petite que 22,37 Kg, (d) plus petite
que 22,38 ou plus grande que 22,41 Kg ?
15. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un cart-type
de 50 kg, Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur un monte-
charge dpassent la limite de scurit du monte-charge, qui est 8200 kilogrammes.
16. Trouver la probabilit pour que parmi les 200 prochains enfants natre (a) il y ait moins de
40 % de garons, (b) il y ait entre 43 % et 57 % de filles, (c) il y ait plus de 54 % de garons.
On supposera que la naissance d'un garon et la naissance d'une fille sont quiprobables.
17. Etant donn 1000 chantillons de 200 enfants chacun, pour combien d'chantillons a-t-on une
chance de trouver (a) moins de 40 % de garons, (b) entre 40 % et 60 % de filles, (c) 53 % ou
plus de filles ?
18. Un fabricant expdie 1000 lots de 100 ampoules lectriques chacun. Si 5 % des ampoules
sont normalement dfectueuses, dans combien de lots peut-on avoir (a) moins de 90 bonnes
ampoules, (b) 98 bonnes ampoules ou davantage ?
19. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives 4000 et
4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100 cbles
de la marque A et 50 cbles de la marque B, quelle est la probabilit pour que la rsistance de
rupture moyenne de B ait (a) au moins 600 kilogrammes de plus que A, (b) au moins 450
kilogrammes de plus que A ?
20. Les rsultats d'une lection montrent qu'un des candidats a obtenu 65 % des voix. Trouver la
probabilit pour que deux chantillons alatoires, chacun correspondant 200 votants,
indiquent plus de 10 % de diffrence dans les proportions de gens qui ont vot pour ce
candidat.
73 Adil ELMARHOUM
Echantillonnage et estimations
21. Le voltage moyen d'une batterie est 15,0 volts avec un cart-type de 0,2 volt. Quelle est la
probabilit pour que quatre batteries de ce type, branches en srie, aient un voltage combin
de 60,8 volts ou plus ?
22. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec un cart
type de 200 heures. (a) Trouver la probabilit qu'un chantillon alatoire de 100 units de ce
bien a une moyenne de vie suprieure 1825. (b) Trouver la probabilit qu'un chantillon
alatoire de 100 Units de ce bien une moyenne de vie de pas plus de 1775 et pas moins de
1760.
23. Une population est constitue des cinq nombres 2, 3, 6, 8, 11. On considre tous les
chantillons non exhaustifs possibles de taille deux de cette population. Trouver (a) la
moyenne de la population, (b) cart type de la population, (c) la moyenne de la distribution
d'chantillonnage des moyennes, (d) cart type de la distribution d'chantillonnage des
moyennes, c'est--dire l'erreur quadratique moyenne des moyennes.
25. Dans le but dtudier lintention dachat dun produit, on dcide de raliser un sondage.
Combien de personnes doit-on interroger pour que la frquence empirique ne sloigne pas de
la vraie proportion de 1% et ce avec une probabilit au moins gale 95%?
26. Des sachets de sucre granul, dont le poids moyen est de 1,01 kg avec un cart type de 50
grammes, sont mis dans des cartons contenant chacun 100 sachets. Le poids dun carton vide
est de 500 grammes. On procde par sondage au contrle du poids des sachets de sucre
granul. (a) en utilisant lIBT, dterminer le nombre de sachets de sucre granul quon doit
contrler pour que le poids moyen de lchantillon ne soit pas loin de la vraie moyenne de
plus ou moins 20 grammes, avec une probabilit au moins gale 0,99. (b) Reprendre la
mme question en supposant que le poids moyen est distribu normalement, et que
lchantillon sera tir dun stock de 4000 sachets. (c) On choisit au hasard un carton rempli,
quelle est la probabilit que le poids de ce carton soit infrieur 100 kg ?
27. Un avion (Boeing 747) peut transporter 100 passagers et leurs bagages, Il pse 120 tonnes
sans bagages, ni passagers mais quipage compris et plein de carburant. les consignes de
scurit imposent au commandant de bord de ne pas dcoller si le poids de l'appareil charg
dpasse 129,42 tonnes. les 100 places ont t rserves. Le poids d'un voyageur est une
variable alatoire d'esprance mathmatique 70 kg et de variance 100 kg Le poids de ses
bagages est une V.A. de moyenne 20 kg et de variance 100 kg Toutes les variables sont
supposes indpendantes. (a) L'esprance mathmatique du poids de l'appareil au moment du
dcollage est-elle conforme aux normes de scurit ? (b) Calculer l'cart type du poids total de
l'appareil. (c) En admettant 1'IBT, quelle est la probabilit maximale pour que le poids rel de
l'appareil au moment du dcollage dpasse 129,42 tonnes ?
28. Une enqute sur l'emploi a pour but destimer le taux d'activit dans un pays. Dans les
statistiques disponibles, la population active du pays est estime 10000000 personnes sur
une population totale de 40 millions de personnes. Dtermines la taille de l'chantillon si l'on
accepte une erreur de 1% . avec une probabilit de 0,95.
74 Adil ELMARHOUM
Echantillonnage et estimations
29. Le rendement de la main duvre dune usine est chiffr par une production moyenne par jour
et par ouvrier de 72 units avec un cart type de 6 units. (a) on a observ la production
journalire dun chantillon alatoire de 25 ouvriers. Dterminer la loi et les paramtres de la
moyenne de l'chantillon. (b) Quelle est la probabilit pour que la moyenne de cet chantillon
soit infrieure 63 ? (c) Quelle est la probabilit pour que l'cart entre la moyenne de cet
chantillon et celle de la population soit suprieur 3 ?
30. Un standard tlphonique reoit en moyenne 400 appels par jour avec un cart type
de 9,5. (a) Quelle est la probabilit pour quen une journe donne, le nombre
dappels soit compris entre 360 et 440. (b) Quelle est la probabilit pour que le
nombre moyen dappels par jour en une priode dun mois soit compris entre 380 et
420 ?
31. Afin destimer le revenu mensuel moyen dans un secteur de production. Quelle doit
tre la taille de lchantillon de salaris interroger pour que la moyenne empirique
ne sloigne pas de la moyenne de la population de 100 dh avec une probabilit au
moins gale 0,95 sachant que lcart type est de 500 dh par salari ?
32. On souhaite raliser une enqute sur la consommation des mnages afin destimer la
dpense moyenne par mnage. Quelle doit tre la taille de lchantillon de mnages si
la population est compose de 5 millions de mnages et que lerreur admise ne doit
pas dpasser 100 dh avec une probabilit de 0,99 ? lcart type de la dpense des
mnages est de 2000 dh.
33. On souhaite raliser une enqute sur lemploi afin destimer le taux de chmage. La
population active est de 5 millions de personnes. Quelle doit tre la taille de
lchantillon pour que la frquence empirique ne sloigne pas du vrai taux de
chmage et ce avec une probabilit de 0,95 de 2%. Une enqute rcente avait donn
un taux de chmage de 12 %
34. Dans le cadre d'une tude socio-conomique, on s'intresse aux habitants de 18 units
urbaines, rparties en deux rgions. L'enqute devrait comporter 500 interviews. Comme on
dispose de 10 enquteurs et qu'on souhaite que chaque enquteur n'opre que dans une seule
unit urbaine, on souhaite se limiter l'tude de 10 units urbaines. On considre qu'un
enquteur peut raliser 10 interviews dans la mme journe. En fonction de la rpartition des
units urbaines par rgion et de leurs nombres d'habitants, expliquez, de faon aussi dtaille
que possible la manire dont on pourrait organiser cette enqute, en prcisant notamment dans
quelles units urbaines il y aurait lieu d'envoyer les enquteurs.
75 Adil ELMARHOUM
Echantillonnage et estimations
Rgion 1 Rgion 2
Units urbaines Nombres dhabitants Units urbaines Nombres dhabitants
1 93600 9 117100
2 45400 10 107100
3 38900 11 61200
4 36500 12 51000
5 35100 13 43800
6 32900 14 38900
7 28100 15 37800
8 26400 16 33500
17 25800
18 25300
35. Dans une rgion regroupant environ 3 millions dhabitants runis en un peu plus de 1500
communes, on dsire raliser une enqute au cours de laquelle 0,5 pour mille des habitants
devraient tre interrogs. En effectuant une stratification base sur la distribution de
frquences donne ci-dessous, combien dinterviews devrait-on raliser dans chacune des
catgories de communes. Si de plus pour des raisons de facilit, on dcidait de ne pas
effectuer moins de 10 interviews par commune, dans combien de communes diffrentes de
chacune des catgories les enquteurs devraient-ils se rendre ?
36. Un sondage vise tudier la notorit dune marque. Pour cela on dispose de 12 enquteurs
durant un mois. (a) Sachant que le rendement par jour et par enquteur est distribu selon une
loi normale de moyenne 5, et cart type 1, dterminer la taille de l'chantillon retenue no telle
que : P(n >no ) = 0,025. (b) On propose de stratifier la population selon lge. Sachant que la
population se rpartit comme suit, dterminer la rpartition de l'chantillon:
Age moins de 20 ans entre 20 et 30 ans entre 30 et 60 ans plus de 60
ans
Effectifs 5500 000 2500 000 1250 000 250 000
38. Un sondage vise une population dentreprises rparties en quatre rgions contenant
respectivement 360, 840, 600 et 1200 entreprises. Le budget rserv pour cette
enqute est de 44 320 DH, Les cart-types sont estims 0,2 ; 0,1 ; 0,2 ; 0,4
respectivement pour les quatre rgions. Les cots de ralisation par questionnaire sont
respectivement de 225 DH, 196 DH, 400H. et 324 DH. (a) Etablir une stratification
optimale de lchantillon dterminer. (b) Prciser le niveau derreur que lon doit
accepter avec la taille de lchantillon calcule, en admettant un niveau de confiance
de 0,99 et une proportion thorique de 0,3.
39. Le budget alloue une enqute est de 132500 dh. Cette enqute est destine
estimer le taux de chmage quon a estim priori gal 10 %. Les frais de
dplacement quotidien sont valus 1000 dh par enquteur. La rmunration dun
enquteur est de 170 dh par jour. Les charges fixes sont de 20000 dh. (a) Dterminer
la taille de lchantillon si en tolre une erreur de moins de 1 % avec un niveau de
confiance de 95% (b) Dterminer la taille maximale permise par le budget alloue si
le rendement par enquteur est de 6 questionnaires par jour. (c) Quel niveau derreur
faut-il accepter si on ralise lenqute avec le budget allou ?
40. Une machine automatique fabrique des entretoises destines un montage de roulements. La
longueur de ces entretoises doit tre comprise, au sens large, entre 37,45 et 37,55 mm. La
variable alatoire X, qui associe chaque entretoise sa longueur, est une variable gaussienne
de moyenne 37,50 mm.
1) Quel doit tre lcart type de la variable alatoire X pour que 998 sur 1000 des pices
fabriques soient bonnes ?
2) On prlve un chantillon non exhaustif dans la production. Quel doit tre leffectif de
cet chantillon pour que la moyenne des longueurs des pices prleves appartienne
lintervalle [37,495 ; 37,505] avec une probabilit de 0,95 ?
41. Une machine fabrique des disques pleins en grande srie. On suppose que la variable alatoire
X qui, chaque disque tir au hasard, associe son diamtre suit la loi normale de moyenne
12,8 mm et dcart type 2,1 mm.
a) Quelle loi suit la variable alatoire, qui tout chantillon alatoire non
exhaustif de taille 49, associe la moyenne des diamtres des disques de cet
chantillon ?
b) Dterminer un intervalle centr en 12,8 tel que la moyenne des diamtres prendra ses
valeurs dans cet intervalle avec la probabilit 0,95.
77 Adil ELMARHOUM
Echantillonnage et estimations
DEUXIEME PARTIE
78 Adil ELMARHOUM
Echantillonnage et estimations
I. ESTIMATION PONCTUELLE
Lestimation ponctuelle ou lestimation de point dun paramtre est la connaissance de la
seule valeur estime de ce paramtre. Les paramtres les plus recherchs sont la moyenne, la
variance et la proportion.
On appelle estimateur du paramtre , toute fonction alatoire des valeurs observes, X1, X2,
, Xn, susceptibles de servir estimer .
On appelle estimations les valeurs numriques t1, t2, de cette variable alatoire Tn.
a) labsence de biais
La premire qualit dun bon estimateur est labsence derreur systmatique ou de biais. Cette
qualit implique que la vraie valeur doit tre retrouve en moyenne :
E(Tn) =
Tout estimateur qui satisfait cette condition est dit sans biais ou non biais.
b) la variance minimale
Une deuxime qualit dun bon estimateur est de possder une prcision suffisante. Cette
prcision peut tre mesure par le moment dordre deux par rapport .
E[(Tn - )]
79 Adil ELMARHOUM
Echantillonnage et estimations
E[(Tn - )] = V(Tn)
On peut dmonter qu tout paramtre correspond une valeur minimum de E[(Tn - )].
1
d log f(x,)
nE[( )]
d
Un estimateur non biais dont la variance est gale ce minimum est appel estimateur non
biais de variance minimum ou estimateur efficace.
c) convergence en probabilit
0, lim P(Tn ) = 0
n
Ce ci signifie que lcart entre le paramtre calcul partir de lchantillon et la vraie valeur
du paramtre de la population est trs faible quand la taille de lchantillon est grande. Cet
cart peut tre mesur par la variance. Ainsi on parle de convergence en probabilit si :
limV(Tn) = 0
n
80 Adil ELMARHOUM
Echantillonnage et estimations
Pour un chantillon alatoire et simple et pour une population dfinie par un seul paramtre ,
la fonction de vraisemblance est :
Ou
dL()
0
d
ou en annulant la drive de son logarithme :
d log L()
0
d
La meilleure estimation de la moyenne m dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la moyenne de lchantillon.
^
m x
La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, est
mesure par lerreur standard de la moyenne :
n
Estimateur du maximum de vraisemblance :
f(x,m) 1 e 12 ( x m)
2
81 Adil ELMARHOUM
Echantillonnage et estimations
1 e 12 ( x1 m) 1 e 12 ( x2 m) 1 e 12 ( xn m)
L(m) =
2 2 2
1 xim)
n (
n
L(m) = ( 1 ) e 2 i 1
n xim
Log L(m) = nlog(2) - 1 ( )
2 2i1
La drive de cette fonction par rapport m est :
d logL(m) 1 n
(xim)
i
=
dm 1
lestimation du maximum de vraisemblance de la moyenne de la population, est telle que :
n
1 (xim) = 0
i1
n n
(xim) = xinm = 0
i1 i1
n
^ xi
m= i1 =x
n
On retrouve la moyenne de lchantillon dfinie prcdemment.
82 Adil ELMARHOUM
Echantillonnage et estimations
a) labsence de biais
X i
X i 1
est un estimateur non biais de la moyenne m de la population puisquon a
n
dmontr que :
Xi n
E( X n ) = E( i 1
) = 1 E(Xi) = 1 nm = m
n n i 1 n
En effet, pour lensemble des chantillons qui peuvent tre rencontrs, on doit retrouver, en
moyenne, la vraie valeur de la population.
b) la variance minimale
f(x,m) 1 e 12 ( x m)
2
d log f(x,m)
= xm
dm
d log f(x,m)
nE[( )] = n E[( xm )] = n E[(X-m)] = n
dm 4
1 =
d log f(x,m) n
nE[( )]
dm
X i
83 Adil ELMARHOUM
Echantillonnage et estimations
c) convergence en probabilit
X i
X i 1
est un estimateur consistant de la moyenne m de la population puisquon a
n
dmontr que :
V( X n ) =
n
limV(X n) = 0
n
n
Xi
la moyenne X n i 1 calcule partir dun chantillon de taille n converge en probabilit
n
vers m.
n (xim)
L() = ( 1 ) e 2
i 1
n
Log L() = nlog(2) - 21 (xim)
2 i1
84 Adil ELMARHOUM
Echantillonnage et estimations
d log L() n
= n + 21 4 (xim)
d 2 i1
n
n + 21 4 (xim) = 0
2 i1
n
n (xi m) = 0
i 1
n
^ (xi m)
= i1
n
On retrouve la variance de lchantillon V(X).
n
^ (xi m)
= i1 est un estimateur biais de la variance de la population puisquon a
n
dmontr que :
E(V(X)) n 1
n
le biais est :
E(V(X)) - =
n
85 Adil ELMARHOUM
Echantillonnage et estimations
^ (x x)
i
n v(x) = i 1
n1 n1
dont lesprance mathmatique est bien .
^
E( ) = E( n v(x) ) = n E(v(x)) = n n1 =
n1 n1 n1 n
^
n v(x) est appele quasi-variance, cest un estimateur sans biais de la variance
n1
de la population. La quasi-variancee est dsigne par n1
Lerreur standard de cette estimation est, dans le cas dune population normale :
^ 2(n1) 4 2
v( ) v( n ) = n =
n1 n1 n n1
La meilleure estimation de la proportion p dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la frquence de lchantillon fn.
^
p fn
La dispersion des diffrentes estimations possibles autour de cette proportion gnrale, est
mesure par lerreur standard de la proportion :
fn(1 fn)
fn
n
86 Adil ELMARHOUM
Echantillonnage et estimations
x
L(p) = C n px (1-p)n-x
Log L(p) = log C nx + x log p + (n-x) log (1-p)
La drive de cette fonction par rapport p est :
d logL(p) x n x
= -
dp p 1 p
lestimation du maximum de vraisemblance de la variance de la population, est telle que :
x - n x = 0
p 1 p
(1-p) x p (n-x) = 0
x np = 0
^
p= x
n
La frquence fn de lchantillon est donc un estimateur du maximum de vraisemblance de la
proportion de la population.
a) labsence de biais
En effet, pour lensemble des chantillons qui peuvent tre rencontrs, on doit retrouver, en
moyenne, la vraie valeur de la population.
87 Adil ELMARHOUM
Echantillonnage et estimations
b) convergence en probabilit
pq
V( fn ) =
n
limV(f n) = 0
n
p(T1 T2) = 1 -
Le risque total peut tre rparti dune infinit de manire. Gnralement, on divise le risque
en deux parties gales, Les limites T1 et T2 sont telles que :
88 Adil ELMARHOUM
Echantillonnage et estimations
Les limites X 1 et X 2 sont telles que :
p( X 1 m X 2 ) = 1 -
X 1 = X - d1 et X 2 = X + d2
on peut alors crire :
p(m < X - d1) = p(m > X + d2) = /2
p( X - m > d1) = p(m - X > d2) = /2
Comme, pour une population normale, la variable X est elle-mme normale de moyenne m et
dcart type X , on peut crire :
n
p( xm d1 ) = p(m x d2 ) =
2
n n n n
p(Z1 d1 ) = p(Z 2 d2 ) =
2
n n
p(Z1 d1 ) = p(Z 2 d2 ) = 1 -
2
n n
( d1 ) = ( d2 ) = 1 -
2
n n
89 Adil ELMARHOUM
Echantillonnage et estimations
d1 = d2 = Z
1
2
n n
il en rsulte :
d1 = d2 = Z1
2 n
X 1 = X - Z1 et X 2 = X + Z1
2 n 2 n
X Z1
2 n
Pour une population de distribution de probabilit inconnue (cart type inconnu), on utilise
la quasi-variance comme estimation de la variance de la population. Lintervalle de confiance
de la moyenne sera dfini selon les cas.
Dans ce cas, la moyenne dun chantillon peut toujours tre considre comme une variable T
de Student (n-1) degr de libert. La valeur Z1 sera remplace par la valeur T1 (n-1)
2 2
degr de libert. Lintervalle de confiance est alors :
^
X T1
2 n
Dans ce cas, la moyenne dun chantillon peut toujours tre considre comme une variable
approximativement normale. Lintervalle de confiance est alors :
^
X Z1
2 n
90 Adil ELMARHOUM
Echantillonnage et estimations
p(1 2) = 1 -
n
(xi x)
Comme, pour une population normale, la variable alatoire i 1 possde une
distribution khi deux (n-1) degr de libert, on peut alors crire :
n n n
(xi x) (xi x) (xi x)
p( i1 i 1 i1 )=1-
2 1
ou encore :
n n n n
(xi x) (xi x) (xi x) (xi x)
p( i 1 < i1 ) = p( i 1 > i1 ) = /2
2 1
n n n
(xi x) (xi x) (xi x)
p( i 1 i1 ) = 1 - /2 i 1 = 1
1 1 2
n n n
(xi x) (xi x) (xi x)
p( i 1 < i1 ) = /2 i 1 =
2 2 2
n n
(xi x) (xi x)
1 = i1 et 2 = i1
1
2 2
91 Adil ELMARHOUM
Echantillonnage et estimations
p(p1 p p2) = 1 -
p1= fn - d1 et p2 = fn + d2
on peut alors crire :
Comme, la distribution de la proportion suit une loi normale de moyenne p et dcart type
pq
Fn condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le
n
produit n p 5, on peut crire :
fn p d1 ) = p( p f n d2 ) =
p(
p(1 p) p(1 p) p(1 p) p(1 p) 2
n n n n
p(Z1 d1 ) = p(Z 2 d2 ) =
p(1 p) p(1 p) 2
n n
p(Z1 d1 ) = p(Z 2 d2 ) = 1 -
p(1 p) p(1 p) 2
n n
( d1 ) = ( d2 ) = 1 -
p(1 p) p(1 p) 2
n n
92 Adil ELMARHOUM
Echantillonnage et estimations
d1 = d2 = Z1
p(1 p) p(1 p) 2
n n
il en rsulte :
p(1 p)
d1 = d2 = Z1
2 n
p(1 p) p(1 p)
p1= fn - Z1 et p2 = fn + Z1
2 n 2 n
p(1 p)
fn Z1
2 n
Dans une entreprise produisant un article dtermin on veut estimer sa dure de vie en heures.
cette fin on a observ un chantillon alatoire et simple de 16 units dont les rsultats sont
(en 1000 heures) :
16
^ x
i 1
i
mx 1,2
16
16
^ (x
i 1
i x )
0,11
16 1
93 Adil ELMARHOUM
Echantillonnage et estimations
^
X T1
2 n
^
0,11
X T1 = 1,2 2,131
2 n 16
0,11 0,11
X 1 = 1,2 2,131 = 1,14 et X 2 =1,2 + 2,131 = 1,26
16 16
n n
(xi x) (xi x)
1 = i1 et 2 = i1
1
2 2
Lcart type est la racine carre de la variance, ses limites de confiance sont donc :
16 16
^
i 1
( xi x)
0,11 15 ^ (x
i 1
i x )
0,11 15
1 0,08 2 0,17
27,49 6, 26
1
2 2
94 Adil ELMARHOUM
Echantillonnage et estimations
On tudie le pourcentage d'utilisation d'une machine. 400 observations ont t effectues qui
ont donn le rsultat suivant :
^
p = fn = 320 = 0,8
400
p(1 p)
fn Z1
2 n
p(1 p) 0,8(10,8)
p1= fn - Z1 = 0,80 1,96 = 0,76
2 n 400
p(1 p) 0,8(10,8)
p2 = fn + Z1 = 0,80 + 1,96 = 0,84
2 n 400
95 Adil ELMARHOUM
Echantillonnage et estimations
Ex 2 : Soit X une variable alatoire dont la densit de probabilit f est ainsi dfinie:
96 Adil ELMARHOUM
Echantillonnage et estimations
13 ; 06 ; 12 ; 10 ; 10 ; 16 ; 02 ; 04 ; 11 ; 12 ; 12 ; 05 ; 07 ; 08 ; 13
a) Estimer la note moyenne et l'cart type des notes pour l'ensemble des tudiants de la
facult.
b) Donner des estimations par intervalle de confiance pour la moyenne et l'cart type.
(=5%).
Ex 6 : Dans une entreprise produisant un article dtermin on veut estimer sa dure de vie en
heures. cette fin on a observ un chantillon de 16 units dont les rsultats sont (en 1000
heures) :
Ex 8 : dans une station service, on suppose que le montant des chques essence suit une loi
normale de paramtres m et . On considre un chantillon de taille n = 50 et on obtient une
moyenne de 130 Dh et un cart-type de 28 Dh. Donner une estimation de m et par un
intervalle de confiance au niveau de confiance 95%.
Ex 9 : on donne la rpartition des masses de 219 ressorts provenant dune mme fabrication :
masses (g) [8,2 ; 8,4[ [8,4 ; 8,6[ [8,6 ; 8,8[ [8,8 ; 9[ [9 ; 9,2[ [9,2 ; 9,4[ [9,4 ; 9,6[
Nbre de 9 21 39 63 45 27 15
ressorts
X donnant le poids dun ressort provenant de cette fabrication, donner une estimation
de E(X) et V(X). Donner pour E(X) et V(X) un intervalle de confiance au niveau de
confiance 95%.
97 Adil ELMARHOUM
Echantillonnage et estimations
Ex 11 : un confiseur vend des boites de bonbons dun certain modle. On note X la masse
dune boite pleine. Les peses de 8 boites ont conduit aux masses (en kg) :
a) Entre quelles limites peut-on fixer le taux d'utilisation de la machine avec un degr de
confiance de 95 % ?
b) On fait un plus grand nombre d'observations. On obtient le mme pourcentage d'utilisation
ce qui permet, avec un risque d'erreur de 5 %, de fixer les limites de confiance [78,4 % ;
81,6 %]. Combien a-t-on fait d'observations ?
Ex 15 : Un chantillon alatoire de 50 notes (sur 100) dans une population de 200 a donn
une moyenne de 75 et un cart type de 10.
a) Quelles sont les limites de confiance 95 % pour estimer la moyenne des 200 notes ?
b) Avec quel degr de confiance peut-on dire que la moyenne des 200 notes est de 75
plus ou moins 1 ?
Ex 18 : Une compagnie fabrique des roulements billes ayant un poids moyen de 0,638 Kg et
un cart type de 0,012 Kg Calculer les limites de confiance 95 % des poids de lots
comprenant 100 roulements chacun.
a) Alatoire et simple ;
b) Stratifi.
Ex 20 : En vue destimer la note moyenne des lves dune cole, on a choisi de faon
alatoire et simple six classes, et dans chacune de ces classes on a choisit alatoirement 4
lves. En fonction des rsultats obtenus et repris ci-dessous :
Classes 1 2 3 4 5 6
Elves
1 11,69 11,79 11,84 12,30 11,83 11,95
2 12,32 11,97 11,59 11,91 11,77 11,87
3 12,32 12,07 11,25 12,05 12,15 11,65
4 11,90 12,06 11,80 12,23 11,66 11,87
1 x
f(x,) e 2 pour tout nombre rel x.
2
a) Reconnatre la loi de la variable X et en dduire, sans calcul, lesprance
mathmatique et la variance de X.
b) Dterminer un estimateur de maximum de vraisemblance de associ un chantillon
alatoire de taille n.
c) Lestimateur prcdent est-il un estimateur sans biais ?
99 Adil ELMARHOUM
Echantillonnage et estimations
TROISIEME PARTIE
I. INTRODUCTION
Un test statistique est une mthode permettant de prendre une dcision partir dinformations
fournies par un chantillon.
Les tests statistiques ou les tests dhypothses ont pour but de vrifier, partir de
donnes observes dans un ou plusieurs chantillons, la validit de certaines
hypothses relatives une ou plusieurs populations.
Les tests de comparaison une norme ou tests de conformit sont destins comparer
entre eux une population thorique et un chantillon observ. Ils servent vrifier si un
chantillon donn peut tre considr comme extrait dune population possdant telle
caractristique particulire (telle moyenne, telle variance, ). Le test se fait en vrifiant si la
diffrence entre la valeur observe et la valeur thorique du paramtre considr peut tre
attribue au hasard ou non.
Les tests dhomognit ou dgalit ont pour but de comparer entre elles un certain nombre
de populations, laide dun mme nombre dchantillons.
Les tests dajustement sont destins vrifier si un chantillon observ peut tre extrait
dune population donne.
Les tests dindpendance ont pour but de contrler, partir dun chantillon, lindpendance
de deux ou plusieurs critres de classification, gnralement qualitatifs.
Lhypothse qui diffre de H0 est dite hypothse alternative, gnralement dsigne par H1.
Si cette probabilit est relativement leve, on considre Lhypothse nulle comme plausible
et on laccepte. Par contre si la probabilit calcule est faible, lcart observ apparat comme
peu compatible avec lhypothse nulle et on rejette celle-ci.
Lensemble des valeurs observes pour lesquelles lhypothse nulle est admissible forme la
rgion dacceptation. Les autres valeurs constituent la rgion de rejet. Les valeurs limites sont
appeles valeurs critiques.
La dcision dpend donc de lchantillon. Ainsi quelle que soit la dcision prise, le hasard
de lchantillonnage peut fausser les conclusions. Quatre situations doivent en effet tre
envisages:
Lacceptation de l'hypothse nulle alors qu'elle est vraie, le rejet de l'hypothse nulle alors
qu'elle est vraie, l'acceptation de l'hypothse nulle alors qu'elle est fausse, le rejet de
l'hypothse nulle alors qu'elle est fausse.
Dans le premier et le dernier cas, la conclusion obtenue est correcte, mais il n'en est
malheureusement pas de mme dans les deux cas intermdiaires. L'erreur qui consiste
rejeter une hypothse vraie est appele erreur de premire espce et dsigne par RH0/H0.
Accepter une hypothse fausse est une erreur de seconde espce, elle est dsigne par
AH0/H1.
Les probabilits daboutir de telles conclusions errones sont les risques de premire et de
deuxime espce, dsigns respectivement par et .
= p(RH0/H0) = p(AH0/H1)
Le risque de premire espce est appel aussi seuil de signification du test, fix trs souvent
5 %. La probabilit contraire de dsigne le niveau de confiance du test.
1- = p(AH0/H0)
1- = p(RH0/H1)
Dcision prise
Accepter H0 Accepter H1
H0 1- : erreur de premire espce
Hypothse Niveau de confiance
vraie H1 : erreur de deuxime espce 1-
Puissance du test
Un test est dit bilatral si la condition de rejet est indpendante du signe de lcart observ
entre les caractristiques compares. Les hypothses formules du test bilatral sont :
H0 : = t0 et H1 : t0
t0 = t0 t0
Rgion de rejet de H0 Rgion dacceptation de H0 Rgion de rejet de H0
A1 A2
p(A1 t0 A2) = 1 -
Un test est dit unilatral si lhypothse alternative dsigne quune caractristique est
strictement suprieure ou infrieure lautre. On parle respectivement de test unilatral
droite ou gauche.
H0 : = t0 et H1 : > t0
t0 > t0
Rgion dacceptation de H0 Rgion de rejet de H0
A
A dsigne la valeur critique qui dlimite la rgion dacceptation.
p(t0 A) = 1 -
p(t0 > A) =
H0 : = t0 et H1 : < t0
< t0 t0
Rgion de rejet de H0 Rgion dacceptation de H0
A
A dsigne la valeur critique qui dlimite la rgion dacceptation.
La rgion dacceptation est donc lintervalle [A ; + [.
p(t0 < A) =
p(t0 A) = 1 -
pour rcapituler, la dmarche dun test statistique est forme des tapes suivantes :
On attribue la valeur m0 pour moyenne dans une population dont la vraie moyenne m est
inconnue, et on veut juger la validit de cette hypothse.
Ce test a pour but de vrifier si la moyenne m dune population est ou nest pas gale une
valeur donne m0, appele norme.
Variable de dcision :
Pour une population normale dcart type connu, la variable de dcision est elle-mme
normale de moyenne m0 et dcart type. La variable de dcision centre rduite est donc :
xm0
VDR =
n
VDR est alors une variable normale rduite N(0 ; 1).
Rgion dacceptation :
a) Test bilatral :
H0 : m = m0 et H1 : m m0
Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour une distribution
normale rduite ou asymptotiquement normale rduite, Z1 et Z2 telles que :
Remarque :
VDR > Z1
2
H0 : m = m0 et H1 : m > m0
La valeur critique qui dlimitent la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR Z) = 1 - Z = Z1
H0 : m = m0 et H1 : m < m0
La valeur critique qui dlimitent la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR < Z) = Z = Z
Remarque :
Exemple :
Le diamtre des billes fabriques par une machine est en moyenne de 6 mm. Pour contrler si
la machine est bien rgle, on a prlev un chantillon de 50 billes et on a mesur leur
diamtre. On a trouv :
x i 350 x 2462
i
Pour rpondre cette question, on doit vrifier si le diamtre moyen des 50 billes observes,
est conforme la norme de 6 mm. Il sagit donc de faire un test de conformit de la moyenne.
Hypothse nulle :
Variable de dcision :
La variable de dcision peut tre considre comme une variable approximativement normale.
^ (xi x) n 50 2462
= = ( 7) = 0,24
n1 n1 49 50
^
0,24 = 0,49
VDR = x^m0 = 76 = 14,43
0.49
50
n
Rgion dacceptation :
Z = Z0,025 = -1,96
2
Z1 = Z0,975 = 1,96
2
On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. La machine nest donc pas bien rgle au seuil de signification de 95 %
Ce test a pour but de comparer les moyennes de deux populations laide de deux
chantillons.
Soient deux chantillons alatoires et non exhaustifs prlevs respectivement dans une
population 1 de moyenne inconnue m1 et dans une population 2 de moyenne inconnue m2. les
moyennes observes des deux chantillons x1 et x 2 sont en gnral diffrentes, il sagit
dexpliquer cette diffrence.
Ce test a pour but de vrifier si la moyenne m1 dune population est ou nest pas gale la
moyenne m2 dune autre population.
Variable de dcision :
La variable de dcision du test correspond la diffrence entre les moyennes observes des
deux chantillons :
VD = x1 - x 2
Une distinction est faite entre le cas de deux populations de variances ingales et le cas de
deux populations de variances gales.
(x1 x2)
VDR =
1 2
n1 n2
Est donc une variable normale rduite N(0 ; 1).
Si les distributions des populations parents sont inconnues, pour des effectifs suffisamment
levs, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la variable de dcision rduite VDR peut toujours tre considre
comme une variable de Student (n1 + n2 - 2) degr de libert.
Dans le cas o les populations sont de variances gales, une estimation de la variance
commune aux deux populations est donne par :
^
(xi x1)(xi x2)
n1 n2 2
(x1 x 2) (x1 x 2)
VDR = =
^ ^ ^
( 1 1 )
n1 n2 n1 n2
(x1 x2)
VDR =
(xi x1)(xi x 2) ( 1 1 )
n1n2 2 n1 n2
Si les distributions des populations parents sont inconnues, pour des effectifs suffisamment
levs, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la variable de dcision rduite VDR peut toujours tre considre
comme une variable de Student (n1 + n2 - 2) degr de libert.
Rgion dacceptation :
a) Test bilatral :
H0 : m1 = m2 et H1 : m1 m2
Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour des distributions
normales rduites ou asymptotiquement normales rduites, Z1 et Z2 telles que :
Remarque :
VDR > Z1
2
b) Test unilatral droite :
H0 : m1 = m2 et H1 : m1 > m2
La valeur critique qui dlimitent la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR Z) = 1 - Z = Z1
H0 : m1 = m2 et H1 : m1 < m2
La valeur critique qui dlimitent la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR < Z) = Z = Z
110 Adil ELMARHOUM
Echantillonnage et estimations
Remarque :
Pour des distributions de probabilits inconnues, et lorsque les effectifs des chantillons sont
infrieurs 30, la variable de dcision rduite VDR peut toujours tre considre comme une
variable de Student (n-1) degr de libert. Les valeurs de Z sont remplaces par les valeurs
de T de la loi de Student avec (n-1) degr de libert.
Exemple :
Pour savoir sil existe une diffrence dassiduit entre les filles et les garons, on a choisi de
manire alatoire et simple un premier chantillon de 10 filles et de faon indpendante, un
deuxime chantillon de 10 garons. En fonction des rsultats ci-dessous relatifs aux notes
dassiduits (note sur 100), et en supposant que les variances des deux populations sont
gales, peut-on conclure, au seuil de 5 %, lexistence dune diffrence significative entre les
deux sexes ?
Assiduit 72 67 52 54 46 58 59 54 58 63
des filles
Assiduit 66 59 54 57 63 55 61 55 66 75
des garons
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si lassiduit moyenne m1 des filles est ou nest pas gale
lassiduit moyenne m2 des garons.
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc:
(x1 x2) 58,361,1
VDR = = = - 0,88
514,1390,9 1 1
(xi x1)(xi x 2) ( 1 1 ) ( )
10102 10 10
n1n2 2 n1 n2
Rgion dacceptation :
VDR = 0,88
VDR < t1 , on accepte donc lhypothse nulle. Cest dire, il ny a pas de diffrence
2
significative entre lassiduit des deux sexes.
Ce test a pour but de comparer les moyennes de deux populations laide de deux
chantillons associs par paires. Cest le cas o on soumet les mmes individus, choisis dans
une population donne, deux types dobservations.
Ce test a pour but de vrifier si la moyenne m1 dune population sous une forme donne est ou
nest pas gale la moyenne m2 de la mme population sous une autre forme.
Variable de dcision :
Soient deux sries de n observations chacune, x1, x2, , xn, et y1, y2, , yn . On travaille avec
la srie des diffrences :
di = xi yi
Rgion dacceptation :
La rgion dacceptation est identique celle du test prcdent. Elle dpend toujours de
lhypothse alternative H1.
a) Test bilatral :
H0 : m1 = m2 et H1 : m1 m2
Remarque :
VDR > Z1
2
b) Test unilatral droite :
H0 : m1 = m2 et H1 : m1 > m2
H0 : m1 = m2 et H1 : m1 < m2
Remarque :
Pour des distributions de probabilits inconnues, et lorsque les effectifs des chantillons sont
infrieurs 30, la variable de dcision rduite VDR peut toujours tre considre comme une
variable de Student (n-1) degr de libert. Les valeurs de Z sont remplaces par les valeurs
de T de la loi de Student avec (n-1) degr de libert.
Exemple :
Un chef de produit souhaite tester leffet dun nouvel emballage sur les ventes dun produit.
Un chantillon alatoire de 20 magasins est constitu, puis scind en deux chantillons de 10
units, coupls sur la base de leurs ventes hebdomadaires. Lun des magasins de chaque
couple propose le produit dans son nouvel emballage, tandis que lautre magasin prsente le
produit dans lancien emballage. Les ventes enregistres sont indiques dans le tableau ci-
dessous. Peut-on parler dun effet positif du nouvel emballage ?
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si, en moyenne, les ventes enregistres avec le nouvel emballage
m1 sont ou ne sont pas gales aux ventes enregistres avec lancien emballage m2.
H0 : m1 = m2 et H1 : m1 > m2
Variable de dcision :
Les deux chantillons sont associs par paires, la variable de dcision centre rduite est donc:
VDR = ^d = 320 = 2,462
410,96
d
10
n
Rgion dacceptation :
VDR = 2,462
VDR > t1 , on rejette donc lhypothse nulle. Cest dire, on peut conclure que le nouvel
emballage est plus performant que lancien.
Cest une mthode statistique pour tester l'galit de plusieurs moyennes. La mthode repose
sur les postulats suivants: les chantillons alatoires proviennent de populations distribues
normalement et ayant la mme variance. Comme ces suppositions de base ne sont pas toujours
satisfaites en pratique, l'analyste dispose aussi de mthodes dites non paramtriques pour comparer
les chantillons entre eux.
L'analyse de variance, sert effectuer le test de l'galit de plusieurs moyennes. On crit comme
suit les hypothses:
Ho: m1 = m2 = ... = mJ
En effet, l'analyse de variance est une technique d'analyse statistique qui permet de tester
globalement l'galit des moyennes de J populations normales dans lesquelles on suppose que les
variances sont gales (12 22 .... 2J 2 ), mme si elles demeurent inconnues. L'analyse de
variance constitue une extension J populations normalement distribues, J 2, du test de
comparaison des moyennes de deux chantillons indpendants.
Les modles varient selon le nombre de facteurs contrls. On aura ainsi le modle un facteur,
le modle 2 facteurs sans interaction et le modle 2 facteurs avec interaction.
On essaie de dcouvrir si un seul facteur peut expliquer ou non les variations constates dans les
observations Yij. Au dpart, on dispose d'chantillons prlevs alatoirement dans des populations
normales dans lesquelles les variances sont supposes gales ( 12 22 23 ... 2J ). Le tableau
suivant illustre la notation indice: par exemple, Y21 reprsente la deuxime observation
prleve de la premire population. Dans chaque chantillon, on a aussi calcul le total des
observations, la moyenne et la variance.
Total T1 T2 Tj
Moyenne Y1 Y2 Yj
Variance S1 S 2 S j
L'analyse de la variance dveloppe par Fisher repose sur la comparaison de deux estimateurs de
la variance commune aux J populations normales.
a) Estimation de par
2T
J nj
2
STC
Y
j1 i 1
ij Y
2T
N 1 N 1
b) Estimation de par
2M
J
2
n Y Y
j j
2M MCF SCF
j 1
J 1 J 1
c) Estimation de par
2C
Un troisime estimateur de est obtenu cette fois en combinant les variances intra-chantillons
( S12 , S22 , ..., S2J ) dj prsentes dans le tableau des donnes. La pondration attribue S2j sera
gale aux degrs de libert de cette statistique, soit n j 1, j=1, 2, ..., J. L'estimateur est appel la
moyenne des carrs due l'erreur (MCE) et il est donn par les expressions quivalentes suivantes:
J J nj
2
SCE
n j 1S2j Y
j1 i 1
ij Yj
2C MCE
j1
NJ N J NJ
Les trois sommes de carrs prsentes plus haut ne sont pas totalement indpendantes les unes des
autres. Il existe en effet un rsultat important qui montre que la somme totale des carrs est gale
la somme des deux autres sommes de carrs:
C'est cette relation qui s'appelle l'quation fondamentale de l'analyse de la variance. La variabilit
totale entre les observations est dcompose en une part due aux diffrences entre les modalits du
facteur et une part de variabilit rsiduelle.
Formules quivalentes
Pour effectuer les calculs l'aide d'une calculatrice lectronique, il est prfrable d'utiliser les
formules suivantes qui sont algbriquement quivalentes aux prcdentes:
J nj
T2
STC Yij2
j i i 1 N
J 2
T T2
j
SCF
j i n j N
Il est d'usage de prsenter les rsultats d'une analyse de variance un seul facteur dans un tableau
comme celui-ci:
Analyse de variance un facteur
Source de variation Somme des carrs Degrs de libert Moyenne des carrs
Facteur SCF J-1 MCF MCF
MCE
Erreur SCE N-J MCE
Totale SCT N-1
Quand Ho est vraie, MCF et MCE constituent deux estimateurs indpendants de de sorte que le
MCF
rapport F obit une loi de Fisher avec ( J-1 ) et ( N-J ) degrs de libert. En vertu
MCE
mme de la construction du rapport F , on devra rejeter l'hypothse nulle de l'galit des moyennes
MCF
Ho : 1 = 2 = ... = J au seuil si et seulement si la valeur de F est plus grande
MCE
que la valeur critique de la table F(J-1) et (N-J) dl.
Exemple :
Un manufacturier japonais de puces lectroniques songe implanter une nouvelle usine au Maroc
afin de desservir tout le march nord-africain. Il hsite entre trois villes: Tanger, Casablanca et
Eljadida. Selon son point de vue, le critre le plus important prendre en considration pour
dterminer l'emplacement de cette nouvelle usine est l'assiduit au travail des ouvriers.
Le manufacturier a visit au hasard dans chacune des villes considres cinq grandes usines de
fabrication et il a obtenu des administrateurs le taux d'absentisme par 3500 journes de travail.
Les rsultats sont reproduits dans le tableau ci-dessous.
Donnes numriques
A un seuil de 5%, peut-on conclure que le taux d'absentisme au travail est le mme en moyenne
dans ces 3 villes?
J nj
STC Yij2 T 141 127 ... 189 2170 8149,33
N 15
j i i 1
J T2
j
SCF T 647 688 835 2170 3908,93
nj N 5 5 5 15
j i
Source de variation Somme des carrs Degrs de libert Moyenne des carrs
Facteur 3908,93 2 1954,467 5,53
Erreur 4240,40 12 353,367
Totale 8149,33 14
A un seuil = 5%, on ne peut pas conclure que l'assiduit des travailleurs leur travail soit la
mme en moyenne dans ces 3 villes puisque la valeur observe 5,53 de F est suprieure la
valeur critique F 0,95 2 et 12 dl = 3,89 obtenue de la distribution de Fisher 2 et 12 degrs
de libert.
T2 et Y2 dsignent le total et la moyenne des observations quand le premier facteur est maintenu
son deuxime niveau (l'indice sur lequel la sommation a t effectue est remplac par un ).
Toutes les combinaisons possibles des modalits des facteurs donnent lieu IJ traitements. A
remarquer qu'il n'y a qu'une seule observation pour chaque traitement, c'est--dire une seule
valeur numrique dans chacune des cellules du tableau.
....... etc.........
Total T1 T2 .... TJ T
Moyenne Y1 Y2 .... YJ Y
Les rsultats d'une analyse de variance deux facteurs sans rptition se prsentent dans un
tableau comme celui-ci:
Analyse de variance deux facteurs sans rptition
Les diverses sommes des carrs et moyennes des carrs sont calcules l'aide des formules
suivantes:
I J
T2
STC Yij2
i 1 j1 IJ
I
Ti2 T 2
SCFA
i 1 J IJ
T2j T 2
J
SCFB
j1 I IJ
En se basant sur les rsultats prsents au tableau, on dduit que les tests sur le facteur A et sur le
facteur B s'effectuent exactement comme dans le cas de lanalyse de variance un facteur, savoir
au moyen des statistiques :
MCA
F A
MCE
MCB
F B
MCE
Exemple :
Sur le march, il existe quatre machines diffrentes, M1, M2, M3, et M4 pouvant servir
l'assemblage d'un produit haute teneur technologique. On a alors dcid de toutes les essayer et
d'utiliser les oprateurs qualifis pour comparer les dites machines. Comme ce travail exige
beaucoup de dextrit manuelle de la part de l'usager, on s'attend ce qu'il y ait des diffrences
importantes entre oprateurs et peut-tre aussi entre machines. C'est dans un ordre alatoire et en
laissant couler beaucoup de temps entre les tests que les oprateurs ont t assigns aux machines
afin de contrler l'effet d'apprentissage. Voici les temps (en minutes) mesurs lors de ces tests.
Donnes numriques
Y a-t-il des diffrences significatives au niveau 5% entre les cinq oprateurs d'une part et entre les
quatre machines d'autre part quant au temps moyen ncessaire l'assemblage de ce produit?
I J
STC Yij2 T 42 45 ... 49 921 548,95
IJ 20
i 1 j 1
I T2
i T 192 ... 194 921 131,20
SCFA J IJ 4 20
i 1
J T2
j
SCFB T 206 ... 235 921 410,15
I IJ 5 20
j 1
En examinant les valeurs F observes 51,79 et 215,87 qui sont toutes deux suprieurs aux valeurs
thoriques F 0,95 4 et 12 dl = 3,26 et F 0,95 3 et 12 dl = 3,49 on peut rejeter les deux
hypothses nulles et conclure qu'il y a d'une part, des diffrences significatives entre les cinq
oprateurs quant au temps moyen ncessaire l'assemblage de ce produit et d'autre part, des
diffrences significatives entre les quatre machines.
Bien des recherches ont pour but d'tudier l'impact de plusieurs facteurs sur le rsultat d'une
exprience. Dans ce qui suit on tentera de dcouvrir si deux facteurs A et B peuvent expliquer
ou non les variations constates dans les observations Yijk.
Les rsultats d'une analyse de la variance deux facteurs avec rptitions sont habituellement
prsents dans un tableau comme celui-ci
.
Analyse de variance deux facteurs avec rptitions
Les sommes des carrs et les moyennes des carrs sont calcules l'aide des formules
suivantes:
I J K
T2
STC Yijk2
i 1 j1 k1 IJK
I
Ti2 T 2
SCFA
i 1 JK IJK
T2j T 2
J
SCFB
j1 IK IJK
I 2 J I 2
Tij Ti2 J
Tj T2
SCI
i 1 j1 K i 1 JK j 1 IK IJK
En se basant sur les rsultats prsents au tableau, on dduit que les tests sur la prsence
dinteraction, sur le facteur A et sur le facteur B s'effectuent exactement comme dans le cas de
lanalyse de variance un facteur, savoir au moyen des statistiques :
~
F I MCI
MCE
~
FA MCA
MCE
~
FB MCB
MCE
124 Adil ELMARHOUM
Echantillonnage et estimations
L'analyse de variance doit vrifier en premier lieu si l'interaction entre les deux facteurs est
importante; si la rponse est ngative, on pourra considrer ensuite les deux autres tests
disponibles dans le tableau de l'analyse de la variance.
La prsence dinteraction entre les deux facteurs signifie que les rsultats sous les niveaux
d'un facteur se comportent diffremment selon les diffrents niveaux de l'autre facteur.
Exemple :
Il est difficile de prdire le temps ncessaire pour apprendre programmer en langage C++.
On a demand 24 programmeurs qui ne connaissaient pas ce langage de prdire le nombre
dheures ncessaires pour apprendre les principales commandes en langage C++ et effectuer
ensuite un certain projet. Les programmeurs ont t classifis selon leur type dexprience et
leur nombre dannes dexprience. Quand le projet fut termin, tous sans exception avaient
sous-estim le temps effectivement requis pour accomplir cette tche. Dans le tableau qui
suit, on a ces erreurs de prvision (en heures).
Donnes numriques
Que ce soit sous l'angle Type d'exprience ou Nombre d'annes d'exprience, existe-t-il
globalement des diffrences significatives entre les groupes?
L'analyse de ces donnes doit vrifier en premier lieu si l'interaction entre les deux facteurs
est importante; si la rponse est ngative, on pourra considrer ensuite les deux autres tests
disponibles dans le tableau de l'analyse de la variance et rpondre aux deux questions ci-
dessus.
I J K 2
STC Yijk T 25 12 ... 24 508 2737,33
i 1 j 1k 1 IJK 24
I T2
i T 167 341 508 1261,50
SCFA JK IJK 12 24
i 1
2
J T j
SCFB T 242 149 117 508 1054,08
j 1 IK IJK 8 8 8 24
2 2
I J Tij I Ti2 J T j
SCI T
i 1 j 1 K i 1 JK j 1 IK IJK
SCE STC SCFA SCFB SCI 2737,33 1261,50 1054,08 61,75 360
En examinant en tout premier lieu le test sur linteraction, on peut vrifier que la valeur FI =
1,54 est infrieure la valeur critique de la table, soit F 0,95 2 et 18 dl = 3,55. on doit
conclure qu'il n'y a pas d'interaction significative entre les deux facteurs Type d'exprience et
Nombre d'annes d'exprience.
Cette constatation justifie la poursuite de l'analyse de la variance. Comme les valeurs FA=
63,075 et FB =26,35 sont suprieures respectivement aux valeurs critiques de la table F 0,95
1 et 18 dl = 4,41 et F 0,95 2 et 18 dl = 3,55, on doit conclure qu'aussi bien sous l'angle
Type d'exprience que Nombre d'annes d'exprience, il existe globalement des
diffrences significatives entre les groupes.
Ce test a pour but de vrifier si la variance dune population est ou nest pas gale une
valeur donne 0, appele norme.
Variable de dcision :
n
(xi x)
i 1
VD = 0
La variable de dcision possde une distribution khi deux (n-1) degrs de libert.
Rgion dacceptation :
Test bilatral :
H0 : = 0 et H1 : 0
Les valeurs critiques qui dlimitent la rgion dacceptation sont 1 et 2 telles que :
p(1 VD 2) = 1 -
p(VD < 1) = /2 1 =
2
H0 : = 0 et H1 : > 0
p(VD ) = 1 - = 1
H0 : = 0 et H1 : < 0
p(VD < ) = =
Exemple :
5,1 5,2 5,2 5,4 5,9 6,3 6,3 6,8 6,9 6,9 7,0 7,0
Hypothse nulle :
Variable de dcision :
n
(xi x)
6, 6
VD = i1 = = 3,37
0 1,96
Rgion dacceptation :
Ce test a pour but de vrifier si la variance 1 dune population est ou nest pas gale la
variance 2 dune autre population.
Variable de dcision :
Soient deux chantillons alatoires et non exhaustifs prlevs dans les deux populations. La
variable de dcision du test correspond au rapport des deux variances observes des deux
chantillons :
^
VD = 1
^
2
La variable de dcision sui une loi de Fisher avec (n1-1) et (n2-1) degr de libert.
Les tables de la loi de Fisher ne donnent que des valeurs suprieures lunit. Cest la raison
pour laquelle la variable de dcision correspond au rapport de variances qui est suprieur
lunit, do lchantillon 1 est celui qui a la plus grande variance.
Rgion dacceptation :
Le test dgalit de deux variances est en gnral un test bilatral. Il prcde gnralement le
test de comparaison des moyennes de deux chantillons indpendants.
H0 1 = 2 et H1 1 2
Les valeurs critiques qui dlimitent la rgion dacceptation sont F1 et F2 telles que :
p(F1 VD F2) = 1 -
Les tables de la loi de Fisher ne donnent que des valeurs suprieures lunit, de telle sorte
que seule est possible la comparaison avec F1 , et on rejette lhypothse nulle si la variable
2
de dcision est suprieure ou gale F1 .
2
Exemple :
Pour savoir si les filles sont plus assidues que les garons ou non, on a choisi de manire
alatoire et simple un premier chantillon de 10 filles et de faon indpendante, un deuxime
chantillon de 10 garons. En fonction des rsultats ci-dessous relatifs aux notes dassiduits
(note sur 100), peut-on supposer, au seuil de 5 %, que les variances des deux populations sont
gales ?
Assiduit 72 67 52 54 46 58 59 54 58 63
des filles
Assiduit 66 59 54 57 63 55 61 55 66 75
des garons
Pour rpondre cette question, on doit raliser un test de comparaison de deux variances.
Hypothse nulle :
Ce test a pour but de vrifier si la variance 1 de la population des filles est ou nest pas gale
la variance 2 de la population des garons.
Variable de dcision :
^
57,12
VD = 1 = = 1,31
^ 43,43
2
Rgion dacceptation :
F0,975 = 4,03
On attribue la valeur p0 pour proportion dans une population dont la vraie proportion p est
inconnue, et on veut juger la validit de cette hypothse.
Ce test a pour but de vrifier si la proportion p dune population est ou nest pas gale une
valeur donne p0, appele norme.
Variable de dcision :
VD = fn
Comme, la distribution de la proportion suit une loi normale de moyenne p et dcart type
p(1 p)
condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le
n
produit n p 5, la variable de dcision rduite :
fn p0
VDR =
p0(1 p0)
n
Rgion dacceptation :
Test bilatral :
H0 : p = p0 et H1 : p p0
Les valeurs critiques qui dlimitent la rgion dacceptation sont les valeurs dune variable
normale rduite Z1 et Z2 telles que :
Remarque :
VDR > Z1
2
H0 : p = p0 et H1 : p > p0
La valeur critique qui dlimitent la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR Z) = 1 - Z = Z1
H0 : p = p0 et H1 : p < p0
La valeur critique qui dlimitent la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR < Z) = Z = Z
Exemple :
Au cours des lections, un candidat est lu avec 52 % des voix. Plusieurs mois aprs
l'lection, un institut de sondage interroge 1600 lecteurs, dont 800 dclarent qu'ils voteraient
en cas d'lection, pour le mme candidat. Ce rsultat est-il ou non significatif d'une
dsaffection des lecteurs pour l'lu ?
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas infrieur la norme de 52 %. Il sagit donc de faire un test de conformit
de la proportion.
Hypothse nulle :
Variable de dcision :
VD = fn = 800 = 0,50
1600
pq
La distribution de la proportion suit une loi normale de moyenne p et dcart type (la
n
taille de lchantillon est suprieure 30 et le produit n p > 5).
fn p0 0,500,52
VDR = = = - 1,60
p0(1 p0) 0,52(10,52)
n 1600
Rgion dacceptation :
Ce test a pour but de vrifier si la proportion p1 dune population est ou nest pas gale la
proportion p2 dune autre population.
Variable de dcision :
Il sagit de comparer deux proportions observes. Soient deux chantillons alatoires de taille
respectivement n1 et n2 extraits de deux populations. Les frquences observes fn1 et fn2
Sont gnralement diffrentes, il sagit dexpliquer cette diffrence.
f n1 X1 et f n2 X 2
n1 n2
La variable de dcision du test correspond la diffrence entre les frquences observes des
deux chantillons :
VD = fn1 fn2
Comme, les distributions des deux proportions suivent des lois normales de moyennes
p1 (1 - p1) p2 (1 - p 2)
respectivement p1 et p2 et dcarts types respectifs et condition
n1 n2
que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p 5, la
variable de dcision est elle-mme normale de moyenne (p1-p2) et dcart type
p1 (1 p1) p2 (1 p2)
.
n1 n2
X1 X 2 n1 f n1 n2 f n2
fn1+n2 = n1 n2 = n1 n2
Sous lhypothse nulle, la variable de dcision suit une loi normale de moyenne (p1-p2) = 0 et
dcart type :
p (1 p)
p (1 p)
= f n1 n2 (1 f n1 n2)( 1 1 )
n1 n2 n1 n2
f n1 f n2
VDR =
f n1 n2(1 f n1 n2)( 1 1 )
n1 n2
est donc une variable normale rduite N(0 ; 1).
Rgion dacceptation :
La rgion dacceptation est identique celle du test de conformit dune proportion, elle
dpend de lhypothse alternative H1.
Test bilatral :
H0 : p1 = p2 et H1 : p1 p2
Remarque :
VDR > Z1
2
H0 : p1 = p2 et H1 : p1 > p2
H0 : p1 = p2 et H1 : p1 < p2
Exemple :
Une enqute sur lemploi a concern 220 personnes dont 115 dans le milieu rural et 105 dans
le milieu urbain. Sur les 115 ruraux enquts, 74 se sont rvls actifs, alors que pour les
enquts urbains, 81 sont actifs. Peut-on admettre, au seuil de 5 %, quil ny a pas de
diffrence significative entre les taux dactivits dans les deux milieux ?
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes actives dans le milieu rural est
ou nest pas gale la proportion p2 des personnes actives dans le milieu urbain.
Variable de dcision :
f n1 f n2 0,640,77
VDR = = = -2,10
f n1 n2(1 f n1 n2)( 1 1 ) 1
0,70(10,70)( 1 )
n1 n2 115 105
Rgion dacceptation :
VDR > Z1 , on rejette donc lhypothse nulle. Cest dire, il y a une diffrence
2
significative entre les taux dactivits dans les deux milieux.
Ce test a pour but de vrifier si les proportions p1, p2, ... pk de k populations sont gales. On
crit comme suit les hypothses:
Ho: p1 = p2 = ... = pk
Variable de dcision :
Effectifs observs
Sous lhypothse nulle p1 = p2 = ... = pk, il y a la mme proportion inconnue p dans les k
populations. Cette proportion peut tre estime par la frquence observe f dans lchantillon
unique qui est la runion des k chantillons.
n11n21...nk1
f = n1.n2....nk.
sous lhypothse nulle, les effectifs thoriques sont :
Effectifs thoriques
On est amen confronter les effectifs observs et les effectifs thoriques. On calcule la
variable de dcision VD :
k
(ni1 fni.) (ni2 (1 f)ni.)
VD = [
fni.
(1 f)ni.
]
i1
On peut dmonter que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert.
Rgion dacceptation :
La variable de dcision est nulle lorsque les effectifs observs sont touts gales aux effectifs
attendus, cest dire, lorsquil y a concordance absolue entre la distribution observe et la
distribution thorique. La valeur de la variable de dcision est dautant plus grande que les
carts entre les effectifs observs et attendus sont plus grands. La valeur critique qui dlimite
la rgion dacceptation est telle que :
p(VD < ) = 1 - = 1-
Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1- avec (k-1) degrs de libert.
Exemple :
Lors dune campagne lectorale, un parti politique a effectu un sondage pour valuer les
intentions de vote en faveur de ce parti. Quatre chantillons indpendants ont t choisis dans
quatre villes diffrentes. On a obtenu les rsultats suivants :
Ho: p1 = p2 = p3 = p4
Variable de dcision :
945860 43
f = 334288312 240 = 0,22
Effectifs thoriques
VD =
(94 73,48) (240 260,52) (5863,36) (230 224,64) (60 68,64) (252 243,36)
73,48 260,52 63,36 224,64 68,64 243,36
La variable de dcision est une variable alatoire Khi deux avec 3 degrs de libert.
Rgion dacceptation :
k k
H0 : ni = npi avec ni = npi = n
i 1 i 1
Variable de dcision :
On distingue deux cas dapplication de ces tests, selon que la distribution thorique est ou
nest pas compltement dfinie. Dans le premier cas, la variable de dcision peut tre calcule
immdiatement. Dans le second cas, la distribution de probabilit de la population nest
dfinie quen fonction dun ou de plusieurs paramtres, ceux-ci doivent pralablement tre
estims partir des donnes de lchantillon.
Les effectifs attendus doivent tre tous suprieurs ou gales 5. quand cette condition nest
pas remplie, on peut regrouper des classes voisines, de manire augmenter les effectifs
attendus.
On peut dmonter que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert. k correspond au nombre de calasses aprs regroupement.
k
ni
VD = npi - n
i 1
Cas dune distribution incompltement dfinie :
Lorsque la distribution thorique nest pas compltement dfinie, le ou les paramtres qui
caractrisent cette distribution doivent tout dabord tre estims. On peut calculer ensuite les
^ ^
probabilits estimes pi , les effectifs attendus correspondants n pi , et la valeur de dcision :
k
ni
VD = i 1 ^ - n
n pi
Le nombre de degr de libert (k-1) doit tre rduit du nombre de paramtres estims.
Rgion dacceptation :
La variable de dcision est nulle lorsque les effectifs observs sont touts gales aux effectifs
attendus, cest dire, lorsquil y a concordance absolue entre la distribution observe et la
distribution thorique. La valeur de la variable de dcision est dautant plus grande que les
carts entre les effectifs observs et attendus sont plus grands. La valeur critique qui dlimite
la rgion dacceptation est telle que :
p(VD < ) = 1 - = 1-
Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1-.
Exemple :
Le tableau suivant donne la distribution de frquences des nombres de garons observs dans
1600 familles de 4 enfants, considres comme choisies au hasard au sein dune trs large
population. En fonction de ces rsultats, peut-on affirmer, au seuil de 5 %, que le nombre de
garons suit une loi binomiale ?
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la une distribution binomiale.
Hypothse nulle :
k k
H0 : ni = npi avec ni = npi = n
i 1 i 1
Variable de dcision :
La probabilit davoir un garon est suppose gale 0,5, la loi binomiale qui caractrise le
nombre de garons dans une famille de 4 enfants a pour paramtre 4 et 0,5.
x
p ( x) C n
p x q n x
x p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
Total 1
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
x ni npi
0 113 100
1 367 400
2 576 600
3 426 400
4 118 100
Total 1600 1600
Les effectifs thoriques sont tous suprieures 5, on peut calculer la variable de dcision :
k
ni
np
VD = i -n
i 1
VD =
113 367 576 426 118 - 1600 = 10,3
100 400 600 400 100
Rgion dacceptation :
Pour des chantillons alatoires et simples, si les deux critres de classification sont
indpendants, les probabilits pij de la distribution deux dimensions peuvent tre estimes
par :
^ ni. n.j
pij fi. f.j avec fi. =
n et f.j =
n sont les frquences relatives marginales.
ni. et n.j sont les effectifs marginaux, et nij les effectifs conjoints.
Les effectifs attendus correspondants sont donc :
^ ni.n.j
ni. n.j
n pij = n fi. f.j = n n n = n
les effectifs attendus doivent touts tre suprieurs ou gales 5.
^
H0 : nij = n pij
Variable de dcision :
la comparaison des effectifs observs et attendus se fait comme pour les tests dajustement, en
calculant la variable de dcision suivante :
p q
nij
VD = ^ -n
i 1 j 1 n p
ij
On dmontre que la variable de dcision est une variable alatoire Khi deux avec (p-1)(q-1)
degr de libert.
Rgion dacceptation :
p(VD < ) = 1 - = 1-
Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1-.
Exemple :
Un tour oprateur souhaite segmenter son march. Il se demande sil existe un lien entre le
choix dune destination de vacances et le niveau dinstruction. Les donnes recueillies ont t
structures sous forme de d tableau de contingence.
Hypothse nulle :
^
H0 : nij = n pij
Variable de dcision :
^ ni.n.j
Les effectifs attendus sont estims par la formule : n pij =
n
Niveau Destination de vacances
dinstruction Mer Montagne Dsert Total
Primaire 270 112,5 67,5 450
Secondaire 210 87,5 52,5 350
Suprieur 120 50 30 200
Total 600 250 150 1000
p q
nij
VD = ^ - n = 300 50 100 250 ... 30 - 1000 = 220,91
i 1 j 1n p 270 112,5 67,5 210 30
ij
Rgion dacceptation :
Ex 1 : Un fabricant de tubes essais pour laboratoire fonde sa publicit sur le fait que la
dure de vie de ses tubes correspond 1500 heures de chauffage laide d'un bec Bunzen. Un
laboratoire de contrle de publicit constate que sur 100 tubes essais, la dure moyenne de
vie est de 1485 heures de chauffage avec un cart-type de 110 heures. Au risque 5%, la dure
de vie des tubes essais est-elle diffrente de 1500 heures de chauffage ?
Ex 2 : L'exprience suivante a t ralise par Weldon : il a lanc un d 315 672 fois, il a tir
106 602 fois l'une des faces 5 ou 6 Peut-on accepter l'hypothse selon laquelle le d est
quilibr, au risque de 5% ?
Ex 3 : Le directeur de ventes dun laboratoire pharmaceutique veut savoir sil existe des
diffrences significatives entre les rgions en terme de niveau daccueil dun nouveau produit.
Les rsultats suivants ont t obtenus auprs dun chantillon alatoire de clients :
Rgions
Niveau daccueil Nord Est Sud Ouest
Faible 22 35 0 5
Modr 84 55 8 24
Elev 25 17 22 12
Ex 4 : Les moteurs des appareils lectromnagers d'une marque M ont une dure de vie
moyenne de 3000 heures avec un cart-type de 150 heures. la suite d'une modification dans
la fabrication des moteurs, le fabriquant affirme que les nouveaux moteurs ont une dure de
vie suprieure celle des anciens. On a test un chantillon de 50 nouveaux moteurs et on a
trouv une dure de vie moyenne de 3250 heures avec un cart-type gal 150 heures. Les
nouveaux moteurs apportent-ils une amlioration dans la dure de vie des appareils
lectromnagers au risque de 1% ?
Ex 5 : Dans une grande ville d'un pays donn, une enqute a t ralise sur les dpenses
mensuelles pour les loisirs. On a observ les rsultats suivants:
Sur 280 familles habitant le centre-ville, les dpenses mensuelles pour les loisirs sont en
moyenne de 640 dh avec un cart-type de 120 dh.
Sur 300 familles habitant la banlieue, les dpenses mensuelles pour les loisirs sont en
moyenne de 610 dh avec un cart-type de 100 dh.
Peut-on dire au risque de 5 % que la part du budget familial consacr aux loisirs est diffrente
suivant que la famille habite le centre-ville ou la banlieue ?
Ex 8 : Pour une lection, on effectue un sondage pour valuer les intentions de vote en faveur
du candidat M. Dans la ville de casa, sur 450 personnes interroges, 52% ont l'intention de
voter pour M. Dans la ville de rabat, sur 300 personnes interroges, 49 % ont l'intention de
voter pour M. Au risque de 5%, y a-t-il une diffrence d'intention de vote dans ces deux
villes?
Ancienne mthode: 48, 46, 47, 43, 46, 45, 49, 46, 47, 44.
Nouvelle mthode: 56, 49, 53, 51, 48, 52, 55, 53, 49, 50.
La nouvelle mthode de promotion a-t-elle un effet positif sur les ventes ( = 5%)?
Ex 12 : Dans le but de contrler le poids net des sachets d'un produit alimentaire, on a prlev
deux chantillons respectivement de 10 et 12 sachets, on a obtenu les rsultats suivant (en
grammes) :
ch 1 190 200 202 195 194 208 205 196 198 206
ch 2 210 204 203 189 194 195 206 205 200 201 198 197
Ces deux rsultats sont-ils significativement diffrents en ce qui concerne le poids moyen %
Ex 13 : Au concours dentre une cole, lpreuve de culture gnrale est note de 0 50.
on tire au hasard un chantillon de 100 candidats et lon relve que les notes quils ont
obtenues se classent en cinq tranches de la manire suivante :
Le jury se demande sil est justifi de considrer que la distribution des notes suit une
loi normale dans la population de tous les candidats.
Ex 15 : L'exprience suivante avait pour but d'analyser l'impact des 2 facteurs Sexe et
ge sur la consommation d'un certain produit de luxe. Dans chacun des 6 groupes, le
produit a t offert 100 personnes choisies au hasard. La consommation, en nombre
dunits achetes, est donne dans le tableau qui suit:
On suppose que les nombres dunits achetes obissent des lois normales, que les variances
sont gales dans ces six populations.
Quant au nombre dunits achetes en moyenne, peut-on affirmer au niveau = 0.01 qu'il y a une
diffrence significative entre hommes et femmes d'une part, et entre les trois groupes d'ge, d'autre
part?
Ex 17 : Une machine fabrique des pices identiques. La moyenne des poids de 50 pices
prleves dans la production est 68,2 grammes avec un cart-type de 2,5 grammes. On
effectue un rglage sur la machine. On prlve un nouvel chantillon de 50 pices. On trouve
un poids moyen de 67, 5 grammes avec un cart-type de 2, 8 grammes. Peur-on affirmer, au
risque 5 % que le rglage a modifi le poids des pices ?
Ex 18 : Les ventes quotidiennes d'ordinateurs ralises par une socit informatique durant
les 3 premiers mois de 2001, du lundi au jeudi sont comme suit :
En supposant les conditions de lanalyse de la variance satisfaites, peut-on dire quil y a une
diffrence significative un seuil de 5% entre les moyennes des ventes ralises chaque mois et
entre les moyennes des ventes ralises chaque jour ?
hommes femmes
Possdent le bac 32 26
ne possdent pas le bac 64 78
Ex 21 : Une enqute a t ralise au prs dun chantillon de 500 individus prlev au sein
dune population cible de 4 millions d'individus. Les donnes que l'on possde sur cette
population sont les suivantes :
Hommes 48% soit 1,92 millions dhommes
Femmes 58% soit 2,08 millions de femmes
Au dpouillement, on a trouv que les individus qui ont form lchantillon ont les
caractristiques suivantes :
Ex 22 : Dans une population, on interroge un chantillon alatoire de 400 personnes dont 160
sont ges de 18 40 ans et 240 sont ges de plus de 40 ans. On a trouv que le pourcentage
des personnes propritaires de leur logement dans les deux groupes sont respectivement 35%
et 45%. Ces deux rsultats sont-ils significativement diffrents au seuil de signification de
5% ?
Nombres darrives 0 1 2 3 4 5 6 7 8 9 10
Frquences absolues observes 1 4 12 18 22 17 11 6 4 3 2
Peut-on ajuster cette distribution une la loi normale de moyenne 7,75 mm, et dcart
type 0,94 mm ? (seuil de signification de 5 %)
b) Quelques mois aprs deux instituts de sondage interrogent nouveau les lecteurs. Pour
l'institut X, qui a interrog 1600 personnes, le candidat A ne recueillerait que 47 % des
suffrages. Pour l'institut Y, qui a interrog 2500 personnes, A recueillerait 50 % des
suffrages.