You are on page 1of 19

Statistique

Facult des Sciences et Techniques de Marrakech

Comparaisons statistiques

I- Tests d'hypothse II- Tests usuels de comparaison un standard III- Comparaison sur chantillons de deux populations normales

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Thorie de Neyman et Pearson : On suppose donne une certaine variable alatoire X dont la loi de probabilit dpend des hypothses que lon dsire tester. Plus prcisment, on suppose quil existe plusieurs hypothses H0, H1, ..., Hn parfaitement connues et que la loi de probabilit dpend de lhypothse vraie. Le test va permettre de porter un jugement sur lhypothse faite et dvaluer le degr de validit du jugement, cela partir de la valeur prise par X.

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Thorie de Neyman et Pearson : Nous tudierons dabord le cas o lon fait deux hypothses simples H0 et H1. Etat ralis H0 est ralis Jugement port H0 est vraie H1 est vraie Jugement correct Jugement faux Jugement faux Jugement correct H1 est ralis

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Thorie de Neyman et Pearson : On relie maintenant le jugement port lobservation de la variable X, on opre ainsi : - on dit que H0 est vraie si la valeur observe de X, soit x, se trouve dans un certain domaine w, appel rgion dacceptation de lhypothse H0 - on dit que H1 est vraie si la valeur observe nappartient pas w Etat ralis H0 est ralis Jugement port H0 est vraie H1 est vraie Xw Xw Jugement correct 1- Jugement faux Jugement faux Jugement correct 1- H1 est ralis

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Thorie de Neyman et Pearson : Un tel mode de raisonnement est appel test dhypothse. Pour choisir le domaine w, on impose en gnral deux conditions : - que la probabilit de commettre lerreur de premire espce (en considrant comme dfavorable ce qui est favorable) soit gale un seuil dtermin choisi a priori aussi faible quon le veut. - que la probabilit de commettre lerreur de deuxime espce (en considrant comme favorable ce qui ne lest pas) soit minimale. La puissance dun test est gale 1-.

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Test droite - Test symtrique : Sil sagit de comparer deux hypothses de la forme : H0 : = 0 et H1 : > 0 On est conduit ce quon appelle un test droite, o le risque de premire espce est bloqu droite.

Les tests dhypothse de la forme : H0 : = 0 et H1 : < 0 conduisent un test gauche.

Comparaisons statistiques

I. Tests d'hypothse :
I.1. Test droite ( gauche) - Test symtrique : Dans le cas dhypothses de la forme H0 : = 0 et H1 : 0, il apparait logique de rpartir le risque aux deux extrmits de la distribution. Le test est alors un test symtrique.

Comparaisons statistiques

II. Tests usuels de comparaison un standard :


II.1. Comparaison de la moyenne dune population normale, de variance 2 connue, une valeur donne 0 Nous avons un test de la forme H0 : = 0 et H1 : 0, Dans lhypothse H0, la moyenne M suit un loi normale de moyenne 0 et de variance 2/n. La variable (M- 0)/(/n) est une loi normale centre rduite. On fixe un risque que nous conviendrons de considrer comme ngligeable. Il en rsulte un certain intervalle [-u/2,u/2] dans lequel la variable U a une probabilit (1-) de tomber si lhypothse est exacte et, par consquent, hors duquel U a une probabilit petite de tomber. Ngliger cette probabilit , cest considrer quil est impossible de trouver U en dehors de lintervalle [-u/2,u/2], si l'hypothse est vraie.

Comparaisons statistiques

II. Tests usuels de comparaison un standard :


II.1. Comparaison de la moyenne dune population normale, de variance 2 connue, une valeur donne 0 On calcule partir des donnes de l'chantillon effectivement obtenu (x1, ... , xn) la valeur u de U et on la situe par rapport l'intervalle [-u/2,u/2]. On conclut alors de la faon suivante : - si u tombe l'extrieur de l'intervalle, on prfre rejeter l'hypothse, en sachant toutefois qu'on assume le risque de la rejeter tort. - si u tombe l'intrieur de l'intervalle, cela ne signifie nullement, hlas, que l'hypothse faite est vraie, mais seulement que les donnes recueillies ne sont pas en contradiction avec cette hypothse.

Comparaisons statistiques

II. Tests usuels de comparaison un standard :


II.2. Comparaison de la variance dune population normale une valeur donne 02 Faisant lhypothse : H0 = 2 = 02 La quantit (i=0,n)[(Xi - Mn)2 / 02] = nS2/02 suit une loi de 2 (n - 1) degrs de libert. Il en rsulte que, si lhypothse est vraie, nS2/02 a la probabilit (1-) de tomber dans l'intervalle [12,22] o 12 et 22 sont lus dans la table de la loi du 2 (n 1) degrs de libert. Il suffit alors, comme prcdemment, de calculer la valeur ns2/02 partir des observations, de la placer par rapport lintervalle [12,22] et de conclure.

Comparaisons statistiques

II. Tests usuels de comparaison un standard :


II.3. Comparaison de la moyenne dune population normale (de variance inconnue) une valeur donne 0 Nous avons un test de la forme H0 : = 0 et H1 : 0, Dans lhypothse H0, la variable (M- 0)/[(n/n-1)S2/n] est une loi de Student (n-1) degrs de libert. Le est revient placer t = (m- 0)/(*/n) par rapport lintervalle [-t/2,t/2] lu dans la table de Student (n-1) degrs de libert et de conclure.

Comparaisons statistiques

III. Tests usuels de comparaison un standard :


II.4. Test des appariements Imaginons quon veuille confronter deux appareils de mesure et que, pour ce faire, on utilise n supports en procdant, sur chacun deux, deux mesures laide des deux appareils soumis examen. Les deux mesures seront dites apparies et les rsultats obtenus se prsenteront, en dfinitive, comme suit : mesures 1 : x1, x2, ... , xi , ... , xn mesures 2 : y1, y2, ... , yi , ... , yn Soit di la diffrence di = (yi - xi) et soient md et d* la moyenne et l'cart-type estims des diffrences. On admet que les di sont des ralisations dune variable D qui suit une loi normale. Le test de lhypothse H0 : E(D) = 0 (pas dinfluence du traitement ou pas de diffrence entre les appareils de mesures) est le test prsent au paragraphe prcdent avec 0 = 0.

Comparaisons statistiques

III. Comparaison sur chantillons de deux populations normales :


III.1. Comparaison des variances de deux populations normales Soient n1 et s12 la taille et la variance de lchantillon extrait de la premire population, et soient n2 et s22 la taille et la variance de lchantillon extrait de la deuxime population. Nous savons que les estimations sans biais des variances 12 et 22 des deux populations scrivent : 1*2 = n1s12/(n1-1) 2*2 = n2s22/(n2-1) Dans lhypothse dgalit des variances des deux populations : 12 = 22 = 2, ces deux estimations ne diffrent quen raison des alas de lchantillonnage. Il en est de mme de leur quotient f = 1*2 /2*2 qui ne diffre de 1 qu cause des alas de lchantillonnage.

Comparaisons statistiques
III. Comparaison sur chantillons de deux populations normales :
III.1. Comparaison des variances de deux populations normales Le statisticien Snedecor, auteur du test classique que nous allons prsenter, a retenu cette forme et calcul la loi de probabilit de la variable : F(1, 2) = (12 / 1)/ (22 / 2) o 12 et 22 sont deux variables alatoires indpendantes qui suivent des lois du 2 1 et 2 degrs de libert. Dans lhypothse dgalit des variances des deux populations, on a :

suit une loi de Snedecor (n1-1) et (n2-1) degrs de libert. Par consquent, la quantit : f = 1*2 /2*2 est une ralisation, si lhypothse dgalit des variances est vrifie, dune loi de Snedecor.

Comparaisons statistiques
III. Comparaison sur chantillons de deux populations normales :
III.1. Comparaison des variances de deux populations normales Cette loi dfinie, la suite des oprations est maintenant bien connue. Se fixant un seuil de probabilit ngligeable, on lit dans la table de Snedecor (n1-1) et (n2-1) degrs de libert les valeurs f1 et f2 correspondant au dessin ci-dessous.

Comparaisons statistiques
III. Comparaison sur chantillons de deux populations normales :
III.2. Estimation de 2 En admettant que le rsultat du test prcdent ne soppose pas lhypothse dgalit des variances, il peut savrer utile destimer la valeur commune 2 des variances des deux populations. 1*2 = n1s12/(n1-1) 2*2 = n2s22/(n2-1) Puisque, dans l'hypothse d'galit des variances, n1s12/2 et n2s22/2 sont des variables indpendantes qui suivent des lois du 2 , respectivement (n1-1) et (n2-1) degrs de libert, leur somme (n1s12+ n2s22)/2 suit une loi du 2 (n1+n2-2) degrs de libert. Par consquent, la quantit : *2 = (n1s12+ n2s22)/ (n1+n2-2) calcule partir des observations, est une estimation sans biais de 2, la variance commune aux deux populations.

Comparaisons statistiques
III. Comparaison sur chantillons de deux populations normales :
III.3. Comparaison des moyennes de deux populations normales Soient deux populations normales P1 et P2 de moyennes 1 et 2, mais de mme variance 2. Soient n1 et n2 les tailles de deux chantillons prlevs au hasard respectivement dans chacune de ces deux populations.

Comparaisons statistiques
III. Comparaison sur chantillons de deux populations normales :
III.3. Comparaison des moyennes de deux populations normales - m1 est une ralisation dune variable M1 normale, de moyenne 1 et de variance 2/n1 - m2 est une ralisation dune variable M2 normale, de moyenne 2 et de variance 2/n2 - s12 et s22 sont des ralisations de variables S12 et S22 telles que la variable (n1s12+ n2s22)/2 suit une loi du 2 (n1+n2-2) degrs de libert et est indpendante de M1 et M2. Par consquent t = (m1-m2)/[*/(1/n1)+(1/n2)] est une ralisation dune loi de Student quil suffit, pour conclure, de placer par rapport lintervalle [-t/2,t/2] correspondant au risque choisi. Si t nappartient pas lintervalle, on dit souvent que la diffrence entre les moyennes observes est significative au risque et, sinon, quelle nest pas significative.

You might also like