Professional Documents
Culture Documents
Matthias Rieger
Graduate Institute, Geneva
World Bank
Introduction
Comment construire un échantillon permettant de
détecter de manière crédible un effet significatif ?
Quels groupes ou quelle population nous intéressent et où les
trouver ?
Combien de communes, villages, ménages et personnes faut-il
interviewer/observer dans cette population ?
Quelles en sont les conséquences sur le budget de l'évaluation ?
Attention !
Cette présentation n'a pas la prétention de faire de vous un
expert en échantillonnage
Elle ne cherche pas non plus à vous compliquer la vie!
Il s'agit plutôt de répondre à la question générale : Comment les
composantes de l'échantillonnage affectent-elles ce qu’une
évaluation d'impact peut nous apprendre?
Plan de présentation
1. Cadre d'échantillonnage
Quels groupes ou quelles populations nous intéressent
?
Comment les trouve-t-on ?
2. Taille de l'échantillon
Pourquoi est-ce si important : crédibilité des résultats
Déterminants de la taille adéquate d’un échantillon
Autres questions
Exemples
3. Budgets
Cadre d'échantillonnage
Qui nous intéresse ?
a) Communes/quartiers (fonctionnaires des communes)
b) Villages (chefs des villages)
c) Ménages (chefs des ménages)
d) Individus
e) Enfants, femmes
1. Cadre d'échantillonnage
Quels groupes ou quelles populations nous intéressent ?
Comment les trouve-t-on ?
2. Taille de l'échantillon
Pourquoi est-ce si important : crédibilité des résultats
Déterminants de la taille adéquate d’un échantillon
Autres questions
Exemples
3. Budgets
Taille de l'échantillon et
crédibilité des résultats
Commencer par une question plus simple que l'impact
du programme
Si par exemple nous voulons savoir quel est la
moyenne de revenu agricole des ménages pour
évaluer un programme d’engrais modernes…
Option 1 : Nous interrogeons cinq ménages et nous
utilisons la moyenne de leurs réponses
Option 2 : Nous interrogeons 1000 ménages et nous
utilisons la moyenne de leurs réponses
15
Calcul de la taille de
l'échantillon
Variance des résultats
Comment la connaître avant de décider de la taille de
l'échantillon et avant de collecter nos données ?
Idéalement, données préexistantes
Souvent...inexistantes
Possibilité d'utiliser des données préexistantes provenant
d'une population similaire
Exemples : Enquêtes des ménages/communes/villages
Strates
Sous-populations
Strates courantes: espaces géographiques, sexe,
secteurs, valeurs initiales de la variable de résultat
L'assignation au traitement (ou l'échantillonnage) se
déroule au sein de ces groupes
Pourquoi faut-il des strates ?
Un exemple géographique
Quel est l'impact dans une région particulière ?
Parfois difficile à déterminer avec certitude
=T
=C
Pourquoi faut-il des strates ?
Participation
Une faible participation augmente la taille de l'effet
détectable
Un effet ne se détecte que s'il est vraiment important
Réduit efficacement la taille de l'échantillon
Exemple de code STATA pour détecter une augmentation de 10% des revenus 50$ -> 55$ :
sampsi 50 55, p(0,8) pre(1) post(1) r1(0,5) sd1(50) sd2(50)
Disponibilité de données de référence et de suivi aide à réduire la taille nécessaire pour l’échantillon (pré et
post)
Résultats
Augmentation de 10% (de 50 à 55) : 1 178 ménages de chaque groupe
Augmentation de 20% (de 50 à 60) : 295 ménages de chaque groupe
Augmentation de 50% (de 50 à 75) : 48 ménages de chaque groupe (mais cette taille d'effet n'est pas réaliste)
En bref
1. Cadre d'échantillonnage
Quels groupes ou quelles populations nous intéressent ?
Comment les trouve-t-on ?
2. Taille de l'échantillon
Pourquoi est-ce si important : crédibilité des résultats
Déterminants de la taille adéquate d’un échantillon
Autres questions
Exemples
3. Budgets
Budgets
Que faut-il prévoir ?
Questions ?