Guide Pratique D'échantillonnage Pour Les Évaluations D'impact

Guide pratique d'échantillonnage
pour les évaluations d'impact
Matthias Rieger
Graduate Institute, Geneva
World Bank
Introduction
 Comment construire un échantillon permettant de
détecter de manière crédible un effet significatif ?
 Quels groupes ou quelle population nous intéressent et où les
trouver ?
 Combien de communes, villages, ménages et personnes faut-il
interviewer/observer dans cette population ?
 Quelles en sont les conséquences sur le budget de l'évaluation ?
 Attention !
 Cette présentation n'a pas la prétention de faire de vous un
expert en échantillonnage
 Elle ne cherche pas non plus à vous compliquer la vie!
 Il s'agit plutôt de répondre à la question générale : Comment les
composantes de l'échantillonnage affectent-elles ce qu’une
évaluation d'impact peut nous apprendre?
Plan de présentation
1. Cadre d'échantillonnage
 Quels groupes ou quelles populations nous intéressent
?
 Comment les trouve-t-on ?
2. Taille de l'échantillon
 Pourquoi est-ce si important : crédibilité des résultats
 Déterminants de la taille adéquate d’un échantillon
 Autres questions
 Exemples
3. Budgets
Cadre d'échantillonnage
 Qui nous intéresse ?
a) Communes/quartiers (fonctionnaires des communes)
b) Villages (chefs des villages)
c) Ménages (chefs des ménages)
d) Individus
e) Enfants, femmes
 Garder à l'esprit la validité externe

 Les conclusions tirées d'une population peuvent-elles être utiles pour
préparer des mesures à portée nationale ?
 Il faut aussi garder à l'esprit la faisabilité et ce que vous voulez

apprendre
 Il peut ne pas être possible ou souhaitable de piloter un programme ou
une politique dont le champ d’application est extrêmement large
Cadre d'échantillonnage : Déterminer
quelles sont les unités qui nous intéressent
 Fonction de la taille et du type d'expérience

 Sélection aléatoire parmi les candidats
 Exemple : Programme de dévelopment communautaire (CDD) dans 100 communes
rurales d’un pays. Choix aléatoire de 50 communes qui recevront le traitement
 Possibilité d'utiliser des unités de traitement et de comparaison à partir du pool de
communes
 Villages/ménages: Il faut prendre un échantillon pour mesurer l'impact
 Changement de politique
 Exemple : un changement du montant de la taxe de marché dans un échantillon aléatoire
de communes rurales
 Pour mesurer l'impact sur les marchands, on ne peut pas échantillonner tous les
marchands du marché dans les communes de traitement et dans les communes de
comparaison
 Il faudra prendre un échantillon de marchands au sein des communes
 Informations nécessaires avant de prendre un échantillon
 Une liste exhaustive de toutes les unités d'observation disponibles pour
l'échantillonnage dans chaque zone ou chaque groupe (liste des communes,
villages et ménages)
Plan de présentation
 Quels groupes ou quelles populations nous intéressent ?
 Exemples
3. Budgets
Taille de l'échantillon et
crédibilité des résultats
 Commencer par une question plus simple que l'impact
du programme
 Si par exemple nous voulons savoir quel est la
moyenne de revenu agricole des ménages pour
évaluer un programme d’engrais modernes…
 Option 1 : Nous interrogeons cinq ménages et nous
utilisons la moyenne de leurs réponses
 Option 2 : Nous interrogeons 1000 ménages et nous
utilisons la moyenne de leurs réponses
 Quelle sera la moyenne la plus proche de la vraie

moyenne ?
 1 000 Ménages
 Cinq Ménages
Revenus Agricoles Ménages Revenus Agricoles Ménages
$0 - $10 1 $0 - $10 70
$ 10 -$50 2 $ 10 -$50 150
$50-100 1 $50-100 650
$100 - $150 0 $100 - $150 125
$150+ 1 $150 + 5
 De manière similaire, quand on détermine l'impact du
programme…
 Il faut de nombreuses observations pour pouvoir dire avec
certitude que le résultat moyen du groupe de traitement
est plus/moins élevé que celui du groupe de comparaison
 Qu’entend-on par certitude?
 Réduire au minimum l'erreur statistique
certitude
 Erreur de Type 1 : Trouver un impact du programme quand il n'y en a pas
 L'erreur peut être minimisée après la collecte des données, au cours de l'analyse
statistique
 Besoin d'ajuster les niveaux de significativité des estimations d'impact (par ex.
intervalles de confiance à 99 % ou 95 %)
 Erreur de Type 2 : Ne pas pouvoir détecter un effet alors qu’il y en a un
 En jargon statistique: la puissance du test est faible
 Il faut minimiser l'erreur avant la collecte des données
 Meilleur moyen d'y parvenir : s'assurer que vous disposez d'un échantillon suffisamment
important
 Tout l'intérêt d'une évaluation d'impact est d'en apprendre quelque
chose
 Ex ante (a priori) : Nous ne savons pas quelle est l'importance de l'impact de ce
programme
 Faible puissance ex-post (a posteriori) : Ce programme pourrait avoir fait progresser les
revenus agricoles des ménages de 50%, mais nous ne pouvons pas distinguer avec
certitude une augmentation de 50% d'une augmentation nulle
Calcul de la taille de l'échantillon
 En fait, il existe une formule…

 L'essentiel de ce qu'il faut avoir à l'esprit :
1. Taille de l'effet détectable
2. Probabilité d'erreurs de type 1 et 2
3. Variance du/des résultat(s)
4. Unités (communes/villages/ménages) par
zone traitée
 Taille de l'effet détectable

 L'effet minimal recherché pour faire la distinction par rapport à zéro
 Une augmentation des revenus agricoles de 20 %, une amélioration de la santé des
enfants (poids et taille-âge) de 10 %
 Échantillons plus larges  des effets moindres sont plus faciles à

détecter
 Comment choisir la taille de l'effet détectable

 L'effet minimal incitant la réponse d’une intervention
publique
 L'effet minimal qui vous permettra de dire qu'un
programme n'a pas été un échec
 Ce programme a fait progresser de manière significative le
poids/âge des enfants de 10 %
 Génial - voyons comment nous pouvons répliquer ceci à plus grande
échelle
 Ce programme a fait progresser de manière significative le
poids/âge de 2 %
 Génial...euh... voyons-voir : on a dépensé tout ça pour ne faire
progresser les ventes que de si peu?
 Erreurs de Type 1 et Type 2

 Type 1
 Niveau de significativité des estimations fixé
généralement à 1 % ou 5 %
 Probabilité de 1 % ou 5 % qu'il n'y ait pas d'effet, mais
nous en trouvons un
 Type 2
 Puissance généralement fixée à 80 % ou 90 %
 Probabilité de 20 % ou 10 % qu'il y ait un effet mais nous
ne pouvons pas le détecter
 Échantillons plus larges  puissance plus grande
 Variance des résultats

 Moins de variabilité sous-jacente  différences plus faciles à détecter
 possibilité d’avoir un plus petit échantillon
15
Calcul de la taille de
l'échantillon
 Variance des résultats
 Comment la connaître avant de décider de la taille de
l'échantillon et avant de collecter nos données ?
 Idéalement, données préexistantes
 Souvent...inexistantes
 Possibilité d'utiliser des données préexistantes provenant
d'une population similaire
 Exemples : Enquêtes des ménages/communes/villages
 Relève plus de l’expérience que des sciences exactes

Autres questions
1. Groupes de traitement multiples

2. Résultats désagrégés par groupe
3. Participation
4. Qualité des données
Autres questions
 Groupes de traitement multiples
 Simplicité de la comparaison de chaque traitement séparément
au groupe de comparaison
 Il faut de très grands échantillons pour comparer les groupes de
traitement
 Notamment si les traitements sont très similaires, les différences entre
les groupes de traitement seront moindres
 En fait, c'est comme si l'on fixait une taille d'effet détectable très petite
 Résultats désagrégés par groupe

 Les effets diffèrent-ils entre hommes et femmes ? Pour les
différents secteurs d’emploi du ménage ?
 Si les genres/secteurs ont tendance à réagir de manière
similaire, il faudra aussi des échantillons très larges pour estimer
les différences d'impact du traitement
Autres questions
 Résultats désagrégés par groupe

 Pour assurer un équilibre entre les groupes de
traitement et les groupes de comparaison, il est
recommandé de diviser l'échantillon en strates avant
l'assignation du traitement
 Strates
 Sous-populations
 Strates courantes: espaces géographiques, sexe,
secteurs, valeurs initiales de la variable de résultat
 L'assignation au traitement (ou l'échantillonnage) se
déroule au sein de ces groupes
Pourquoi faut-il des strates ?
 Un exemple géographique
 Quel est l'impact dans une région particulière ?
 Parfois difficile à déterminer avec certitude
 =T
 =C
Pourquoi faut-il des strates ?
 Assignation aléatoire à un traitement au sein

d' unités géographiques
 Dans chaque unité, une moitié sera du groupe de
traitement, l’autre du groupe de comparaison.
 Même logique pour sexe, métier, taille de
communes, etc.
Autres questions
 Participation
 Une faible participation augmente la taille de l'effet
détectable
 Un effet ne se détecte que s'il est vraiment important
 Réduit efficacement la taille de l'échantillon
 Exemple : Offre d’engrais modernes aux ménages

agricoles
 Offre à 5 000 ménages
 50 utilisent les engrais modernes
 C’est seulement dans les cas où ces ménages auraient des énormes
augmentations de revenus après l’intervention que l’on pourra dire
avec certitude qu'il y a un effet sur les revenus agricoles
Autres questions
 Qualité des données

 Des données de qualité médiocre augmentent
sensiblement la taille requise de l'échantillon
 Observations manquantes
 Bruit accru
 Peut être en parti résolu avec le coordonnateur de
terrain dans le suivi de la collecte des données sur
le terrain
Un exemple fictif
 Les calculs peuvent être faits à l'aide de nombreux logiciels de statistiques - par exemple
STATA, OD ou R-Cran
 Exemple fictif: Programme de Dévelopment Agricole visant à accroître les revenus agricoles des
ménages avec des engrais modernes
 Revenu agricole par mois d’un ménage, valeur de référence
 50$ par mois
 Données sur les revenus généralement bruitées, donc un coefficient de variation > 1 est fréquent
 Exemple de code STATA pour détecter une augmentation de 10% des revenus 50$ -> 55$ :
 sampsi 50 55, p(0,8) pre(1) post(1) r1(0,5) sd1(50) sd2(50)
 Disponibilité de données de référence et de suivi aide à réduire la taille nécessaire pour l’échantillon (pré et
post)
 Résultats
 Augmentation de 10% (de 50 à 55) : 1 178 ménages de chaque groupe
 Augmentation de 20% (de 50 à 60) : 295 ménages de chaque groupe
 Augmentation de 50% (de 50 à 75) : 48 ménages de chaque groupe (mais cette taille d'effet n'est pas réaliste)
En bref
 Quels groupes ou quelles populations nous intéressent ?
 Exemples
3. Budgets
Budgets
 Que faut-il prévoir ?
 Formation des enquêteurs

 Pré-test/Pilotage
 Collecte des données
 Société de sondages
 Saisie des données
 Coordonnateur de terrain pour assurer que le traitement

suive le protocole de randomisation et pour surveiller la
collecte des données
 Analyse des données

Budgets
 Combien tout ceci va-t-il coûter ?

 Un éventail de coûts très large. Souvent fonction de…
 La durée de l'enquête
 La distribution spatiale des personnes à interroger
 Les problèmes de sécurité
 Matériel, prix de location des voitures, prix de l‘essence
 Capital humain requis par l'énumérateur
 Etc.
 Données d'enquête sur les ménages: 40$+/ménage
 Coordonnateur de terrain: 800$-4000$/mois
 Varie en fonction des possibilités de recrutement sur place
Synthèse
 La taille de l'échantillon de votre évaluation d'impact
déterminera la quantité d'information que vous pourrez
tirer de votre expérience
 Les calculs supposent une dose de jugement et de
supposition mais il est important d'y consacrer du temps
 Si la taille de l'échantillon est trop faible : perte de temps et
d'argent car vous ne pourrez pas détecter un impact non nul
avec certitude
 Si la conception de l'échantillon et la collecte des données sont
réalisées avec peu d'efforts : voir ci-dessus
 Questions ?

Guide Pratique D'échantillonnage Pour Les Évaluations D'impact

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Guide Pratique D'échantillonnage Pour Les Évaluations D'impact

Uploaded by

Copyright:

Available Formats

Guide pratique d'échantillonnage

pour les évaluations d'impact

 Garder à l'esprit la validité externe

 Il faut aussi garder à l'esprit la faisabilité et ce que vous voulez

 Fonction de la taille et du type d'expérience

 Quelle sera la moyenne la plus proche de la vraie

 En fait, il existe une formule…

 Taille de l'effet détectable

 Échantillons plus larges  des effets moindres sont plus faciles à

 Comment choisir la taille de l'effet détectable

 Erreurs de Type 1 et Type 2

 Variance des résultats

 Relève plus de l’expérience que des sciences exactes

1. Groupes de traitement multiples

 Résultats désagrégés par groupe

 Résultats désagrégés par groupe

 Assignation aléatoire à un traitement au sein

 Exemple : Offre d’engrais modernes aux ménages

 Qualité des données

 Formation des enquêteurs

 Coordonnateur de terrain pour assurer que le traitement

 Analyse des données

 Combien tout ceci va-t-il coûter ?

You might also like