Enjeux éthiques | Les essais par assignation aléatoire : l'émergence d'un souci évaluatif en économie du développement

La volonté d’appliquer la « rigueur des essais cliniques » au domaine de l’économie du développement, comme le propose Esther Duflo dans la leçon inaugurale de son cours au Collège de France, n’est évidemment pas sans soulever des questions éthiques. Si les RCT permettent de disposer d’une réelle « souplesse » dans le choix du traitement que l’on souhaite évaluer comme l’explique la chercheuse dans l’article L’approche expérimentale en économie du développement^[ref] , « tout ne peut [cependant] pas être testé et tout le monde n’accepte pas d’être un cobaye ».

La perception qu’ont les gens de l’expérimentation sociale en général peut être très variable selon le contexte, comme nous l’a indiqué Ilf Bencheikh^[ref], Directeur-adjoint du Bureau Europe de J-PAL. Si celle-ci est « très admise aux Etats-Unis où des expérimentations sont menées depuis déjà 40 ans », « il n’est au contraire pas possible d’utiliser le terme même d’« expérimentation » dans certains pays d’Europe, à l’instar de l’Allemagne où expérimenter sur des humains évoque des heures sombres de l’histoire récente. C’est un point que soulève également Martin Ravaillon dans Should the randomistas rule ?^[ref]: « Social experiments also raise ethical concerns, with context-specific political sensitivities ». Comme l’explique Ilf Bencheikh, ces « sensibilités diverses » sont d’autant plus à prendre en compte lors d’une évaluation que les chercheurs sont « très dépendants des partenaires et des gens qui mettent en œuvre les programmes ». Si ces derniers ont des objections éthiques envers l’évaluation, celle-ci ne pourra pas avoir lieu. La question de l’acceptation de la méthode d’un point de vue éthique est donc une question jugée « très sensible » par les chercheurs affiliés au J-PAL.

Selon Ilf Bencheikh [2014]^[ref], les chercheurs du J-PAL passent « 50% du temps » à discuter de questions éthiques. Ces questions apparaissent en général assez vite, explique le directeur adjoint de l’antenne européenne du J-PAL, et constitue le premier « filtre » de la viabilité éthique d’un projet : « On s’interdit absolument de se diriger vers des domaines dans lesquels exclure des gens est manifestement criminel comme le fait de randomiser l’aide d’urgence ou de laisser mourir des gens pour mesurer un impact ». Un deuxième filtre est assuré par les « comités éthiques » au sein des grandes universités – en particulier aux Etats-Unis où l’on parle d’ « institutional review board ». « Tous les projets J-PAL sont soumis à un comité comme ceux-ci », explique Ilf Bencheikh. Enfin, « les partenaires constituent un filtre très fort car ils n’hésiteront pas à dire si l’évaluation ne leur semble pas acceptable ». Finalement, pour Ilf Bencheikh, « l’arrêt d’une évaluation résulte rarement d’un problème d’éthique » car les questions éthiques sont abordées suffisamment tôt pour que tout projet jugé non valide de ce point de vue-là soit abandonné dès le départ.

Des considérations éthiques multiples

Dans leur article The Power and Pitfalls of Experiments in Development Economics : Some Non-random Reflections^[ref], Christopher B. Barrett et Michael R. Carter énoncent les règles éthiques standards à adopter lors d’une expérimentation sociale :

« Tout tort prévisible causé par l’évaluation doit être catégoriquement inférieur aux gains sociaux. »
« Le sujet doit être complètement informé des risques potentiels. »
« L’ensemble des dommages causés doivent être compensés. »

Certaines considérations éthiques concernent les expérimentations sociales en général tandis que d’autres sont spécifiques aux évaluations randomisées. Afin d’aborder l’ensemble de celles-ci, nous adoptons une distinction qui rejoint celle proposée par Christopher B. Barrett et Michael R. Carter [2010]^[ref] – qui choisissent dans leur article de regrouper les problématiques éthiques au sein de quatre classes.

Première classe

Elle regroupe les problèmes éthiques les plus évidents, à savoir ceux qui portent atteinte de manière plus ou moins flagrante au principe imposant de ne pas causer de tort au sujet qui participe à l’évaluation. « Le principe de ‘‘ ne pas faire de mal ’’ est peut-être l’obligation éthique la plus fondamentale », selon Christopher B. Barrett et Michael R. Carter.

Parfois, le tort causé au sujet de l’expérience est criant à travers l’objet même de l’étude. Christopher B. Barrett et Michael R. Carter mentionnent, par exemple, une expérience conduite en Inde par le J-PAL^[ref] consistant à évaluer le degré de corruption dans l’attribution du permis de conduire. Dans cette expérience, que décrit également Esther Duflo dans L’approche expérimentale en économie du développement^[ref] , des personnes souhaitant passer le permis de conduire ont été réparties dans trois groupes : les personnes du premier recevaient un bonus s’ils obtenaient leur permis rapidement, les personnes de second se voyaient proposer des leçons de conduite gratuites tandis que le troisième groupe constituait le groupe témoin. Les résultats de l’expérience ont montré que les personnes du premier groupe avaient une propension plus forte à corrompre les évaluateurs du permis de conduire. Selon les auteurs de The Power and Pitfalls of Experiments in Development Economics^[ref] : Some Non-random Reflections, l’évaluation incitait les personnes du premier groupe à avoir recours à la corruption. Cela a eu la conséquence de permettre à des personnes non aptes à conduire à prendre la route, mettant en péril leur vie et celles des autres conducteurs. Christopher B. Barrett et Michael R. Carter jugent cette « évaluation irresponsable » et déplorent qu’elle ait pu paraître dans l’un des journaux les plus prestigieux de la profession : le Quarterly Journal of Economics.

Le tort causé par certaines études est parfois moins flagrant. C’est le cas par exemple de l’étude menée au Kenya par Mary Key Gugerty et Michael Kremer, chercheurs au J-PAL, afin de mesurer l’effet Rockefeller. Celui-ci tient son nom de John D. Rockefeller qui refusa de donner de l’argent à l’organisation Alcooliques Anonymes prétextant qu’il craignait que cela détériore l’efficacité de l’organisation. En effet, comme l’explique les deux chercheurs, il est possible que ce type de subvention entraine une transformation de l’organisation visée en diminuant le rôle de certains membres dans l’organisation au profit d’autres personnes, plus jeunes, plus éduquées et ayant rejoint le groupe après la subvention. Le but de l’étude était de déterminer si la subvention de groupes de femmes au Kenya entraînerait l’exclusion des femmes les plus pauvres. S’il est possible d’argumenter que la mise en évidence de l’existence de l’effet Rockefeller pourrait entraîner un bénéfice social futur, comme l’expliquent Christopher B. Barrett et Michael R. Carter, les conséquences potentielles sur les femmes les plus pauvres font de cette évaluation un problème éthique « à couper le souffle ».

Deuxième classe

Elle comprend toutes les questions gravitant autour de la nécessité de « traiter les humains comme des agents dotés d’une volonté propre et pouvant choisir de participer ou non » et non de les « traiter comme des sujets manipulables à souhait pour la recherche », comme l’expriment Christopher B. Barrett et Michael R. Carter [2010]^[ref].

Cette nécessité implique, par exemple, le droit des sujets de l’expérience à l’information. Comme nous l’avons expliqué dans la partie traitant des biais de randomisation, le fait que les participants soient au courant qu’une évaluation est en cours peut entraîner un effet Hawthorne. Christopher B. Barrett et Michael R. Carter expliquent que certains scientifiques peuvent être tentés de divulguer le moins d’informations possible sur l’objet de l’expérience. Parfois, cela va jusqu’à faire en sorte que « les individus ignorent qu’ils font partie d’une expérience ». En effet, comme le précise Esther Duflo dans L’approche expérimentale en économie du développement^[ref] , « les comités d’éthique accordent en général une dispense de divulgation complète jusqu’à la fin de l’enquête » dans ce genre de situation et « lorsque le programme ne fait courir aucun risque au sujet ».

Le chercheur qui nous a accordé un entretien et qui a souhaité rester anonyme a évoqué avec nous^[ref], la question du consentement des personnes à participer à une évaluation. Comme il nous l’a rappelé, « dans le protocole, les gens doivent donner leur accord pour participer à l’expérience ». Cependant, selon lui, les gens à qui l’on fait signer des contrats d’accord ne comprenent pas toujours ce qu’ils signent. Ainsi, s’« ils peuvent donner leur consentement libre », celui-ci « n’est pas toujours éclairé ». Il conclut que « de toute façon, quand quelqu’un qui vient en costard-cravate et qu’en plus il est accompagné d’un blanc, c’est difficile de dire non. Le consentement est donc en fait parfois très relatif. »

Ces considérations laissent à penser que les chercheurs disposent d’une marge de manœuvre plus importante au niveau de l’évaluation dans les pays en voie de développement que dans les pays développés. Le chercheur interrogé confirme ce propos en expliquant qu’ « on a beaucoup plus de latitude d’un point de vue éthique lorsqu’on fait des expérimentations aléatoires dans les pays pauvres ». Selon lui, lorsque « vous êtes un blanc et vous avez de l’argent, il est beaucoup plus facile de faire là-bas les choses pour lesquelles il vous faudrait ici négocier avec les collectivités locales, les syndicats, les partis, etc. » A titre d’exemple, il cite une expérimentation réalisée par Esther Duflo, Rema Hanna et Stephen Ryan en Inde sur l’effet de l’octroi de primes sur l’assiduité des professeurs ainsi que l’effet de cette assiduité sur la présence des élèves et leur niveau scolaire. Pour contrôler la présence des professeurs, les expérimentateurs ont distribué des appareils photos et ont demandé à ce que ceux-ci prennent une photo de la classe à chaque fois qu’ils étaient présents.

Selon le chercheur, si cette expérimentation a été acceptée par le comité éthique du MIT, ce qu’il juge scandaleux d’un point de vue personnel, il n’en reste pas moins que « personne n’aurait même osé évoquer l’idée de mettre en place ce système en France ». En précisant toutefois qu’il ne faut pas être caricatural et que le monde des randomistas est hétéroclite, il conclut que « d’une certaine façon, on fait là-bas ce qu’on n’oserait pas faire ici ». Ce principe présente cependant des limites que s’imposent les chercheurs. A titre d’exemple, François Bourguignon^[ref] nous a confié qu’il avait un jour, lorsqu’il travaillait à la Banque mondiale, « refusé une proposition de programme d’expérimentation car ce dernier soulevait d’énormes problèmes éthiques ». Le programme consistait à offrir de l’argent aux familles pour chaque fille entre 12 et 16 ans séronégative au test de VIH. « Chaque année, un test de VIH était réalisé : l’expérimentateur distribuait l’argent tant que le test était négatif » et s’il s’avérait positif, l’aide financière s’arrêtait, infligeant « une double peine » à la famille. L’économiste concluait qu’il fallait « faire attention à ne pas aller trop loin ».

Troisième classe

Elle concerne les questions relatives à la façon dont peut être ressentie l’appartenance au groupe témoin par les sujets de l’expérience. Comme l’expliquent les auteurs^[ref], cela fait partie des questionnements éthiques dont la réponse apportée dans le cadre de la médecine ne peut être transférée au cadre de l’économie. En effet, dans le cadre de la médecine, le groupe test reçoit le traitement tandis que le groupe témoin reçoit la plupart du temps un placebo. Il s’agit donc d’une expérience en aveugle : les sujets ne connaissent pas leur groupe d’appartenance. Christopher B. Barrett et Michael R. Carter expliquent que dans le cadre de l’économie cependant, les expériences sont très rarement propices à être effectuées en aveugle et que cela peut avoir pour conséquence que « les personnes se sachant appartenir au groupe de contrôle peuvent souffrir de détresse émotionnelle ».

Quatrième classe

Elle concerne les questions éthiques soulevées par l’utilisation de la randomisation pour constituer les groupes test et témoin. Selon les auteurs, « les expérimentations randomisées traitent systématiquement des individus dont on sait qu’ils ne nécessitent pas le traitement en lieu et place de ceux qui en auraient besoin » au nom de la pureté statistique qu’elles recherchent. Ils voient dans les expérimentations aléatoires à la fois de l’« injustice » et du « gaspillage ».

Tout comme l’acceptation même de l’expérimentation sociale, l’acceptation du caractère aléatoire de l’expérimentation dépend largement du contexte. En France par exemple, « l’idée qu’il faut que soit respectée l’égalité de tous devant la loi est globalement admise : si quelqu’un est éligible à un programme, tout le monde doit être éligible », énonce Ilf Bencheikh^[ref]. Cependant, il est « nécessaire d’exclure des gens d’un traitement que d’autres reçoivent si l’on souhaite expérimenter, et ce qu’elle que soit la méthode ». Pour pouvoir réaliser une évaluation en France, comme l’a fait Martin Hirsch avec le RSA en 2005, il a donc fallu « introduire dans la constitution française la possibilité de faire des traitements différenciées dans le cadre d’une expérimentation sociale ». Bernard Gomel et Evelyne Serverin détaillent les différentes étapes ayant conduit à la modification des lois relatives à la possibilité de mener une expérimentation en France dans l’article Evaluer l’expérimentation sociale^[ref].

Dans les pays en développement au contraire, le caractère aléatoire de la constitution des groupes test et témoin est souvent très bien accepté par les individus susceptibles de participer à l’expérience, comme l’expliquent le chercheur que nous avons interrogé ainsi qu’Ilf Bencheikh^[ref]. Pour le premier, comme nous l’avons vu précédemment, cela réside en partie dans le fait que lorsqu’une évaluation est proposée par quelqu’un « en costard-cravate » « accompagné d’un blanc », il est rare que les gens refusent de participer. Pour le second, cela s’explique par le fait que « dans certains pays en développement, le principe d’accéder ou non à un programme de manière aléatoire est perçu comme une grande avancée égalitariste et démocratique (comme l’était la démocratie athénienne !) ». En effet, il explique que ce mode de répartition est par exemple préféré « aux avantages qui se distribuent au copinage ou lorsque l’on est « le cousin du chef », etc. »

L’acceptation de la randomisation par les ONG et les gouvernements est moins évidente. Comme l’explique Esther Duflo [2009]^[ref] , « toutes les ONG ou tous les gouvernements ne sont pas volontaires pour participer à des évaluations aléatoires » et ce « précisément parce qu’elles sont aléatoires ». Certaines « négociations qui aboutissent à des compromis » sont alors parfois nécessaires, explique le chercheur interrogé, comme dans le cas de l’expérimentation sur les vermifuges – l’exemple phare du mouvement en faveur des RCT :

« Dans l’article sur les vermifuges, d’ailleurs ils le disent, ce n’est pas une randomisation pure parce que les gens en face ne voulaient pas de randomisation. C’est une sorte de randomisation par alphabétisation : les individus sont classés par ordre alphabétique et en fonction de ce classement ils ont réparti les personnes et créé les groupes. Ça ne colle pas aux canons de la randomisation mais ça n’a pas empêché l’article de devenir l’article phare du mouvement. »

Dans son livre Les expérimentations aléatoires en économie^[ref], le sociologue Arthur Jatteau décrit les « diverses solutions […] envisagées pour accroître l’acceptabilité du tirage au sort », dont la possibilité d’avoir recours à « un ‘‘joker’’ pour passer outre l’assignation ». Ce principe a par exemple été adopté en France lorsque des expérimentations randomisées ont été menées sur l’emploi, comme le chercheur que nous avons interrogé nous l’a expliqué^[ref]. L’idée de départ était de faire une randomisation, mais les conseillers de Pôle emploi, en charge de la mise en place du programme, ont eu du mal avec le principe de la randomisation. Pour pallier ce problème d’acceptation, « certains conseillers avaient le droit à des jokers qu’ils pouvaient donner pour faire sortir certaines personnes de l’expérimentation. Ainsi, de petits arrangements institutionnels ont pu être trouvés, sans toutefois remettre en cause le principe de la randomisation. »

Il conclut à propos de l’acceptation du caractère aléatoire des expérimentations randomisées :

« J’ai l’impression en toute honnêteté, pour m’y être beaucoup intéressé, qu’il n’y a pas énormément de problèmes, même s’il y a beaucoup de discussions autour de ça, parfois des négociations et plus rarement des refus. »

Selon Esther Duflo [2009]^[ref], une amélioration certaine de l’acceptation du caractère aléatoire des expérimentations est à attendre de l’essor des RCT. En effet, dans le contexte des pays en développement, « les évaluations aléatoires sont de mieux en mieux acceptées, et les partenaires se multiplient ». Pour la chercheuse, « la situation va continuer de s’améliorer si les évaluations aléatoires sont recommandées par les donateurs dans la mesure où les partenaires se diversifieront encore davantage ».

page précédente page suivante