Ben A. Williams, PhD, est venu par sa méfiance envers les essais contrôlés randomisés (ECR) à la dure: il a développé une sorte de cancer du cerveau sans traitement éprouvé.
Il y avait eu des essais randomisés de diverses approches, mais ils étaient tous des échecs, explique Williams, professeur émérite de psychologie à l’Université de Californie à San Diego. Et bien que plusieurs médicaments aient aidé un petit pourcentage de patients dans les essais de phase II, dit-il, il peut être difficile de mettre la main sur des thérapies non encore approuvées par les essais de phase III.
« La médecine disait essentiellement que si ce n’est pas fait de cette façon, cela ne compte pas », explique Williams, décrivant les difficultés de ses médecins à accéder à des thérapies qui ne l’aideraient probablement pas, mais pourraient le faire. « Le problème est la mentalité unique. »
Comme Williams, de nombreux autres psychologues — ainsi que des chercheurs en médecine – remettent en question l’hypothèse des National Institutes of Health, de la Food and Drug Administration et d’autres que les ECR devraient être l’étalon-or de la recherche clinique. Bien que la méthodologie — qui consiste à assigner au hasard des participants à un groupe de traitement ou à un groupe témoin — ait ses forces, disent-ils, elle présente également de sérieuses limites qui sont souvent négligées ou ignorées.
Étant donné que les participants à l’essai ne représentent généralement pas la population dans son ensemble, par exemple, les résultats des ECR peuvent ne pas s’appliquer de manière plus générale. Et même s’ils l’ont fait, il est impossible de savoir à partir d’un ECR quel sous-ensemble de participants a réellement bénéficié de l’intervention étudiée.
Ces critiques ne veulent pas rejeter complètement les ECR. Ils veulent plutôt compléter leurs résultats par des preuves provenant d’autres méthodologies, telles que des études épidémiologiques, des expériences sur un seul cas, l’utilisation de contrôles historiques ou une expérience clinique simple.
Forces et faiblesses
Personne ne nie que les ECR ont leurs forces.
« Les essais randomisés font deux choses très rares parmi d’autres conceptions », explique William R. Shadish, PhD, professeur de sciences psychologiques à l’Université de Californie à Merced. « Ils donnent une estimation de l’effet qui est impartiale et cohérente. »Bien que Shadish hésite à décrire les RTC comme l’étalon-or parce que l’expression connote la perfection, il se décrit comme un « grand fan » de la méthodologie.
« Si vous pouvez faire un essai randomisé, dit-il, faites-le par tous les moyens. »
Mais ce n’est pas toujours possible. De par leur nature même, dit-il, certaines questions ne permettent pas l’attribution aléatoire des participants. Cela pourrait être contraire à l’éthique, par exemple.
Même lorsque les ECR sont réalisables, ils peuvent ne pas fournir les réponses que les chercheurs recherchent.
« Tout ce que les ECR font est de montrer que ce à quoi vous avez affaire n’est pas de l’huile de serpent », explique Williams. « Ils ne vous disent pas les informations critiques dont vous avez besoin, c’est-à-dire quels patients vont bénéficier du traitement. »
Pour tenir compte de l’hétérogénéité entre les participants, explique-t-il, les ECR doivent être assez importants pour obtenir une signification statistique. Ce que les chercheurs se retrouvent avec, dit-il, ce sont les « tendances centrales » d’un très grand nombre de personnes — une mesure qui « ne sera pas représentative de beaucoup de gens si vous les considérez comme des individus. »
Dépassez le contexte d’un ECR lui-même, et l’applicabilité des résultats à des patients individuels devient encore plus problématique.
D’une part, les participants aux ECR ont tendance à être une « population assez raréfiée » qui n’est pas représentative de la population réelle qu’une intervention ciblerait éventuellement, explique Steven J. Breckler, PhD, directeur exécutif de la Direction des sciences de l’APA.
« Pensez aux personnes qui se présentent aux essais de médicaments — des patients qui ont probablement essayé tout le reste et qui recherchent désespérément une sorte de traitement », dit-il, ajoutant qu’elles sont encore plus affaiblies à mesure que les chercheurs éliminent les participants potentiels avec des conditions comorbides et autres. « Les résultats de ce procès vont-ils se généraliser à vous et à moi? Ou venons-nous d’une population de personnes qui ne se seraient jamais inscrites à un essai pour commencer? »
Les expériences, dit Breckler, impliquent généralement un compromis entre la validité interne – la capacité de tracer des inférences causales à l’intervention — et la validité externe — la généralisabilité des résultats.
« Ce que les gens semblent ne pas reconnaître, c’est que l’ECR parfait est conçu strictement avec une validité interne à l’esprit », dit-il.
Les ECR peuvent être particulièrement mal adaptés aux interventions psychologiques par rapport aux interventions médicales, ajoute Breckler. Contrairement aux médicaments qui ont un effet biochimique direct qui ne variera probablement pas d’une personne à l’autre, dit-il, les interventions psychologiques ont tendance à interagir avec des facteurs tels que le sexe, l’âge et le niveau d’éducation.
Compléter les ECR
Personne ne suggère que les chercheurs abandonnent les ECR. Au lieu de cela, ils préconisent la supplémentation des ECR avec d’autres formes de preuves.
« La pratique fondée sur des preuves devrait s’appuyer sur une base de preuves très large et diversifiée », explique Breckler. » Les ECR seraient une source, mais il y a beaucoup d’autres sources. »Ces sources pourraient inclure des données d’essais de phase II, des données épidémiologiques, des données qualitatives et des rapports sur le terrain de cliniciens utilisant une intervention, disent Breckler et d’autres.
Williams défend l’utilisation des contrôles historiques comme source d’information supplémentaire.
Dans cette méthodologie, les chercheurs examinent les résultats d’essais antérieurs non randomisés pour établir une base de référence brute. Ils comparent ensuite les résultats d’essais non randomisés ultérieurs à ce point de référence.
L’approche fonctionne, dit Williams, ajoutant que le processus permet de tester de nombreuses interventions en succession rapide. Face aux échecs des ECR pour le traitement du glioblastome, par exemple, les chercheurs se sont tournés vers le dossier historique et ont constaté que seulement 15% des personnes atteintes du cancer n’avaient aucune progression de la maladie six mois après le début du traitement.
« Ils ont constaté que si vous ajoutez cette chose au traitement standard, vous pouvez pousser ce nombre jusqu’à 25% et ajouter deux choses et le pousser jusqu’à 35% », dit-il. « C’est une comparaison grossière, sans aucun doute, mais cela s’avère être un moyen efficace de faire la recherche. »
La FDA a accepté, approuvant un médicament pour le traitement du glioblastome non pas sur la base d’un ECR mais sur plusieurs essais de phase II dont les résultats étaient meilleurs que la norme historique.
Les expériences à cas unique sont une autre source importante de preuves, dit Alan E. Kazdin, PhD, ancien président de l’APA et professeur de psychologie et de pédopsychiatrie à Yale. Contrairement aux ECR, qui impliquent de nombreux sujets et peu d’observations, les plans à cas unique impliquent de nombreuses observations mais souvent peu de sujets. Au lieu de simplement faire une pré- et une post—évaluation, le chercheur évalue le comportement — d’un individu, d’une salle de classe, même d’une école entière – au fil du temps.
Disons qu’un patient a un tic, dit Kazdin. Dans une conception à cas unique, le chercheur observerait le patient et établirait le nombre de tics par heure. Le chercheur effectuerait alors une intervention et regarderait ce qui se passe au fil du temps.
« Si vous faites simplement une évaluation avant un traitement et une évaluation après le traitement et comparez le groupe qui l’a obtenu au groupe qui ne l’a pas fait, vous perdez la richesse du changement au jour le jour, de semaine en semaine, de mois en mois », explique Kazdin, soulignant que les conceptions de cas uniques ne sont pas de simples études de cas.
Pour Kazdin, la confiance excessive dans les ECR signifie passer à côté de toutes sortes d’informations précieuses. Pensez au programme de télescopes de la nation, dit-il. Le télescope Hubble regarde la lumière visible. Un autre télescope regarde les rayons X. Un autre gère les rayons gamma.
« La méthode que vous utilisez pour étudier quelque chose peut influencer les résultats que vous obtenez », explique Kazdin. « Pour cette raison, vous voulez toujours utiliser autant de méthodes différentes que possible. »*
Rebecca A. Clay est écrivaine à Washington, DC