Ben A. Vilhams, ph.d., kom af hans mistillid til randomiserede kontrollerede forsøg (RCT ‘ er) på den hårde måde: han udviklede en slags hjernekræft uden dokumenteret behandling.
der havde været randomiserede forsøg med forskellige tilgange, men de var alle fejl, siger emeritus psykologi professor ved University of California i San Diego. Og selvom flere lægemidler havde hjulpet en lille procentdel af patienterne i Fase II-forsøg, siger han, kan det være svært at få fat i terapier, der endnu ikke er undersøgt af fase III-forsøg.
“medicin sagde dybest set, at hvis det ikke gøres på denne måde, tæller det ikke,” siger Vilhelm og beskriver de vanskeligheder, hans læger havde med at få adgang til terapier, der sandsynligvis ikke ville hjælpe ham, men måske. “Problemet er den en-størrelse-passer-alle mentalitet.”
ligesom mange andre psykologer — såvel som medicinske forskere — sætter spørgsmålstegn ved antagelsen fra National Institutes of Health, Food and Drug Administration og andre om, at RCT ‘ er skal være guldstandarden for klinisk forskning. Mens metoden-som involverer tilfældigt tildeling af deltagere til enten en behandlings — eller kontrolgruppe-har sine styrker, siger de, det har også alvorlige begrænsninger, der ofte overses eller ignoreres.
fordi forsøgsdeltagere typisk ikke repræsenterer befolkningen som helhed, gælder resultater fra RCT ‘ er muligvis ikke mere generelt. Og selvom de gjorde det, er det umuligt at fortælle fra en RCT, hvilken delmængde af deltagere der faktisk har haft gavn af den intervention, der undersøges.
disse kritikere ønsker ikke at afvise RCT ‘ er helt. Snarere ønsker de at supplere deres fund med beviser fra andre metoder, såsom epidemiologiske undersøgelser, enkelttilfælde eksperimenter, brug af historiske kontroller eller bare almindelig klinisk erfaring.
styrker og svagheder
ingen benægter, at RCT ‘ er har deres styrker.
“randomiserede forsøg gør to ting, der er meget sjældne blandt andre designs,” siger ph.d., professor i psykologisk videnskab ved University of California i Merced. “De giver et skøn over effekten, der er upartisk og konsekvent.”Selvom Shadish er tilbageholdende med at beskrive RTC’ er som guldstandarden, fordi udtrykket betegner perfektion, beskriver han sig selv som en “stor fan” af metoden.
“hvis du kan lave et randomiseret forsøg,” siger han, “gør det på alle måder.”
men det er ikke altid muligt. Af deres natur, han siger, nogle spørgsmål tillader ikke tilfældig tildeling af deltagere. Det kan f.eks. være uetisk.
selv når RCT ‘ er er mulige, giver de muligvis ikke de svar, som forskere leder efter.
“alle RCT’ er gør, er at vise, at det, du har at gøre med, ikke er slangeolie,” siger han. “De fortæller dig ikke de kritiske oplysninger, du har brug for, hvilket er, hvilke patienter der vil drage fordel af behandlingen.”
for at redegøre for heterogenitet blandt deltagerne, forklarer han, skal RCT ‘ er være ret store for at opnå statistisk signifikans. Hvad forskere ender med, siger han, er de “centrale tendenser” hos et meget stort antal mennesker — en foranstaltning, der “ikke vil være repræsentativ for meget af nogen, hvis man ser på dem som enkeltpersoner.”
gå ud over sammenhængen med en RCT selv, og anvendeligheden af resultaterne til individuelle patienter bliver endnu mere problematisk.
for det første har deltagere i RCT ‘ er en tendens til at være en “temmelig sjælden befolkning”, der ikke er repræsentativ for den virkelige befolkning, som en intervention i sidste ende vil målrette mod, siger Steven J. Breckler, ph.d., administrerende direktør for APA ‘ s Science Directorate.
“tænk på de mennesker, der møder op til lægemiddelforsøg — patienter, der sandsynligvis har prøvet alt andet og er desperate efter en slags behandling,” siger han og tilføjer, at de yderligere bliver slået ned, da forskere eliminerer potentielle deltagere med komorbide tilstande og lignende. “Vil resultaterne af denne retssag generalisere for dig og mig? Eller kommer vi fra en befolkning af mennesker, der aldrig ville have tilmeldt sig en retssag til at begynde med?”
eksperimenter, siger Breckler, involverer typisk en afvejning mellem intern gyldighed-evnen til at spore årsagssammenhænge til interventionen — og ekstern gyldighed — generaliserbarheden af resultaterne.
“hvad folk synes at undlade at genkende er, at den perfekte RCT er designet strengt med intern gyldighed i tankerne,” siger han.
RCT ‘ er kan være særligt dårligt egnet til psykologiske indgreb versus medicinske, tilføjer Breckler. I modsætning til medicin, der har en ligetil biokemisk effekt, der sandsynligvis ikke vil variere på tværs af individer, siger han, psykologiske indgreb har tendens til at interagere med faktorer som køn, alder og uddannelsesniveau.
supplerende RCT ‘er
ingen antyder, at forskere opgiver RCT’ er. I stedet opfordrer de til tilskud af RCT ‘ er med andre former for bevis.
“evidensbaseret praksis bør stole på en meget bred, forskelligartet bevisbase,” siger Breckler. “RCT’ er ville være en kilde, men der er mange andre kilder.”Disse kilder kan omfatte Fase II-forsøgsdata, epidemiologiske data, kvalitative data og rapporter fra marken fra klinikere, der bruger en intervention, siger Breckler og andre.
Vilhelms kæmper for brugen af historiske kontroller som en supplerende informationskilde.
i denne metode undersøger forskere resultaterne af tidligere, ikke-tilfældige forsøg for at etablere en rå baseline. De sammenligner derefter resultaterne af efterfølgende ikke-tilfældige forsøg med dette benchmark.
fremgangsmåden fungerer, siger han og tilføjer, at processen gør det muligt at teste mange indgreb hurtigt efter hinanden. Stillet over for svigt af RCT ‘ er for glioblastom behandling, for eksempel, forskere henvendte sig til den historiske rekord og fandt, at kun 15 procent af dem med kræft havde ingen sygdomsprogression seks måneder efter behandlingen begyndte.
“de fandt ud af, at hvis du tilføjer denne ting til standardbehandlingen, kan du skubbe dette tal op til 25 procent og tilføje to ting og skubbe det op til 35 procent,” siger han. “Det er uden tvivl en grov sammenligning, men det viser sig at være en effektiv måde at gøre forskningen på.”
FDA accepterede at godkende et lægemiddel til behandling af glioblastom ikke på grundlag af en RCT, men på flere Fase II-forsøg, hvis resultater var bedre end den historiske norm.
single-case eksperimenter er en anden vigtig kilde til beviser, siger Alan E. Ph. d., tidligere præsident for APA og professor i psykologi og børnepsykiatri ved Yale. I modsætning til RCT ‘ er, der involverer mange emner og få observationer, involverer design i en enkelt sag mange observationer, men ofte få emner. I stedet for blot at foretage en præ – og postvurdering vurderer forskeren adfærd — af et individ, et klasseværelse, endda en hel skole — over tid.
sig, at en patient har en tic, siger Kasdin. I et enkelt tilfælde design ville forskeren observere patienten og fastslå antallet af tics pr. Forskeren ville derefter foretage en intervention og se, hvad der sker over tid.
“hvis du bare foretager en vurdering før en eller anden behandling og en vurdering efter behandling og sammenligner den gruppe, der fik den, med den gruppe, der ikke gjorde det, mister du rigdommen ved ændringen dagligt, uge til uge, måned til måned,” siger Kasdin og understreger, at design i en enkelt sag ikke kun er casestudier.
for Kasdin betyder overdreven tillid til RCT ‘ er at gå glip af alle mulige værdifulde oplysninger. Tænk på landets teleskopprogram, siger han. Hubble-teleskopet ser på synligt lys. Et andet teleskop ser på røntgenstråler. En anden håndterer gammastråler.
“den metode, du bruger til at studere noget, kan påvirke de resultater, du får,” siger Kasdin. “På grund af det vil du altid bruge så mange forskellige metoder som muligt.”*
Rebecca A. Clay er forfatter i USA, DC