Ben A. Williams, PhD, kom av hans misstro mot randomiserade kontrollerade studier (RCT) den hårda vägen: han utvecklade en slags hjärncancer utan bevisad behandling.
det hade varit randomiserade studier av olika tillvägagångssätt, men de var alla misslyckanden, säger Williams, en emeritus psykologi professor vid University of California i San Diego. Och även om flera läkemedel hade hjälpt en liten andel patienter i fas II-studier, säger han, kan det vara svårt att få tag på terapier som ännu inte granskats av fas III-studier.
”medicin sa i princip om det inte görs på det här sättet, det räknas inte”, säger Williams och beskriver de svårigheter som hans läkare hade för att få tillgång till terapier som förmodligen inte skulle hjälpa honom, men kanske. ”Problemet är one-size-fits-all mentalitet.”
liksom Williams ifrågasätter många andra psykologer — såväl som medicinska forskare — antagandet från National Institutes of Health, Food and Drug Administration och andra att RCT bör vara guldstandarden för klinisk forskning. Medan metodiken-som innebär att slumpmässigt tilldela deltagare till antingen en behandlings — eller kontrollgrupp-har sina styrkor, säger de, det har också allvarliga begränsningar som ofta förbises eller ignoreras.
eftersom försöksdeltagare vanligtvis inte representerar befolkningen som helhet, till exempel, kan resultat från RCT inte gälla mer generellt. Och även om de gjorde det är det omöjligt att berätta från en RCT vilken delmängd av deltagare som faktiskt gynnades av interventionen som studerades.
dessa kritiker vill inte avvisa RCT helt och hållet. Snarare vill de komplettera sina resultat med bevis från andra metoder, såsom epidemiologiska studier, enstaka experiment, användning av historiska kontroller eller helt enkelt klinisk erfarenhet.
styrkor och svagheter
ingen förnekar att RCT har sina styrkor.
”randomiserade försök gör två saker som är mycket sällsynta bland andra mönster”, säger William R. Shadish, PhD, professor i Psykologisk vetenskap vid University of California i Merced. ”De ger en uppskattning av effekten som är opartisk och konsekvent.”Även om Shadish är ovillig att beskriva RTC som guldstandarden eftersom frasen betecknar perfektion, beskriver han sig själv som ett ”stort fan” av metoden.
” om du kan göra en randomiserad studie”, säger han, ” gör det på alla sätt.”
men det är inte alltid möjligt. Av sin natur, säger han, tillåter vissa frågor inte slumpmässig tilldelning av deltagare. Det kan till exempel vara oetiskt.
även när RCT är genomförbara kan de inte ge de svar som forskare letar efter.
”alla RCT: er visar att det du har att göra med inte är ormolja”, säger Williams. ”De berättar inte den kritiska informationen du behöver, vilket är vilka patienter som kommer att dra nytta av behandlingen.”
för att redogöra för heterogenitet bland deltagarna, förklarar han, måste RCT vara ganska stor för att uppnå statistisk signifikans. Vad forskare slutar med, säger han, är de ”centrala tendenserna” hos ett mycket stort antal människor — en åtgärd som ”inte kommer att vara representativ för mycket av någon om man tittar på dem som individer.”
gå bortom sammanhanget med en RCT själv, och tillämpligheten av resultaten på enskilda patienter blir ännu mer problematisk.
för en sak tenderar deltagare i RCT att vara en ”ganska sällsynt befolkning” som inte är representativ för den verkliga befolkningen, ett ingripande skulle så småningom rikta sig, säger Steven J. Breckler, PhD, verkställande direktör för APA: s Vetenskapsdirektorat.
”Tänk på de människor som dyker upp för läkemedelsförsök — patienter som förmodligen har försökt allt annat och är desperata för någon form av behandling”, säger han och tillägger att de ytterligare vinnas när forskare eliminerar deltagare med komorbida tillstånd och liknande. ”Kommer resultaten av den rättegången att generalisera till dig och mig? Eller kommer vi från en befolkning av människor som aldrig skulle ha anmält sig till en rättegång till att börja med?”
experiment, säger Breckler, involverar vanligtvis en avvägning mellan intern validitet-förmågan att spåra orsakssamband till interventionen — och extern validitet — generaliserbarheten av resultaten.
”vad folk verkar misslyckas med att känna igen är att den perfekta RCT är utformad strikt med intern validitet i åtanke”, säger han.
RCT kan vara särskilt dåligt anpassade till psykologiska ingrepp kontra medicinska, tillägger Breckler. I motsats till mediciner som har en enkel biokemisk effekt som sannolikt inte kommer att variera mellan individer, säger han, psykologiska ingrepp tenderar att interagera med sådana faktorer som kön, ålder och utbildningsnivå.
komplettera RCT
ingen föreslår att forskare ger upp RCT. Istället uppmanar de att komplettera RCT med andra former av bevis.
”Evidensbaserad praxis bör förlita sig på en mycket bred, mångsidig bas av bevis”, säger Breckler. ”RCT skulle vara en källa, men det finns många andra källor.”Dessa källor kan inkludera fas II-försöksdata, epidemiologiska data, kvalitativa data och rapporter från fältet från kliniker som använder en intervention, säger Breckler och andra.
Williams mästare användningen av historiska kontroller som en kompletterande informationskälla.
i denna metod undersöker forskare resultaten från tidigare, icke-randomiserade försök för att fastställa en rå baslinje. De jämför sedan resultaten av efterföljande icke-randomiserade försök med det riktmärket.
tillvägagångssättet fungerar, säger Williams och tillägger att processen gör att många ingrepp kan testas i snabb följd. Inför misslyckandena med RCT för glioblastom-behandling vände sig forskare till den historiska posten och fann att endast 15 procent av de med cancer inte hade någon sjukdomsprogression sex månader efter att behandlingen började.
”de fann att om du lägger till den här saken i standardbehandlingen kan du trycka det numret upp till 25 procent och lägga till två saker och driva det upp till 35 procent”, säger han. ”Det är en grov jämförelse, utan tvekan, men det visar sig vara ett effektivt sätt att göra forskningen.”
FDA kom överens om att godkänna ett läkemedel för behandling av glioblastom inte på grundval av en RCT utan på flera fas II-studier vars resultat var bättre än den historiska normen.
enstaka experiment är en annan viktig källa till bevis, säger Alan E. Kazdin, PhD, en tidigare president för APA och professor i psykologi och barnpsykiatri vid Yale. Till skillnad från RCT, som involverar många ämnen och få observationer, involverar enstaka fall många observationer men ofta få ämnen. I stället för att helt enkelt göra en pre – och postbedömning bedömer forskaren beteende — hos en individ, ett klassrum, till och med en hel skola — över tiden.
säg att en patient har en tic, säger Kazdin. I en enda falldesign skulle forskaren observera patienten och fastställa antalet tics per timme. Forskaren skulle sedan genomföra en intervention och se vad som händer över tiden.
” om du bara gör en bedömning före någon behandling och en bedömning efter behandling och jämför den grupp som fick den till den grupp som inte gjorde det, förlorar du förändringens rikedom på en daglig, vecka till vecka, månad till månad”, säger Kazdin och betonar att enstaka falldesigner inte bara är fallstudier.
för Kazdin betyder överrelians på RCT att man saknar all slags värdefull information. Tänk på nationens teleskopprogram, säger han. Hubble-teleskopet tittar på synligt ljus. Ett annat teleskop tittar på röntgenstrålar. En annan hanterar gammastrålar.
”metoden som du använder för att studera något kan påverka resultaten du får”, säger Kazdin. ”På grund av det vill du alltid använda så många olika metoder som möjligt.”*
Rebecca A. Clay är en författare i Washington, D. C.