Ben A. Williams, PhD, kom av hans mistillit til randomiserte kontrollerte studier (Rcter) på den harde måten: han utviklet en slags hjernekreft uten påvist behandling.
det hadde vært randomiserte forsøk på ulike tilnærminger, men de var alle feil, sier Williams, en emeritus psykologi professor Ved University Of California I San Diego. Og selv om flere stoffer hadde hjulpet en liten prosentandel av pasientene I Fase II-studier, sier han, kan det være vanskelig å få tak i terapier som ennå ikke er undersøkt Av Fase III-studier.
» Medisin sa i utgangspunktet at hvis Det ikke er gjort på denne måten, teller Det ikke,» sier Williams, og beskriver vanskelighetene hans leger hadde med å få tilgang til terapier som sannsynligvis ikke ville hjelpe ham, men kanskje. «Problemet er one-size-fits-all mentalitet.»
i Likhet Med Williams stiller mange andre psykologer — så vel som medisinske forskere — spørsmål ved antagelsen Fra National Institutes Of Health, Food And Drug Administration og andre om At Rcter bør være gullstandarden for klinisk forskning. Mens metodikken – som innebærer tilfeldig tildeling av deltakere til enten en behandling-eller kontrollgruppe – har sine styrker, sier de, det har også alvorlige begrensninger som ofte overses eller ignoreres.
fordi forsøksdeltakere vanligvis ikke representerer befolkningen som helhet, kan det for eksempel hende at resultater fra Rcter ikke gjelder mer generelt. Og selv om de gjorde det, er det umulig å fortelle fra EN RCT hvilken delmengde av deltakerne faktisk hadde nytte av intervensjonen som ble studert.
disse kritikerne ønsker ikke å avvise Rct helt. Snarere ønsker de å supplere sine funn med bevis fra andre metoder, for eksempel epidemiologiske studier, enkelttilfelle eksperimenter, bruk av historiske kontroller eller bare ren klinisk erfaring.
Styrker og svakheter
ingen benekter at Rcter har sine styrker.
«Randomiserte forsøk gjør to ting som er svært sjeldne blant andre design,» sier William R. Shadish, PhD, professor i psykologisk vitenskap ved University Of California I Merced. «De gir et estimat av effekten som er objektiv og konsistent. Selv Om Shadish er motvillig til å beskrive RTCs som gullstandarden fordi uttrykket betyr perfeksjon, beskriver Han seg selv som en «stor fan»av metodikken .
» hvis du kan gjøre en randomisert prøve, «sier han,» gjør det for all del.»
Men det er ikke alltid mulig. Av sin natur, sier han, noen spørsmål tillater ikke tilfeldig tildeling av deltakere. Det kan for eksempel være uetisk.
selv Når Rcter er gjennomførbare, kan de ikke gi svarene forskerne leter etter.
«Alle Rcter gjør er å vise at det du har å gjøre med, ikke er slangeolje,» sier Williams. «De forteller deg ikke den kritiske informasjonen du trenger, som er hvilke pasienter som skal dra nytte av behandlingen.»
for å redegjøre for heterogenitet blant deltakerne, forklarer han, Må Rcter være ganske store for å oppnå statistisk signifikans. Hva forskere ender med, sier han, er de «sentrale tendensene» til et veldig stort antall mennesker — et tiltak som «ikke kommer til å være representativt for mye av noen hvis du ser på dem som individer.»
Gå utover konteksten til EN RCT selv, og anvendeligheten av resultatene til enkelte pasienter blir enda mer problematisk.
for en ting har deltakerne i Rcter en tendens til å være en «ganske sjeldne befolkning» som ikke er representativ for den virkelige verdensbefolkningen, en intervensjon vil til slutt målrette seg, sier Steven J. Breckler, PhD, administrerende direktør FOR APAS Vitenskapsdirektorat.
» Tenk på de menneskene som dukker opp for narkotikaforsøk-pasienter som sannsynligvis har prøvd alt annet og er desperate for en slags behandling,» sier han og legger til at de blir ytterligere redusert som forskere eliminerer potensielle deltakere med komorbide forhold og lignende. «Vil resultatene av denne rettssaken generalisere til deg og meg? Eller kommer vi fra en befolkning av mennesker som aldri ville ha registrert seg i en rettssak til å begynne med?»
Eksperimenter, sier Breckler, involverer vanligvis en avveining mellom intern validitet-evnen til å spore årsakssammenheng til intervensjonen — og ekstern validitet — generaliserbarheten av resultatene.
» hva folk ser ut til å mislykkes i å gjenkjenne er at den perfekte RCT er utformet strengt med intern gyldighet i tankene,» sier han.
Rct kan være spesielt dårlig egnet til psykologiske tiltak mot medisinske, legger Breckler til. I motsetning til medisiner som har en enkel biokjemisk effekt som ikke er sannsynlig å variere på tvers av individer, sier han, psykologiske tiltak har en tendens til å samhandle med faktorer som kjønn, alder og utdanningsnivå.
Supplerende Rcter
ingen antyder at forskere gir Opp Rcter. I stedet oppfordrer de tilskudd Av Rcter med andre former for bevis.
«Evidensbasert praksis bør stole på en svært bred, mangfoldig base av bevis,» sier Breckler. «RCTs ville være en kilde, men det er mange andre kilder.»Disse kildene kan inkludere Fase II-studiedata, epidemiologiske data, kvalitative data og rapporter fra feltet fra klinikere som bruker en intervensjon, sier Breckler og andre.
Williams forkjemper bruken av historiske kontroller som en supplerende kilde til informasjon.
i denne metoden, forskere undersøke resultatene av tidligere, nonrandomized studier for å etablere en rå grunnlinjen. De sammenligner deretter resultatene av etterfølgende ikke-randomiserte studier med det referansepunktet.
tilnærmingen fungerer, sier Williams, og legger til at prosessen gjør at mange tiltak kan testes i rask rekkefølge. I motsetning Til feilene I Rcter for glioblastombehandling, vendte forskerne seg til historisk rekord og fant at bare 15 prosent av de med kreft ikke hadde sykdomsprogresjon seks måneder etter at behandlingen begynte.
«de fant ut at hvis du legger denne tingen til standardbehandlingen, kan Du skyve det nummeret opp til 25 prosent og legge til to ting og skyve det opp til 35 prosent,» sier han. «Det er en grov sammenligning, uten tvil, men det viser seg å være en effektiv måte å gjøre forskningen på.»
FDA ble enige om å godkjenne et stoff for behandling av glioblastom ikke på grunnlag av EN rct, men på flere Fase II-studier hvis resultater var bedre enn den historiske normen.
single-case eksperimenter er en annen viktig kilde til bevis, sier Alan E. Kazdin, PhD, tidligere president I APA og professor i psykologi og barnepsykiatri Ved Yale. I motsetning til Rcter, som involverer mange fag og få observasjoner, involverer single-case design mange observasjoner, men ofte få fag. I stedet for å bare gjøre en pre – og postassessment, vurderer forskeren atferd-av et individ — et klasserom, til og med en hel skole — over tid.
Si at en pasient har en tic, sier Kazdin. I et enkelt tilfelle design vil forskeren observere pasienten og etablere antall tics per time. Forskeren vil da gjennomføre en intervensjon og se hva som skjer over tid.
» hvis du bare gjør en vurdering før noen behandling og en vurdering etter behandling og sammenligner gruppen som fikk den til gruppen som ikke gjorde det, mister du rikdom av endringen på en dag-til-dag, uke-til-uke, måned-til-måned basis,» sier Kazdin, og understreker at single-case design ikke bare er casestudier.
For Kazdin betyr overreliance på RCTs å gå glipp av all slags verdifull informasjon. Tenk på nasjonens teleskopprogram, sier han. Hubble-teleskopet ser på synlig lys. Et annet teleskop ser På Røntgenstråler. En annen håndterer gammastråler.
» metoden du bruker til å studere noe, kan påvirke resultatene du får,» sier Kazdin. «På grunn av det vil du alltid bruke så mange forskjellige metoder som mulig.»*
Rebecca A. Clay er en forfatter i Washington, DC