In uno studio osservazionale, i ricercatori non hanno alcun controllo sui valori delle variabili indipendenti, come chi riceve il trattamento. Invece, devono controllare le variabili usando le statistiche.
Gli studi osservazionali vengono utilizzati quando esperimenti controllati possono essere non etici o poco pratici. Ad esempio, se un ricercatore volesse studiare l’effetto della disoccupazione (la variabile indipendente) sulla salute (la variabile dipendente), sarebbe considerato non etico dai comitati di revisione istituzionale assegnare casualmente alcuni partecipanti ad avere posti di lavoro e altri no. Invece, il ricercatore dovrà creare un campione che include alcune persone occupate e alcune persone disoccupate. Tuttavia, ci potrebbero essere fattori che influenzano sia se qualcuno è impiegato e come sano lui o lei è. Una parte di qualsiasi associazione osservata tra la variabile indipendente (stato di occupazione) e la variabile dipendente (salute) potrebbe essere dovuta a questi fattori esterni e spuri piuttosto che indicare un vero legame tra loro. Questo può essere problematico anche in un vero campione casuale. Controllando le variabili estranee, il ricercatore può avvicinarsi alla comprensione del vero effetto della variabile indipendente sulla variabile dipendente.
In questo contesto le variabili estranee possono essere controllate utilizzando la regressione multipla. La regressione utilizza come variabili indipendenti non solo quella o quelle i cui effetti sulla variabile dipendente sono in fase di studio, ma anche eventuali variabili confondenti potenziali, evitando così il bias variabile omesso. “Variabili confondenti” in questo contesto si intendono altri fattori che non solo influenzano la variabile dipendente (il risultato) ma influenzano anche la variabile indipendente principale.
ExampleEdit
Uno studio sul fatto che invecchiare influenzi la soddisfazione della vita di qualcuno. (Alcuni ricercatori percepiscono una “forma a U”: la soddisfazione della vita sembra diminuire prima e poi aumentare dopo la mezza età.) Per identificare le variabili di controllo necessarie qui, ci si potrebbe chiedere quali altre variabili determinano non solo la soddisfazione di vita di qualcuno, ma anche la loro età. Molte altre variabili determinano la soddisfazione della vita. Ma nessun’altra variabile determina quanti anni ha qualcuno (purché rimangano vivi). (Tutte le persone continuano a invecchiare, allo stesso ritmo, indipendentemente dalle loro altre caratteristiche.) Quindi, non sono necessarie variabili di controllo qui.
Per determinare le variabili di controllo necessarie, può essere utile costruire un grafico aciclico diretto.