Quando un modello ha un risultato binario, una dimensione comune dell’effetto è un rapporto di rischio. Come promemoria, un rapporto di rischio è semplicemente un rapporto di due probabilità. (Il rapporto di rischio è anche chiamato rischio relativo.)
I rapporti di rischio sono un po ‘ più complicati da interpretare quando sono inferiori a uno.
Una variabile predittiva con un rapporto di rischio inferiore a uno è spesso etichettata come “fattore protettivo” (almeno in Epidemiologia). Questo può essere fonte di confusione perché nella nostra tipica comprensione di questi termini, non ha senso che un rischio sia protettivo.
Quindi, come può un RISCHIO essere protettivo?
Bene, indicando un rischio inferiore.
Ad esempio, supponiamo che tu stia eseguendo un modello in cui il risultato è la condanna di un crimine (sì/no) e tra i tuoi predittori ci sono precedenti attività criminali (sì/no) e il diploma di scuola superiore (sì/no).
Ci aspetteremmo che un Sì su precedenti attività criminali sia correlato ad un aumento del rischio di commettere un crimine. Allo stesso modo, ci aspetteremmo che un Sì al diploma di scuola superiore sia correlato a una diminuzione del rischio di commettere un crimine.
In altre parole, l’attività criminale precedente sarebbe un fattore di rischio e il diploma di scuola superiore sarebbe un fattore protettivo. Tuttavia, l’effetto di entrambi i fattori sarebbe misurato con un rapporto di rischio.
Il rapporto di rischio è sempre definito come il rapporto tra la probabilità della categoria di confronto e la probabilità della categoria di riferimento.
Un rapporto di rischio maggiore di uno indica che la categoria di confronto indica un aumento del rischio.
Un rapporto di rischio inferiore a uno significa che la categoria di confronto è protettiva (cioè, rischio diminuito).
Diciamo che abbiamo i seguenti dati per un gruppo di imputati:
Convinzione Di Crimine |
|||
Laurea |
Sì |
No |
Totale |
No |
300 |
100 |
400 |
Sì |
225 |
175 |
400 |
Totale |
525 |
275 |
800 |
Da questa tabella, possiamo calcolare la probabilità che un laureato o un abbandono sia condannato per un crimine.
P(Condanna penale|Abbandono) = 300/400=.75
P (Condanna penale|Laureato) = 225/400 = .5625
E da questi, possiamo calcolare il rapporto di rischio per i laureati rispetto agli abbandoni.
RR: Laureati / abbandoni =.5625/.75 = .75
Come si può vedere, la probabilità di una condanna penale è inferiore per i laureati (.5625) di quanto lo sia per i forcellini (.75). Allo stesso modo, il rapporto di rischio di condanne penali per i laureati rispetto agli abbandoni è inferiore a uno (.75).
Quindi un’interpretazione è che la laurea è protettiva — è associata a un minor rischio di condanna.
Quanto più in basso? Da un fattore di .75, o 25% di rischio inferiore.
Ora, se invertiamo questo confronto, potremmo dire che abbandonare la scuola superiore aumenta il rischio e quindi è un fattore di rischio. Lo faremmo scambiando il confronto e ricalcolando il rapporto di rischio:
RR Forcellini / Laureati = .75/.56 = 1.33
Qui concludiamo che gli abbandoni hanno il 33% in più di probabilità rispetto ai laureati di essere condannati per un crimine.
Alcuni riferimenti consigliano di ricodificare i dati in modo che il rischio relativo sia sempre maggiore di 1. Tuttavia, è importante prendere in considerazione il messaggio che si desidera consegnare. Nell’esempio sopra, può avere senso portare a casa il messaggio che i laureati hanno il 25% in meno di probabilità di essere condannati.
Se, dopo l’analisi iniziale, si trovano i rapporti di rischio controintuitivi, è possibile ricodificare il gruppo di riferimento in modo che l’interpretazione abbia senso.