når en model har et binært resultat, er en fælles effektstørrelse et risikoforhold. Som en påmindelse er et risikoforhold simpelthen et forhold på to sandsynligheder. (Risikoforholdet kaldes også relativ risiko.)
risikoforhold er lidt vanskeligere at fortolke, når de er mindre end en.
en forudsigelsesvariabel med et risikoforhold på mindre end en er ofte mærket som en “beskyttelsesfaktor” (i det mindste i epidemiologi). Dette kan være forvirrende, fordi det i vores typiske forståelse af disse udtryk ikke giver mening, at en risiko er beskyttende.
så hvordan kan en risiko være beskyttende?
Nå, ved at indikere lavere risiko.
lad os for eksempel sige, at du kører en model, hvor resultatet er overbevisning om en forbrydelse (ja/nej), og blandt dine forudsigere er tidligere kriminel aktivitet (ja/nej) og eksamen fra gymnasiet (ja/nej).
vi forventer, at et ja på tidligere kriminel aktivitet er relateret til en stigning i risikoen for at begå en forbrydelse. Ligeledes forventer vi, at et ja ved eksamen fra gymnasiet er relateret til et fald i risikoen for at begå en forbrydelse.
med andre ord ville tidligere kriminel aktivitet være en risikofaktor, og eksamen fra gymnasiet ville være en beskyttende faktor. Alligevel måles effekten af begge faktorer med et risikoforhold.
risikoforholdet defineres altid som forholdet mellem sammenligningskategoriens sandsynlighed og referencekategoriens Sandsynlighed.
et risikoforhold større end et betyder, at sammenligningskategorien indikerer øget risiko.
et risikoforhold mindre end et betyder, at sammenligningskategorien er beskyttende (dvs.nedsat risiko).
sig, at vi har følgende data for en gruppe tiltalte:
Forbrydelse Overbevisning |
|||
Eksamen |
Ja |
Nej |
I Alt |
Nej |
300 |
100 |
400 |
Ja |
225 |
175 |
400 |
I Alt |
525 |
275 |
800 |
fra denne tabel, vi kan beregne sandsynligheden for, at enten en kandidat eller et frafald er dømt for en forbrydelse.
P(forbrydelse overbevisning|Frafald) = 300/400 = .75
P(forbrydelse overbevisning|kandidat) = 225/400 = .5625
og ud fra disse kan vi beregne risikoforholdet for kandidater sammenlignet med frafald.
RR: kandidater/Frafald =.5625/.75 = .75
som du kan se, er sandsynligheden for en forbrydelse overbevisning lavere for kandidater (.5625) end det er for frafald (.75). Ligeledes er risikoforholdet for forbrydelser for kandidater sammenlignet med frafald mindre end en (.75).
så en fortolkning er, at eksamen er beskyttende — det er forbundet med en lavere risiko for overbevisning.
hvor meget lavere? Af en faktor .75 eller 25% lavere risiko.
hvis vi nu vendte denne sammenligning, kunne vi sige, at frafald af gymnasiet øger risikoen og derfor er en risikofaktor. Vi ville gøre dette ved at bytte sammenligningen og genberegne risikoforholdet:
RR Dropouts/Graduates = .75/.56 = 1.33
her konkluderer vi, at frafald er 33% mere tilbøjelige end kandidater til at blive dømt for en forbrydelse.
nogle referencer vil rådgive omkodning af dataene, så den relative risiko altid er større end 1. Det er dog vigtigt at tage højde for den besked, du vil levere. I eksemplet ovenfor kan det være fornuftigt at køre hjem beskeden om, at kandidater er 25% mindre tilbøjelige til at blive dømt.
hvis du efter din første analyse finder risikoforholdene kontraintuitive, kan du omkode referencegruppen, så fortolkningen giver mening.