Ordinære data

der er flere forskellige modeller, der kan bruges til at beskrive strukturen af ordinære data. Fire hovedklasser af model er beskrevet nedenfor, hver defineret for en tilfældig variabel y {\displaystyle Y}

Y

, med niveauer indekseret af k = 1 , 2 , … , s {\displaystyle k=1,2,\dots ,s}

{\displaystyle k=1,2,\dots ,s}

.

Bemærk, at i modeldefinitionerne nedenfor er værdierne for kur k {\displaystyle \ mu _{k}}

\mu _{k}

og {\displaystyle \mathbf {\beta}}

\mathbf{\beta}

vil ikke være den samme for alle modeller for det samme datasæt, men notationen bruges til at sammenligne strukturen af de forskellige modeller.

Proportional odds modelEdit

den mest almindeligt anvendte model til ordinære data er proportional odds model, defineret af log Larsen = log Larsen = kursen k + kursen t {\displaystyle \ log \ left= \ log \ left= \ mu _{k} + \ mathbf {\beta } ^{T} \ mathbf {} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {{}}

hvor parametrene er k {\displaystyle \mu _{k}}

\mu _{k}

beskriver basisfordelingen af ordinære data, {\displaystyle \mathbf {}}

\mathbf {

er de kovariater og {\displaystyle \ mathbf {\beta } }

\mathbf{\beta}

er koefficienterne, der beskriver virkningerne af kovariaterne.

denne model kan generaliseres ved at definere modellen ved hjælp af en k + en k T {\displaystyle \mu _ {k} + \ mathbf {\beta } _{k}^{T} \ mathbf {} }

{\displaystyle \mu _{k} + \mathbf {\beta } _{k}^{T}\mathbf {{t}}

i stedet for en k + en k {\displaystyle \mu _{k} + \mathbf {\beta } ^{T} \ mathbf {} }

{\displaystyle \mu _{k} + \ mathbf {\beta } ^{t}\mathbf {

, og dette ville gøre modellen velegnet til nominelle data (hvor kategorierne ikke har nogen naturlig rækkefølge) såvel som ordinære data. Denne generalisering kan dog gøre det meget vanskeligere at tilpasse modellen til dataene.

Basislinjekategori logit modelEdit

basislinjekategorimodellen er defineret ved hjælp af log lart = larg k + larg k T {\displaystyle \ log \ left= \ mu _{k} + \ mathbf {\beta } _{k}^{T} \ mathbf {} }

{\displaystyle \log \ left= \ mu _{k} + \mathbf {\beta } _{k}^{T} \ mathbf {} }

denne model pålægger ikke kategorierne en ordre og kan derfor anvendes på nominelle data såvel som ordinære data.

ordnet stereotyp modelEdit

den ordnede stereotyp model er defineret ved hjælp af log-lit = – lit k + – lit k-lit t {\displaystyle \ – lit \ left= \ mu _{k} + \ phi _{k} \ mathbf {\beta } ^{T} \ – lit} }

{\displaystyle \ log \ left= \ mu _{k} + \ phi _{k} \ mathbf {\beta } ^{T} \ mathbf {\} }

hvor scoreparametrene er begrænset således, at 0 = left 1 left 2 left = 1 {\displaystyle 0=\PHI _{1}\left \phi _ {2} \ left\dots \ Left \Phi _ {L}=1}

{\displaystyle 0= \ phi _{1} \ leke \phi _{2}\leke \ prikker \leke \ phi _ {K}=1}

.

dette er en mere parsimonious, og mere specialiseret, model end basislinjekategorien logit-model: prisT k prisT {\displaystyle \ phi _{k} \ mathbf {\beta } }

{\displaystyle \ phi _{k} \ mathbf {\beta } }

kan betragtes som svarende til L. k {\displaystyle \ mathbf {\beta } _{k}}

{\displaystyle \ mathbf {\beta } _{k}}

.

den ikke-ordnede stereotypemodel har samme form som den ordnede stereotypemodel, men uden den ordre, der er pålagt Kurt k {\displaystyle \ phi _{k}}

\phi _{k}

. Denne model kan anvendes på nominelle data.

Bemærk, at de monterede scoringer, store ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

, angiv, hvor let det er at skelne mellem de forskellige niveauer af y {\displaystyle Y}

Y

. If Larsen ^ K Larsen ^ K − 1 {\displaystyle {\hat {\Phi}} _{k}\ca {\hat {\Phi}} _{k-1}}

{\{\hat {\phi }}_{k} \ ca {\hat {\phi }}_{k-1}}

derefter indikerer det, at det aktuelle datasæt for kovariaterne {\displaystyle \ mathbf {}}

 \ mathbf {

ikke giver meget information til at skelne mellem niveauer k {\displaystyle k}

k

og k − 1 {\displaystyle k-1}

k-1

, men det betyder ikke nødvendigvis, at de faktiske værdier k {\displaystyle k}

k

og k – 1 {\displaystyle k-1}

k-1

er langt fra hinanden. Og hvis værdierne af kovariaterne ændres, så for de nye data scorer de monterede lot ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

og list ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }} _ {k-1}}

kan så være langt fra hinanden.

hosliggende kategorier logit modelEdit

den hosliggende kategorimodel er defineret ved hjælp af log Lars = Lars k + Lars k T {\displaystyle \ log \ left= \ mu _{k} + \ mathbf {\beta } _{k}^{T} \ mathbf {} }

{\displaystyle \log \ left= \ mu _{k} + \mathbf {\beta } _{k}^{t}\mathbf {\} }

selvom den mest almindelige form, der henvises til i Agresti (2010) som “proportional odds form”, er defineret af log Lars = Lars k + Lars t {\displaystyle \log \ left=\mu _{k} + \ mathbf {\beta } ^{T} \ mathbf {} }

{\displaystyle \ log \ left= \ mu _{k} + \mathbf {\beta } ^{T} \ mathbf {}}

denne model kan kun anvendes på ordinære data, da modellering af sandsynlighederne for skift fra en kategori til den næste kategori indebærer, at der findes en rækkefølge af disse kategorier.

den tilstødende kategorier logit-model kan betragtes som et specielt tilfælde af basislinjekategorilogit-modellen, hvor prisT k = prisT (k-1) {\displaystyle \ mathbf {\beta } _{k}= \ mathbf {\beta } (k-1)}

{\displaystyle \ mathbf {\beta } _{k}= \ mathbf {\beta } (k-1)}

. Den tilstødende kategorier logit-model kan også betragtes som et specielt tilfælde af den ordnede stereotype model, hvor Kurt k Kurt k-1 {\displaystyle \ phi _{k} \ propto k-1}

{\displaystyle \ phi _ {k} \ propto k-1}

, dvs. afstandene mellem den store K {\displaystyle \ phi _ {k}}

\phi _{k}

er defineret på forhånd snarere end at blive estimeret ud fra dataene.

sammenligninger mellem modellerneredit

proportional odds-modellen har en meget anden struktur end de andre tre modeller og også en anden underliggende betydning. Bemærk, at størrelsen af referencekategorien i den proportionale odds-model varierer med K {\displaystyle k}

k

, siden y-k {\displaystyle Y \ leksik k}

 {\displaystyle Y \ leksik k}

sammenlignes med Y > k {\displaystyle Y >k}

 {\displaystyle Yk}

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

More: