Ordinära data

det finns flera olika modeller som kan användas för att beskriva strukturen för ordinära data. Fyra huvudklasser av modeller beskrivs nedan, var och en definierad för en slumpmässig variabel Y {\displaystyle Y}

Y

, med nivåer indexerade av k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,q}

.

Observera att i modelldefinitionerna nedan, värdena för k {\displaystyle \mu _ {k}}

\mu _{k}

och {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

kommer inte att vara samma för alla modeller för samma uppsättning data, men notationen används för att jämföra strukturen för de olika modellerna.

Proportionell odds modelEdit

Den mest använda modellen för ordningstal data är proportionell odds modell, som definieras genom att logga in ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \kvar=\log \kvar=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \kvar=\log \kvar=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

där parametrarna μ k {\displaystyle \mu _{k}}

\mu _{k}

beskriver basen för fördelning av de ordningstal data, x {\displaystyle \mathbf {x} }

\mathbf {x}

är kovariater och β {\displaystyle \ mathbf {\beta } }

\mathbf{\beta}

är koefficienterna som beskriver kovariaternas effekter.

denna modell kan generaliseras genom att definiera modellen med hjälp av K + K x {\displaystyle \mu _ {k}+\mathbf {\beta } _ {k}^{t} \ mathbf {x} }

{\displaystyle \mu _ {k} + \mathbf {\beta } _{k}^{t} \ mathbf {x} }

i stället för att ta i bruk k + ta i bruk t x {\displaystyle \ mu _ {k}+\mathbf {\beta } ^{t} \ mathbf {x} }

{\displaystyle \mu _ {k} + \mathbf {\beta } ^{t}\mathbf {x} }

, och detta skulle göra modellen lämplig för nominella data (där kategorierna inte har någon naturlig ordning) såväl som ordinära data. Denna generalisering kan dock göra det mycket svårare att passa modellen till data.

Baslinjekategori logit-modellredigera

baslinjekategorimodellen definieras av logg 0 = K + K x {\displaystyle \ log \ left= \ mu _ {k}+\mathbf {\beta } _{k}^{t} \ mathbf {x} }

{\displaystyle \ log \ left=\mu _ {k}+\mathbf {\beta } _ {k}^{T} \ mathbf {x} }

denna modell innebär inte en beställning på kategorierna och kan därför tillämpas på nominella data såväl som ordinära data.

beställd stereotyp modellredigera

den beställda stereotypen är definierad av log: s = k + k + x {\displaystyle \log \left=\mu _{k} + \ phi _{k} \ mathbf {\beta } ^{t} \ mathbf {x} }

{\displaystyle \ log\left= \ mu _{k} + \phi _{k} \ mathbf {\beta } ^{t} \ mathbf {x} }

där poängparametrarna är begränsade så att 0 = 1 kg 1 kg 2 kg Q = 1 {\displaystyle 0 = \ PHI _ {1} \ leq\PHI _ {2}\leq \ Dots \ leq \Phi _ {Q}=1}

{\displaystyle 0= \ phi _ {1}\leq \ phi _ {2}\leq \ dots \leq \ phi _ {q}=1}

.

detta är en mer parsimonious och mer specialiserad modell än baslinjekategorin logit-modell: Bisexuell k {\displaystyle \ phi _{k} \ mathbf {\beta } }

{\displaystyle \ phi _ {k} \ mathbf {\beta } }

kan ses som liknar den i k {\displaystyle \ mathbf {\beta } _{k}}

{\displaystyle \ mathbf {\beta } _ {k}}

.

den icke-beställda stereotyp modell har samma form som den beställda stereotyp modell, men utan den beställning som åläggs på C {\displaystyle \ phi _{k}}

\phi _{k}

. Denna modell kan tillämpas på nominella data.

Observera att de monterade poängen, Bisexuell ^ k {\displaystyle {\hat {\phi }} _ {k}}

{\displaystyle {\hat {\phi }}_{k}}

, ange hur lätt det är att skilja mellan de olika nivåerna av Y {\displaystyle Y}

Y

. Om det är så att det är så att det är så att det är så att det är så att det är så att det är så att det är så att det är så-1}}

{\displaystyle {\hat {\phi }} _ {k} \ Ca {\hat {\phi }} _ {k-1}}

då indikerar det att den aktuella uppsättningen data för kovariaten x {\displaystyle \ mathbf {x} }

\mathbf {x}

inte ger mycket information för att skilja mellan nivåerna k {\displaystyle k}

k

och k − 1 {\displaystyle k-1}

k-1

, men det innebär inte nödvändigtvis att de faktiska värdena k {\displaystyle k}

k

och k – 1 {\displaystyle k-1}

k-1

är långt ifrån varandra. Och om kovariaternas värden ändras, då för den nya informationen får de monterade poängen {\displaystyle {\hat {\phi }} _ {k}}

{\displaystyle {\hat {\phi }} _ {k}}

och 2 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }} _ {k-1}}

kan då vara långt ifrån varandra.

angränsande kategorier logit modellredigera

angränsande kategorier modell definieras av logj = K + K x {\displaystyle \ log \ left= \ mu _ {k}+\mathbf {\beta } _ {k}^{t} \ mathbf {x} }

{\displaystyle \ log \ left=\mu _ {k} + \mathbf {\beta } _{k}^{t}\mathbf {x} }

även om den vanligaste formen, som hänvisas till i Agresti (2010) som ”proportionell oddsform” definieras av loggsexbylen = c + c x {\displaystyle \ log \ left=\mu _{k}+\mathbf {\beta } ^{t} \ mathbf {x} }

{\displaystyle \ log \ left= \ mu _ {k}+\mathbf {\beta } ^{t} \ mathbf {x} }

denna modell kan endast tillämpas på ordinära data, eftersom modellering av sannolikheterna för skift från en kategori till nästa kategori innebär att en ordning av dessa kategorier finns.

de intilliggande kategorierna logit-modellen kan ses som ett specialfall av baslinjekategorin logit-modellen, där K = K ( K − 1) {\displaystyle \ mathbf {\beta } _{k}= \ mathbf {\beta } (k-1)}

{\displaystyle \ mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

. De intilliggande kategorierna logit-modellen kan också ses som ett speciellt fall av den beställda stereotyp-modellen, där CJL k CJL K-1 {\displaystyle \ phi _ {k} \ propto k-1}

{\displaystyle \ phi _ {k}\propto k-1}

, det vill säga avståndet mellan k {\displaystyle \phi _{k}}

\phi _{k}

definieras i förväg, snarare än att beräknas baserat på data.

jämförelser mellan modelsEdit

den proportionella odds modellen har en helt annan struktur till de andra tre modellerna, och även en annan underliggande innebörd. Observera att storleken på referenskategorin i den proportionella oddsmodellen varierar med k {\displaystyle k}

k

, eftersom y-oc k {\displaystyle Y \ leq k}

 {\displaystyle Y\leq k}

jämförs med Y > k {\displaystyle Y> k}

 {\displaystyle yk}

Lämna ett svar

Din e-postadress kommer inte publiceras.

More: