Dane porządkowe

istnieje kilka różnych modeli, które można wykorzystać do opisania struktury danych porządkowych. Poniżej opisano cztery główne klasy modelu, każda zdefiniowana dla zmiennej losowej y {\displaystyle Y}

Y

, z poziomami indeksowanymi przez k = 1, 2,…, q {\displaystyle k=1,2,\dots, q}

{\displaystyle k=1,2,\dots, q}

.

zauważ, że w poniższej definicji modelu wartości μ k {\displaystyle \mu _ {k}}

\mu _ {k}

i β {\displaystyle \ mathbf {\beta } }

\mathbf{\beta}

nie będą takie same dla wszystkich modeli dla tego samego zestawu danych, ale notacja jest używana do porównania struktury różnych modeli.

model kursów Proporcjonalnychedytuj

najczęściej stosowanym modelem dla danych porządkowych jest model kursów proporcjonalnych, zdefiniowany przez log ⁡ = log ⁡ = μ k + β t X {\displaystyle \log \ left=\log \ left = \ mu _ {k} + \ mathbf {\beta} ^{t} \ mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

gdzie parametry μ k {\displaystyle \mu _{k}}

\mu _{k}

opisują rozkład bazowy danych porządkowych, x {\displaystyle \mathbf {x} }

\mathbf {x}

są kowariatami i β {\displaystyle\mathbf {\beta } }

\mathbf {\beta}

to współczynniki opisujące efekty kowariatów.

ten model można uogólnić definiując model za pomocą μ k + β k t X {\displaystyle \ mu _ {k}+ \ mathbf {\beta } _{k}^{t} \ mathbf {x} }

{\displaystyle \ mu _ {k}+ \ mathbf {\beta } _ {k}^{T} \ mathbf {x}}

zamiast μ k + β t x {\displaystyle \ mu _ {k}+ \ mathbf {\beta} ^{t} \ mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

, a to sprawi, że model będzie odpowiedni dla danych nominalnych (w których Kategorie nie mają naturalnego porządku), a także dla danych porządkowych. Jednak to uogólnienie może znacznie utrudnić dopasowanie modelu do danych.

Kategoria bazowa model logitedit

model kategorii bazowej jest zdefiniowany przez log ⁡ = μ k + β k t X {\displaystyle \log \left=\mu _{k}+\mathbf {\beta} _ {K}^{T} \ mathbf {x} }

{\displaystyle \log \ left= \ mu _ {k}+ \ mathbf {\beta } _{k}^{T}\mathbf {x} }

model ten nie nakłada porządkowania na kategorie i dlatego może być stosowany zarówno do danych nominalnych, jak i porządkowych.

uporządkowany model stereotypuedytuj

uporządkowany model stereotypu jest zdefiniowany przez log ⁡ = μ k + ϕ k β t X {\displaystyle \log \ left= \ mu _ {k} + \ phi _{k} \ mathbf {\beta} ^{t} \ mathbf {x} }

{\displaystyle \log \ left=\mu _{k}+\phi _ {k} \ mathbf {\beta } ^{t} \ mathbf {x}}

gdzie parametry wyniku są ograniczone tak, że 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0 = \ phi _{1} \ leq \ phi _{2} \ leq \ dots \leq \ phi _{q}=1}

{\displaystyle 0= \ phi _ {1} \ leq \ phi _{2} \ leq \ dots \ leq \ phi _ {q}=1}

.

to jest bardziej parsymoniczny i bardziej wyspecjalizowany model niż podstawowy model logitu kategorii: ϕ k β {\displaystyle \ phi _{k} \ mathbf {\beta } }

{\displaystyle \phi _{k} \ mathbf {\beta }}

można uważać za podobne do β k {\displaystyle \ mathbf {\beta } _ {k}}

{\displaystyle \ mathbf {\beta} _{k}}

.

model stereotypu nieuporządkowanego ma taką samą formę jak model stereotypu uporządkowanego, ale bez uporządkowania narzuconego na ϕ k {\displaystyle \ phi _{k}}

\phi _{k}

. Model ten można zastosować do danych nominalnych.

zauważ, że dopasowane wyniki, ϕ ^ k {\displaystyle {\hat {\phi}} _{k}}

{\displaystyle {\Hat {\phi }} _ {k}}

, wskaż, jak łatwo jest rozróżnić różne poziomy Y {\displaystyle Y}

y

. If ϕ ^ k ≈ ≈ ^ k-1 {\displaystyle {\hat {\phi}} _{k} \ approx {\hat {\phi }} _{k-1}}

{\displaystyle {\hat {\phi}} _{k} \ approx {\hat {\phi }} _{k-1}}

oznacza to, że bieżący zestaw danych dla zmiennych x {\displaystyle \ mathbf {x} }

 \ mathbf {x}

nie dostarcza zbyt wielu informacji, aby odróżnić poziomy k {\displaystyle k}

k

i k-1 {\displaystyle k-1}

 k-1

, ale to nie musi oznaczać, że rzeczywiste wartości k {\displaystyle k}

k

i k-1 {\displaystyle k-1}

 k-1

są daleko od siebie. A jeśli wartości zmiennych zmienią się, to dla tych nowych danych dopasowane wyniki ϕ ^ k {\displaystyle {\Hat {\phi}} _{k}}

{\displaystyle {\Hat {\phi }}_{k}}

i ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi}} _{k-1}}

wtedy może być daleko od siebie.

przyległe kategorie model logitedit

przyległy model kategorii jest zdefiniowany przez log ⁡ = μ k + β k t X {\displaystyle \log \left=\mu _{k}+\mathbf {\beta} _ {K}^{T} \ mathbf {x} }

{\displaystyle \log \left = \ mu _ {k} + \mathbf {\beta } _{k}^{t} \ mathbf {x}}

chociaż najczęstszą formą, określoną w Agresti (2010) jako „forma proporcjonalna” jest zdefiniowana przez log ⁡ = μ k + β t X {\displaystyle \log \ left= \ mu _ {k}+ \ mathbf {\beta} ^{t} \ mathbf {x} }

{\displaystyle \log \ left= \ mu _{k} + \ mathbf {\beta } ^{T} \ mathbf {x}}

ten model może być stosowany tylko do danych porządkowych, ponieważ modelowanie prawdopodobieństwa przesunięć z jednej kategorii do następnej kategorii oznacza, że istnieje uporządkowanie tych kategorii.

model logit kategorii sąsiadujących można traktować jako szczególny przypadek modelu logit kategorii bazowej, gdzie β k = β (K-1) {\displaystyle \mathbf {\beta } _{k}= \ mathbf {\beta} (k-1)}

{\displaystyle \mathbf {\beta} _{k}= \ mathbf {\beta} (k-1)}

. Model logit kategorii sąsiednich można również traktować jako szczególny przypadek modelu stereotypu uporządkowanego, gdzie ϕ k ∝ k-1 {\displaystyle \ phi _{k} \ propto k-1}

{\displaystyle \phi _ {k} \ propto k-1}

, tzn. odległości między ϕ k {\displaystyle \ phi _ {k}}

 \ phi _{k}

są zdefiniowane z góry, a nie szacowane na podstawie danych.

porównania pomiędzy modelamiedytuj

model kursów proporcjonalnych ma zupełnie inną strukturę niż pozostałe trzy modele, a także inne znaczenie bazowe. Zauważ, że rozmiar kategorii referencyjnej w modelu kursów proporcjonalnych różni się od k {\displaystyle k}

k

, ponieważ Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

jest porównywane z y > K {\displaystyle Y> k}

 {\displaystyle Yk}

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

More: