Pořadová data

existuje několik různých modelů, které lze použít k popisu struktury pořadových dat. Čtyři hlavní třídy modelu jsou popsány níže, každá definice pro náhodnou proměnnou Y {\displaystyle Y}

Y

, s úrovní indexovány k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,q}

.

Všimněte si, že v modelu definice níže, hodnoty μ k {\displaystyle \mu _{k}}

\mu _{k}

a β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

nebude stejné pro všechny modely pro stejnou sadu dat, ale zápis se používá k porovnání struktury různých modelů.

Proporcionální šance modelEdit

nejčastěji používaný model pro ordinální data je proporcionální šance, model, definovaný log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

kde parametry μ k {\displaystyle \mu _{k}}

\mu _{k}

popsat základní rozdělení ordinální data, x {\displaystyle \mathbf {x} }

\mathbf {x}

jsou proměnné a β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

jsou koeficienty popisující účinky na proměnné.

Tento model lze zobecnit tím, že definuje model pomocí μ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

místo μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

, a to by se model vhodný pro nominální data (kategorie, do kterých nemají žádné přirozené uspořádání) stejně jako ordinální data. Toto zobecnění však může ztížit přizpůsobení modelu datům.

Základní kategorie logit modelEdit

základní kategorie modelu je definován log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

Tento model neumožňuje ukládat objednání na kategorie a tak může být aplikován na nominální data, stejně jako ordinální data.

Objednal stereotyp modelEdit

objednané stereotyp model je definován log ⁡ = μ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

, kde skóre jsou parametry omezeny tak, že 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

.

To je více střídmá, a více specializované, model než základní kategorie logit model: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

může být myšlenka jako podobné β k {\displaystyle \mathbf {\beta } _{k}}

{\displaystyle \mathbf {\beta } _{k}}

.

non-nařídil stereotyp model má stejný tvar jako objednané stereotyp model, ale bez objednání uložené ϕ k {\displaystyle \phi _{k}}

\phi _{k}

. Tento model lze použít na nominální data.

Všimněte si, že napínací skóre, ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

, uveďte, jak je to snadné rozlišovat mezi různými úrovněmi Y {\displaystyle Y}

Y

. Pokud ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

pak to ukazuje, že aktuální soubor údajů pro proměnné x {\displaystyle \mathbf {x} }

\mathbf {x}

neposkytují moc informací rozlišovat mezi úrovní k {\displaystyle k}

k

a k − 1 {\displaystyle k-1}

k-1

, ale to nemusí nutně znamenat, že skutečné hodnoty k {\displaystyle k}

k

a k − 1 {\displaystyle k-1}

 k-1

jsou daleko od sebe. A pokud jsou hodnoty proměnné změnit, tak pro to nové údaje vybavená skóre ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

a ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k-1}}

pak může být daleko od sebe.

Přilehlých kategorií logit modelEdit

přilehlých kategorií model je definován log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

i když nejběžnější formě, uvedené v Agresti (2010) jako „proporcionální šance formě“ je definován log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

Tento model může být použita pouze pro ordinální data, od modelování pravděpodobnosti přechodu z jedné kategorie do další kategorie znamená, že objednávání z těchto kategorií existuje.

přilehlých kategorií logit model může být myšlenka jako zvláštní případ základní kategorie logit model, kde β k = β ( k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

. Přilehlé kategorie logit model může také být myšlenka jako zvláštní případ nařídil stereotyp model, kde ϕ k ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, tj. vzdálenosti mezi ϕ k {\displaystyle \phi _{k}}

\phi _{k}

jsou definovány v předstihu, spíše než být odhadnuta na základě údajů.

Srovnání mezi modelsEdit

proporcionální šance, model má velmi odlišnou strukturu na další tři modely, a také různé základní význam. Všimněte si, že velikost referenční kategorie v poměrné šance, model se pohybuje s k {\displaystyle k}

k

, od Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

je ve srovnání s Y > k {\displaystyle Y>k}

{\displaystyle Yk}

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

More: