Sorszámadatok

számos különböző modell használható a sorszámadatok szerkezetének leírására. Az alábbiakban négy fő modellosztályt ismertetünk, amelyek mindegyike egy Y {\displaystyle Y véletlen változóra van definiálva}

Y

, K = 1, 2,…, q {\displaystyle k=1,2,\dots, q}

{\displaystyle k=1,2,\dots, q}

indexelt szintekkel .

vegye figyelembe, hogy az alábbi modelldefiníciókban a\K {\displaystyle \ mu _{k értékei}}

\A Mu _{k}

és a {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

nem lesz azonos minden modell esetében ugyanazon adathalmaz esetében, de a jelölést a különböző modellek szerkezetének összehasonlítására használják.

proporcionális odds modelEdit

a sorszámadatok leggyakrabban használt modellje az arányos odds modell, amelyet a log (log) = log (log) = K + T X {\displaystyle \log \ left= \ log \ left= \ mu _ {k}+ \ mathbf (\beta} ^{T} \ mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

ahol a paraméterek Az\k {\displaystyle\mu _{k}}

\mu _{k}

a sorszámadatok alapeloszlását írják le, x {\displaystyle\mathbf {x} }

 \ mathbf {x}

a kovariánsok és az ons és az Anavar {\displaystyle \ mathbf {\beta } }

\mathbf {\beta}

a kovariánsok hatásait leíró együtthatók.

ez a modell általánosítható úgy, hogy meghatározzuk a modellt a (Z) {\displaystyle \ mu _{k} + \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

{\displaystyle\mu _{k}+\mathbf {\beta } _{k}^{T} \ mathbf {x} }

ahelyett, hogy \ K + \ T X {\displaystyle \mu _ {k} + \ mathbf {\beta } ^{T} \ mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

, és ez alkalmassá tenné a modellt névleges adatokra (amelyekben a kategóriáknak nincs természetes sorrendjük), valamint sorszámokra. Ez az általánosítás azonban sokkal nehezebbé teheti a modell illesztését az adatokhoz.

Alapkategória logit modelEdit

az alapkategóriamodellt a következő képlet határozza meg: log (=log) = K + K T x {\displaystyle \ log \ left= \ mu _{k}+ \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

{\displaystyle \log \ left= \ mu _ {k} + \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

ez a modell nem írja elő a kategóriák sorrendjét, így alkalmazható mind a névleges adatokra, mind a sorszámokra.

rendezett sztereotípiamodellszerkesztés

a rendezett sztereotípiamodellt a következő képlet adja meg: log (log) = ~ K + ~ K ~ T X {\displaystyle \ log \ left= \ mu _{k}+ \ phi _ {k} \ mathbf {\beta } ^{T} \ mathbf {x} }

{\displaystyle \ log \ left= \ mu _ {k}+ \ phi _ {k} \ mathbf {\beta } ^{T} \mathbf {x} }

ahol a pontszámparaméterek úgy vannak korlátozva, hogy 0 = 6 = 1 0=1 {\displaystyle 0 = \PHI _{1} \leq \ PHI _ {2} \leq\Dots \ leq \Phi _ {Q}=1}

{\displaystyle 0= \ phi _ {1} \ leq \phi _ {2} \ leq \ dots \ leq \ phi _ {q}=1}

.

ez egy parsimonikusabb és specializáltabb modell, mint az alapkategóriás logit-modell: \ k \ \ displaystyle \phi _{k} \ mathbf {\beta } }

{\a displaystyle \phi _ {k} \ mathbf {\beta } }

hasonlónak tekinthető a K {\displaystyle \ mathbf {\beta } _ {k}}

{\displaystyle \ mathbf {\beta } _ {k}}

.

a nem rendezett sztereotípiamodell formája megegyezik a rendezett sztereotípiamodell formájával, de a rá kényszerített sorrend nélkül! \ k {\displaystyle \ phi _ {k}}

\phi _ {k}

. Ez a modell alkalmazható a névleges adatokra.

vegye figyelembe, hogy az illesztett pontszámok, ^ k {\displaystyle {\hat {\phi }} _ {k}}

{\displaystyle {\hat {\phi }} _ {k}}

, jelölje meg, milyen könnyű megkülönböztetni az Y {\displaystyle Y}

Y

különböző szintjeit . Ha {\K \ \ K \ \ K-1 {\displaystyle {\kalap {\Phi}} _{k}\kb {\kalap {\Phi}} _{k-1}}

{\displaystyle {\hat {\phi }} _ {k} \ approx {\hat {\phi }} _ {k-1}}

akkor ez azt jelzi, hogy az X {\displaystyle \mathbf {x} }

\mathbf {x}

kovariánsok aktuális adathalmaza nem nyújt sok információt a K szintek megkülönböztetéséhez {\displaystyle k}

k

és k − 1 {\displaystyle k-1}

k-1

, de ez nem feltétlenül jelenti azt, hogy a tényleges értékek k {\displaystyle k}

k

és k-1 {\displaystyle k-1}

k-1

távol vannak egymástól. És ha a kovariánsok értékei megváltoznak, akkor az új adatoknál az illesztett pontszámok a következők: ^ k {\displaystyle {\hat {\phi }} _ {k}}

{\{\hat {\phi }} _ {k}}

és ^ K-1 {\displaystyle {\hat {\phi }} _ {k-1}}

{\displaystyle {\hat {\phi }} _ {k-1}}

lehet, hogy akkor messze van egymástól.

szomszédos kategóriák logit modelEdit

a szomszédos kategóriák modelljét a következő képlet határozza meg: log _ = KB + K T x {\displaystyle \ log \ left= \ mu _ {k}+ \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

{\displaystyle \ log \ left= \ mu _ {k}+ \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

bár a leggyakoribb forma, amelyet Agresti (2010) “arányos odds formaként” említ, a log által definiált log (log) = ~ K + ~ T x {\displaystyle \ log \ left= \ mu _ {k}+ \ mathbf {\beta } ^{T} \ mathbf {x} }

{\displaystyle \log \ left= \ mu _ {k} + \ mathbf {\beta} ^{T} \ mathbf {x} }

ez a modell csak sorszámadatokra alkalmazható, mivel az egyik kategóriából a következő kategóriába való elmozdulás valószínűségének modellezése azt jelenti, hogy e kategóriák sorrendje létezik.

a szomszédos kategóriák logit modellje az alapkategóriás logit modell speciális esetének tekinthető, ahol a ( K ) {\displaystyle \mathbf {\beta } _{k} = \mathbf {\beta } (K-1)}

{\displaystyle \ mathbf {\beta } _ {k}= \ mathbf {\beta } (k-1)}

. A szomszédos kategóriák logit modellje a rendezett sztereotípiamodell speciális eseteként is felfogható, ahol \ K \ K-1 {\displaystyle \ phi _ {k} \ propto k-1}

{\displaystyle \ phi _ {k} \ propto k-1}

, azaz a távolságokat a (z) \k {\displaystyle\phi _{k}}

 \ phi _{k}

között előre meg kell határozni, nem pedig az adatok alapján kell megbecsülni.

összehasonlítások a modelsEdit

az arányos odds modell nagyon eltérő szerkezetű, mint a másik három modell, és más mögöttes jelentése is van. Ne feledje, hogy az arányos odds modellben a referenciakategória mérete k {\displaystyle k-vel változik}

k

, mivel a {\displaystyle y\leq k}

{\displaystyle y\leq k}

az Y > k {\displaystyle y>k}

{\displaystyle Yk}

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

More: