Date ordinale

există mai multe modele diferite care pot fi utilizate pentru a descrie structura datelor ordinale. Patru clase majore de model sunt descrise mai jos, fiecare definită pentru o variabilă aleatorie y {\displaystyle Y}

Y

, cu niveluri indexate de k = 1, 2,…, q {\displaystyle k=1,2,\puncte, q}

{\displaystyle k=1,2,\puncte, q}

.

rețineți că, în definițiile modelului de mai jos, valorile lui k {\displaystyle \ mu _{k}}

\mu _ {k}

și {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

nu vor fi aceleași pentru toate modelele pentru același set de date, dar notația este utilizată pentru a compara structura diferitelor modele.

cote proportionale modelEdit

modelul cel mai frecvent utilizat pentru datele ordinale este modelul cotelor proportionale, definit de log = log x + log T x {\displaystyle \ log \ left = \ log \ left = \ mu _ {k} + \ mathbf {\beta } ^{T} \ mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

unde parametrii k {\displaystyle \mu _{k}}

\mu _{k}

descriu distribuția de bază a datelor ordinale, x {\displaystyle \mathbf {x} }

\mathbf {x}

sunt covariatele și {\displaystyle \ mathbf {\beta } }

\mathbf{\beta}

sunt coeficienții care descriu efectele covariatelor.

acest model poate fi generalizat prin definirea modelului folosind k + k t x {\displaystyle \mu _ {k} + \ mathbf {\beta } _{k}^{T} \ mathbf {x} }

{\displaystyle \ mu _ {k} + \ mathbf {\beta } _ {k}^{T} \ mathbf {x} }

în loc de X {\displaystyle \ mu _ {k} + \ mathbf {\beta } ^{T} \ mathbf {x} }

{\displaystyle \ mu _ {k} + \ mathbf {\beta } ^{T} \ mathbf {x} }

, iar acest lucru ar face modelul potrivit pentru date nominale (în care Categoriile nu au o ordonare naturală), precum și date ordinale. Cu toate acestea, această generalizare poate face mult mai dificilă adaptarea modelului la date.

categoria de bază logit modelEdit

modelul de categorie de bază este definit de log (log) x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta} _{k}^{T} \ mathbf {x} }

{\mu _{k}+\mathbf {\beta } _{k}^{T} \ mathbf {x} }

acest model nu impune o ordonare categoriilor și astfel poate fi aplicat datelor nominale, precum și datelor ordinale.

model stereotip Ordonatedit

modelul stereotip ordonat este definit de log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul: log-ul:} }

{\ displaystyle \log \ left = \ mu _ {k} + \ phi _ {k} \ mathbf {\beta } ^ {T}\mathbf {x} }

unde parametrii scorului sunt constrânși astfel încât 0 = 0=1 0 = 1 {\displaystyle 0 = \PHI _{1}\leq \PHI _{2}\leq \ dots \ leq \phi _ {Q}=1}

{\displaystyle 0 = \ phi _ {1}\leq \ phi _ {2}\LEQ \ dots \ LEQ \ phi _ {q}=1}

.

acesta este un model mai parsimonios și mai specializat decât modelul logit de categorie de bază:} }

{\ displaystyle \ phi _ {k} \ mathbf {\beta }}

poate fi considerat ca fiind similar cu k {\displaystyle \mathbf {\beta} _ {k}}

{\displaystyle \ mathbf {\beta } _ {k}}

.

modelul stereotip neordonat are aceeași formă ca și modelul stereotip ordonat, dar fără ordonarea impusă pe XQ {\displaystyle \ phi _ {k}}

\phi _ {k}

. Acest model poate fi aplicat datelor nominale.

rețineți că scorurile montate, de la sută ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }} _ {k}}

, indică cât de ușor este să se facă distincția între diferitele niveluri ale Y {\displaystyle Y}

Y

. În cazul în care x-1 {\displaystyle {\hat {\phi}} _ {k}\aprox {\hat {\phi}} _{k-1}}

{\displaystyle {\hat {\phi }} _{k} \ aprox {\hat {\phi }} _ {k-1}}

apoi, asta indică faptul că setul curent de date pentru covariatele x {\displaystyle \ mathbf {x} }

 \ mathbf {x}

nu oferă prea multe informații pentru a distinge între nivelurile k {\displaystyle k}

k

și k − 1 {\displaystyle k-1}

 k-1

, dar asta nu implică neapărat că valorile reale k {\displaystyle k}

k

și k – 1 {\displaystyle k-1}

k-1

sunt departe. Și dacă valorile covariatelor se schimbă, atunci pentru aceste date noi, scorurile montate sunt egale cu x ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }} _ {k}}

și K − 1 {\displaystyle {\hat {\phi }}_{K-1}}

{\stil de afișare {\hat {\phi }} _{k-1}}

ar putea fi apoi departe unul de altul.

Categorii adiacente logit modelEdit

modelul categoriilor adiacente este definit de log (log) x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta} _{k}^{T} \ mathbf {x} }

{\displaystyle \log \ left = \ mu _ {k} + \ mathbf {\beta } _{k}^{T} \ mathbf {x} }

deși forma cea mai comună, menționată în Agresti (2010) ca „formă de cote proporționale” este definită de log} }

{\displaystyle \log \ left = \ mu _ {k} + \ mathbf {\beta } ^{T} \ mathbf {x} }

acest model poate fi aplicat numai datelor ordinale, deoarece modelarea probabilităților deplasărilor de la o categorie la următoarea categorie implică existența unei ordonări a acestor categorii.

modelul logit al categoriilor adiacente poate fi gândit ca un caz special al modelului logit de categorie de bază, în cazul în care X = X ( K − 1) {\displaystyle \ mathbf {\beta } _ {k}= \ mathbf {\beta } (k-1)}

{\mathbf {\beta } _{k}= \ mathbf {\beta } (k-1)}

. Modelul logit al categoriilor adiacente poate fi, de asemenea, gândit ca un caz special al modelului stereotip ordonat, în cazul în care x-1 {\displaystyle \ phi _ {k} \ propto k-1}

{\displaystyle \ phi _ {k} \ propto k-1}

, adică distanțele dintre k {\displaystyle \Phi _{k}}

\phi _{k}

sunt definite în avans, mai degrabă decât estimate pe baza datelor.

comparații între modeledit

modelul cotelor proporționale are o structură foarte diferită față de celelalte trei modele și, de asemenea, o semnificație subiacentă diferită. Rețineți că dimensiunea categoriei de referință din modelul cote proporționale variază în funcție de k {\displaystyle k}

k

, din moment ce y xk {\displaystyle Y \ leq k}

 {\displaystyle Y \ leq k}

este comparat cu Y > k {\displaystyle y> k}

 {\displaystyle Yk}

Lasă un răspuns

Adresa ta de email nu va fi publicată.

More: