Abstrakti
Sananaisti-disambiguaatio (WSD), on tehtävä määrittää sananaisti asiayhteyden mukaan. Monissa nykyisissä WSD-tutkimuksissa on käytetty ulkopuolista tietoon perustuvaa valvomatonta lähestymistapaa, koska siinä on vähemmän word set-rajoituksia kuin koulutustietoja vaativissa valvotuissa lähestymistavoissa. Tässä asiakirjassa ehdotamme uutta WSD-menetelmää, jolla luodaan monitulkintaisen sanan konteksti käyttämällä moniselitteisen sanan ja syöteasiakirjan sanojen yhtäläisyyksiä. Lisäksi WSD-menetelmämme hyödyntämiseksi ehdotamme uutta sanan samankaltaisuuden laskentamenetelmää, joka perustuu babelnetin semanttiseen verkkorakenteeseen. Arvioimme ehdotettuja menetelmiä Englannin WSD-aineistojen SemEval-13 ja SemEval-15 osalta. Kokeelliset tulokset osoittavat, että ehdotettu WSD-menetelmä parantaa merkittävästi perustason WSD-menetelmää. Lisäksi WSD-järjestelmämme päihittää Semival-13-aineiston huipputekniset WSD-järjestelmät. Lopuksi, se on parempi suorituskyky kuin state-of-the-art valvomaton tietoon perustuva WSD järjestelmä keskimääräinen suorituskyky molempien tietojoukkojen.