Abstract
Word sense disambiguation (WSD) to zadanie polegające na określeniu sensu słowa zgodnie z jego kontekstem. Wiele istniejących badań WSD używało zewnętrznego podejścia opartego na wiedzy bez nadzoru, ponieważ ma mniej ograniczeń zestawu słów niż podejścia nadzorowane wymagające danych szkoleniowych. W niniejszym artykule proponujemy nową metodę WSD do generowania kontekstu wieloznacznego słowa poprzez wykorzystanie podobieństw między niejednoznacznym słowem a słowami w dokumencie wejściowym. Ponadto, aby wykorzystać naszą metodę WSD, proponujemy nową metodę obliczania podobieństwa słów w oparciu o strukturę sieci semantycznej BabelNet. Oceniamy proponowane metody na SemEval-13 i SemEval-15 dla angielskiego zbioru danych WSD. Wyniki eksperymentów pokazują, że proponowana metoda WSD znacznie poprawia podstawową metodę WSD. Ponadto nasz system WSD przewyższa najnowocześniejsze systemy WSD w zestawie danych Semeval-13. Wreszcie, ma wyższą wydajność niż state-of-the-art bez nadzoru opartego na wiedzy systemu WSD w średniej wydajności obu zestawów danych.