Abstrakt
Word sense disambiguation (WSD) je úkolem určit slova smyslu, podle jeho kontextu. Mnoho stávajících studií WSD používá externí přístup bez dozoru založený na znalostech, protože má méně omezení sady slov než přístupy pod dohledem vyžadující údaje o školení. V tomto článku, navrhujeme novou metodu WSD pro generování kontextu dvojznačného slova pomocí podobností mezi dvojznačným slovem a slovy ve vstupním dokumentu. Kromě toho, abychom využili naši metodu WSD, dále navrhujeme novou metodu výpočtu podobnosti slov založenou na struktuře sémantické sítě BabelNet. Vyhodnocujeme navržené metody na semeval-13 a SemEval-15 pro anglickou datovou sadu WSD. Experimentální výsledky ukazují, že navrhovaná metoda WSD významně zlepšuje výchozí metodu WSD. Navíc náš systém WSD překonává nejmodernější systémy WSD v datovém souboru Semeval-13. Konečně, má vyšší výkon než nejmodernější systém WSD bez dozoru založený na znalostech v průměrném výkonu obou datových souborů.