abstrakt
ordsans disambiguation (VSD) er opgaven at bestemme ordsans i henhold til dens kontekst. Mange eksisterende VSD-undersøgelser har brugt en ekstern videnbaseret tilgang uden tilsyn, fordi den har færre ordsæt begrænsninger end overvågede tilgange, der kræver træningsdata. I dette papir foreslår vi en ny VSD-metode til at generere konteksten af et tvetydigt ord ved at bruge ligheder mellem et tvetydigt ord og ord i inputdokumentet. For at udnytte vores VSD-metode foreslår vi desuden en ny beregningsmetode for ordlighed baseret på Babelnets semantiske netværksstruktur. Vi vurderer de foreslåede metoder på SemEval – 13 og SemEval-15 for engelsk VSD datasæt. Eksperimentelle resultater viser, at den foreslåede VSD-metode forbedrer baseline VSD-metoden betydeligt. Desuden overgår vores VSD-system de nyeste VSD-systemer i Semeval-13-datasættet. Endelig har det højere ydeevne end det avancerede ikke-overvågede videnbaserede VSD-system i den gennemsnitlige ydeevne for begge datasæt.