Словосочетания, эквивалентные слову
Аннотация
В текстах на русском языке часто встречаются устойчивые неизменяемые словосочетания, эквивалентные слову. При автоматическом анализе текста возникают проблемы, связанные с омонимичностью таких словосочетаний: они могут быть неоднословными лексическими оборотами (наречными, предложными, вводными и т. д.) или использоваться в качестве свободных словосочетаний. В некоторых случаях один и тот же оборот может иметь несколько семантических значений. В работе предлагаются алгоритмы снятия омонимии более чем для ста таких словосочетаний с наибольшей встречаемостью. Эти алгоритмы основаны не только на анализе морфологии ближайшего левого и правого контекста, но и на семантических классах слов контекста. Проведенная оценка правильности нашего разбора подобных словосочетаний показывает точность порядка 90–95% оборотов.