Например, Бобцов

Тематическое моделирование русскоязычных текстов с опорой на леммы и лексические конструкции

Сборник тезисов
Конференция:XX Объединенная научная конференция «Интернет и современное общество» (IMS‑2017)
Раздел:КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ВЫЧИСЛИТЕЛЬНЫЕ ОНТОЛОГИИ. Выпуск 1
Рубрика:КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ВЫЧИСЛИТЕЛЬНЫЕ ОНТОЛОГИИ
Год:2017

Тематическое моделирование русскоязычных текстов с опорой на леммы и лексические конструкции

УДК:

Аннотация

Исследование посвящено усовершенствованию методов вероятностного тематического моделирования, направленных на выявление скрытых взаимосвязей между словами, документами и темами в текстовых коллекциях. В большинстве тематических моделей темы представлены исключительно униграммами, что в некоторых случаях влечет за собой ухудшение точности и повышает сложность содержательной интерпретации выделяемых тем. Нами предложен новый алгоритм на основе метода LDA, позволяющий автоматически выделять в корпусе словосочетания, состоящие из двух слов, и добавлять их в тематические модели. В статье изложена работа алгоритма и приведены результаты его применения в автоматической обработке корпусов специальных текстов. 

Материалы конференций