Например, Бобцов

Анализ тематической структуры текстов с ошибками

Сборник тезисов
Конференция:VI Всероссийский конгресс молодых ученых
Раздел:Информационные и интеллектуальные системы и технологии
Рубрика:Информационные технологии
Год:2016

Анализ тематической структуры текстов с ошибками

УДК:004.852

Аннотация

Работа посвящена анализу тематической структуры текстов с ошибками и является частью исследования о применении тематического моделирования для оценки качества распознанного текста. Чтобы понять, как ошибки влияют на тематическую структуру текста, с помощью библиотеки BigArtm и корпуса текстов "OpenCorpora" была обучена тематическая модель. Данная модель использовалась для получения тематической структуры текстов с ошибками и без ошибок. На основе полученных данных была выявлена следующая закономерность: тексты с большим количеством ошибок имеют более равномерную тематическую структуру.

Материалы конференций