Например, Бобцов

Интеграция тезаурусов RussNet и YARN

Сборник тезисов
Конференция:XIX Объединенная научная конференция «Интернет и современное общество» (IMS‑2016)
Раздел:КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ВЫЧИСЛИТЕЛЬНЫЕ ОНТОЛОГИИ
Рубрика:РАЗДЕЛ 1.
Год:2016

Интеграция тезаурусов RussNet и YARN

УДК:81.26

Аннотация

На сегодняшний день отсутствует большой открытый тезаурус русского языка под свободной лицензией. Предлагается проект интеграции двух электронных тезаурусов русского языка. Специфика конкретных ресурсов и особенности русского языка определяют оригинальность и научную новизну методов, используемых для объединения. Результатом проекта будет полноценный русскоязычный тезаурус, интегрирующий данные RussNet (40 тыс. слов и словосочетаний, 30 тыс. синсетов, 45 тыс. семантических связей) и YARN (120 тыс. словарных единиц, 46 тыс. синсетов, 30 тыс. иерархических отношений) с дополненными и отредактированными данными. Важным аспектом проекта является сочетание подходов на основе краудсорсинга и работы экспертов.

Материалы конференций