Например, Бобцов

Алгоритм генерации шаблонов извлечения простых сущностей на базе Sequential Pattern Mining методов

Сборник тезисов
Конференция:V Всероссийский конгресс молодых ученых
Раздел:Информационные и интеллектуальные системы и технологии
Рубрика:Технологии программирования, искусственный интеллект, биоинформатика
Год:2016

Алгоритм генерации шаблонов извлечения простых сущностей на базе Sequential Pattern Mining методов

УДК:004.89

Аннотация

В работе рассмотрен первый этап процесса генерации онтологии, а именно, процесс извлечения объектов предметной области – базовых терминов, на основе которых строится онтология. Также дан обзор существующих решений и предложен разработанный алгоритм генерации так называемых "оберток" – экстракторов, позволяющих извлекать однотипные сущности, которые строятся на основе размеченной обучающей выборки. Предлагаемый алгоритм генерации "оберток" использует регулярные выражения расширенные морфологическими шаблонами для собственно извлечения подстрок, соответствующих сущностям в тексте и алгоритм PrefixSpan для генерации шаблонов-кандидатов.

Материалы конференций