Автоматизированное извлечение семантических связей с помощью анализа структуры текстовой информации
Аннотация
Одним из ключевых элементов систем автоматической обработки текста являются онтологии или тезаурусы. Для построения современных онтологий всегда актуальным является извлечение семантически связанных слов из текста на естественном языке. Однако общим недостатком таких онтологий является отсутствие специализированных терминов, специфичных для данной предметной области. Поэтому возникает проблема дополнения существующей онтологии узлами и связями из внешних источников. В работе разработано программное обеспечение, с помощью которого была расширена имеющаяся исходная онтология, а также были восстановлены отсутствующие в ней связи. Изучение форматирования текстовой информации для получения семантических отношений практически не рассматривается в литературе, поэтому подобные алгоритмы относятся к слабо изученной области. Полученные результаты показывают необходимость продолжать исследования. В дальнейшем планируется поиск путей повышения точности использованного алгоритма, а также нахождения новых способов дополнения онтологий специализированными данными.