АЛГОРИТМ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА, ОСНОВАННЫЙ НА БАЗОВЫХ СЕМАНТИЧЕСКИХ ШАБЛОНАХ С УДАЛЕНИЕМ
Аннотация:
В связи с ростом объема текстовой информации все более актуальными становятся системы автоматической обработки текста. Одной из основных задач таких систем является задача семантического анализа. В работе предлагается алгоритм поиска семантических зависимостей между частями предложений анализируемого текста, основанный на сопоставлении текста с базовыми семантическими шаблонами. Каждое предложение, поступающее на вход программы, постепенно сокращается: некоторые части предложения в соответствии с правилами, описанными в семантических шаблонах, добавляются в очередь с приоритетом, после чего на каждой итерации алгоритма из анализируемого предложения изымается та его часть, которая имеет в очереди наибольший приоритет. Для определения приоритета в такой очереди используются два значения: значение приоритета группы, к которой принадлежит семантическая зависимость, описанная в шаблоне, и позиция слова (или последнего слова из набора, если элемент, хранимый в очереди, состоит из нескольких слов) в анализируемом предложении. В ходе работы составлено 2160 базовых семантических шаблонов, а также на языке программирования Java реализован предлагаемый в статье алгоритм. Применение в процессе реализации алгоритма экспертной системы Drools, использующей алгоритм быстрого сопоставления с шаблонами PHREAK, обеспечило высокую скорость работы семантического анализатора. По результатам тестирования сделан вывод, что предложенный алгоритм семантического анализа без использования экспертной системы Drools работает медленнее в среднем в 6–8 раз. Программная реализация алгоритма показала, что результаты работы программы быть использованы в системах автоматической обработки текстов. Разработанный семантический анализатор используется в качестве составного модуля интеллектуальной вопросно-ответной системы.
Ключевые слова:
Постоянный URL
Статьи в номере
- УЧЁТ МНОГОЧАСТИЧНЫХ ВЗАИМОДЕЙСТВИЙ В МОЛЕКУЛЯРНЫХ J-АГРЕГАТАХ И НЕЛИНЕЙНЫЕ ОПТИЧЕСКИЕ ЭФФЕКТЫ В ЭТИХ СИСТЕМАХ
- ГКР СПЕКТРОСКОПИЯ МОЛЕКУЛ БАКТЕРИОРОДОПСИНА, АДСОРБИРОВАННЫХ НА СЕРЕБРЯНЫЕ НАНООСТРОВКОВЫЕ ПЛЕНКИ
- АБЛЯЦИЯ ТВЕРДОГО ТЕЛА ПОД ДЕЙСТВИЕМ СВЕРХКОРОТКИХ ЛАЗЕРНЫХ ИМПУЛЬСОВ: ИССЛЕДОВАНИЕ МЕТОДАМИ МОЛЕКУЛЯРНОЙ ДИНАМИКИ
- ФУНДАМЕНТАЛЬНАЯ МАТРИЦА ЛИНЕЙНОЙ НЕПРЕРЫВНОЙ СИСТЕМЫ В ЗАДАЧЕ ОЦЕНКИ ЕЕ ТРАНСПОРТНОГО ЗАПАЗДЫВАНИЯ
- ТЕПЛОВЫЕ И ЭЛЕКТРИЧЕСКИЕ ПОЛЯ ПРИ ИСКРОВОМ ПЛАЗМЕННОМ СПЕКАНИИ ТЕРМОЭЛЕКТРИЧЕСКИХ МАТЕРИАЛОВ
- ВЛИЯНИЕ ОДНОСТАДИЙНОЙ ОБРАБОТКИ КВАРЦЕВОЙ КЕРАМИКИ ГЕЛЕОБРАЗУЮЩИМИ ВОДНЫМИ РАСТВОРАМИ НА ПРОЧНОСТНЫЕ ХАРАКТЕРИСТИКИ
- ИССЛЕДОВАНИЕ СОРБЦИОННЫХ ХАРАКТЕРИСТИК ПОЛИМЕРНЫХ МИНЕРАЛ-НАПОЛНЕННЫХ КОМПОЗИТОВ ДЛЯ МЕДИЦИНЫ
- КИНЕТИКА КРИСТАЛЛИЗАЦИИ ПОЛИМЕРНЫХ НАНОКОМПОЗИТОВ НА ОСНОВЕ ПОЛИАМИДА 12, МОДИФИЦИРОВАННОГО НАНОЧАСТИЦАМИ Cr2O3
- НЕОРГАНИЧЕСКИЕ ЛЮМИНОФОРЫ В СТЕКЛЕ НА ОСНОВЕ СВИНЦОВО-СИЛИКАТНЫХ СТЕКОЛ
- УЛУЧШЕНИЕ КАЧЕСТВА РАСПОЗНАВАНИЯ В СЕТЯХ ГЛУБОКОГО ОБУЧЕНИЯ С ПОМОЩЬЮ МЕТОДА ИМИТАЦИИ ОТЖИГА
- ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ПРОГРАММНО-АППАРАТНЫХ СРЕДСТВ ВВОДА И ВЫДЕЛЕНИЯ РЕЧЕВОГО СИГНАЛА ПОЛЬЗОВАТЕЛЯ СИСТЕМ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ
- СОЗДАНИЕ СИСТЕМ ПОДДЕРЖКИ СОВМЕСТНЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ В НАУКАХ О ЗЕМЛЕ В СРЕДЕ COLLA НА ОСНОВЕ МЕТОДА КУСТА СОБЫТИЙ
- ДВУЯЗЫЧНАЯ МНОГОМОДАЛЬНАЯ СИСТЕМА ДЛЯ АУДИОВИЗУАЛЬНОГО СИНТЕЗА РЕЧИ И ЖЕСТОВОГО ЯЗЫКА ПО ТЕКСТУ
- СОВЕРШЕНСТВОВАНИЕ POLICE OFFICE MODEL ДЛЯ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ РОЕВЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМ
- ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННОЙ ТЕОРИИ ПРИ ОПТИМАЛЬНОМ ПРОЕКТИРОВАНИИ ИНТЕГРАЛЬНЫХ СХЕМ
- ОПТИМИЗАЦИЯ ИНТЕРВАЛОВ ПРОВЕРКИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ СИСТЕМ
- АРХИТЕКТУРА ВЕБ-ОРИЕНТИРОВАННОЙ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ТЕХНОЛОГИЧЕСКОЙ ПОДГОТОВКИ ПРОИЗВОДСТВА
- МОДЕЛИРОВАНИЕ ИМПУЛЬСНОГО ПРОБОЯ В ГЕЛИИ С ИСПОЛЬЗОВАНИЕМ АДАПТИВНЫХ МЕТОДОВ
- О ПОСТРОЕНИИ АЛГОРИТМОВ РАБОТЫ БЕСКАРДАННОГО ГИРОГОРИЗОНТКОМПАСА НА ЭЛЕКТРОСТАТИЧЕСКОМ ГИРОСКОПЕ
- МОДЕЛИРОВАНИЕ И ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ЧУВСТВИТЕЛЬНОГО ЭЛЕМЕНТА ВОЛОКОННО-ОПТИЧЕСКОГО ГИДРОФОНА
- К ВОПРОСУ ПОВЫШЕНИЯ РЕЗУЛЬТАТИВНОСТИ МАССОВОГО ОНЛАЙН-КУРСА
- ИНФОРМАЦИОННАЯ ИНФРАСТРУКТУРА ОБРАЗОВАТЕЛЬНОЙ СРЕДЫ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИИ ВИРТУАЛЬНЫХ МАШИН
- ДВУХСЛОЙНЫЕ ФАЗО-КОМПЕНСИРУЮЩИЕ ИНТЕРФЕРЕНЦИОННЫЕ СИСТЕМЫ
- ПРОТОТИП ПРОФЕССИОНАЛЬНОЙ СОЦИАЛЬНОЙ СЕТИ BARENTSNET ДЛЯ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ УПРАВЛЕНИЯ РАЗВИТИЕМ БАРЕНЦЕВА ЕВРО-АРКТИЧЕСКОГО РЕГИОНА