НЕЛОКАЛЬНЫЕ СЕМАНТИЧЕСКИЕ СВЯЗИ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ
Аннотация:
Предмет исследования. Одним из способов автоматического анализа текстов является построение деревьев подчинения, в которых слова предложения связываются друг с другом семантико-синтаксическими связями. В работе выполнено исследование русскоязычных текстов, имеющих общеполитический, художественный и узкоспециальный характер. Особое внимание уделено случаям, когда связываются слова, удаленные друг от друга на значительное расстояние. Метод. С помощью семантико-синтаксического парсера строятся деревья подчинения, после чего производится подсчет распределения связей разных типов по длинам. Исследованы частоты появления нелокальных связей. Основные результаты. Показано, что доля нелокальных связей в зависимости от типа может доходить до десятков процентов. Особенно это существенно для связей, исходящих из предикатных вершин (субъектные, обстоятельственные и т.д.), а также для анафорических. Отмечено, что общедоступные семантические классификаторы и тезаурусы имеют ограниченную применимость для решения задачи правильного связывания удаленных слов в предложении. Практическая значимость. Показано, что при извлечении из текстов информации, носящей онтологический или сценарный характер, а также при решении задач кореференции нельзя пренебрегать длинными синтаксическими связями, образующими в результате нелокальный семантический контекст. Сделан вывод, что анализ только n-грамм недостаточен для адекватного выделения из текста информации, носящей онтологический или сценарный характер.В связи с этим возникает необходимость составления микрословарей, ориентированных на определенные синтаксические конструкции.
Ключевые слова:
Постоянный URL
Статьи в номере
- АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ОБЪЕКТОВ ПО ДАННЫМ3D-ЛИДАРА НА БАЗЕ ТЕХНОЛОГИИ СЧЕТА ЕДИНИЧНЫХ ФОТОНОВ
- ИССЛЕДОВАНИЕ РЕГЕНЕРАЦИИ СЛИЗИСТОЙ ОБОЛОЧКИ ПОЛОСТИ РТА ПОСЛЕ ФРАКЦИОННОГО ДИОДНОГО ЛАЗЕРНОГО ВОЗДЕЙСТВИЯ С ДЛИНОЙ ВОЛНЫ 980 нм
- ИССЛЕДОВАНИЕ ОПТИЧЕСКИХ СВОЙСТВ КРОВИ ЧЕЛОВЕКА ПРИ ИЗМЕНЕНИИ КОНЦЕНТРАЦИИ ЕЕ КОМПОНЕНТОВ В ТЕРАГЕРЦОВОМ ДИАПАЗОНЕ ЧАСТОТ
- ИЗУЧЕНИЕ ОПТИЧЕСКИХ СВОЙСТВ И СПЕКТРАЛЬНЫХ ХАРАКТЕРИСТИК ГЛИОБЛАСТОМЫ МОЗГА И АДЕНОКАРЦИНОМЫ ЛЕГКОГО ЧЕЛОВЕКА
- ФОРМИРОВАНИЕ ИЗОЛИРУЮЩИХ БАРЬЕРОВ В СИЛИКАТНЫХ ПОРИСТЫХ ПЛЕНКАХ ПРИ СО2 ЛАЗЕРНОЙ ОБРАБОТКЕ
ИССЛЕДОВАНИЕ СПЕКТРАЛЬНЫХ ХАРАКТЕРИСТИК ВОЛОКОННЫХ БРЭГГОВСКИХ РЕШЕТОК С ФАЗОВЫМ СДВИГОМ ПРИ ВОЗДЕЙСТВИИ ДАВЛЕНИЯ, НАПРАВЛЕННОГО ПЕРПЕНДИКУЛЯРНО ОСИ ОПТИЧЕСКОГО ВОЛОКНА
- ВОЗМОЖНОСТЬ ИЗМЕРЕНИЯ МАЛЫХ ВЫСОТ НАД МОРСКОЙ ПОВЕРХНОСТЬЮ В УСЛОВИЯХ ДЫМКИ И ТУМАНА
- МЕТОД ГАЗОРАЗРЯДНОЙ ВИЗУАЛИЗАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ПАТОЛОГИЙ БИОЛОГИЧЕСКИХ ТКАНЕЙ
- АЛГОРИТМ АДАПТИВНОГО УПРАВЛЕНИЯ ПО ВЫХОДУ ЛИНЕЙНОЙ СИСТЕМОЙ С УЛУЧШЕННОЙ ПАРАМЕТРИЧЕСКОЙ СХОДИМОСТЬЮ
- УПРАВЛЕНИЕ ДВИЖЕНИЕМ МЕХАТРОННОЙ СИСТЕМЫ С ГИБКИМ ВРАЩАТЕЛЬНЫМ ЗВЕНОМ: ТЕОРИЯ И ЭКСПЕРИМЕНТ
- ИССЛЕДОВАНИЕ СТРУКТУРЫ ПЛЕНОЧНЫХ КОМПОЗИЦИЙ НА ОСНОВЕ СМЕСИ ХИТОЗАН/ПОЛИГИДРОКСИБУТИРАТ МЕТОДАМИ ИНФРАКРАСНОЙ И РЕНТГЕНОФЛУОРЕСЦЕНТНОЙ СПЕКТРОСКОПИИ
- МОДЕЛИРОВАНИЕ И АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРОЦЕССА ДИНАМИЧЕСКОГО ИНДЕНТИРОВАНИЯ
- ТЕСТИРОВАНИЕ И ОТЛАДКА ВСТРАИВАЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ НА ОСНОВЕ УРОВНЕВЫХ МОДЕЛЕЙ
- МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ ПРИ НАРУШЕНИЯХ СЕМАНТИЧЕСКОЙ ЦЕЛОСТНОСТИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
- АНАЛИЗ ЗАЩИЩЕННОСТИ ИНФОРМАЦИОННОГО ВЗАИМОДЕЙСТВИЯ ГРУППЫ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ
- ВЫЧИСЛИТЕЛЬНО-ЭФФЕКТИВНЫЙ МЕТОД ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ ДИФРАКЦИОННО-РАЗМЫТЫХ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ С КУСОЧНО-ЛИНЕЙНЫМ КОНТУРОМ ГРАНИЦЫ
- МЕТОД ОРГАНИЗАЦИИ СКРЫТОГО КАНАЛА ПЕРЕДАЧИ ИНФОРМАЦИИ НА ОСНОВЕ ПРОТОКОЛА ПОТОКОВОЙ ПЕРЕДАЧИ ДАННЫХ
- МЕТОДЫ УВЕЛИЧЕНИЯ ЖИЗНЕННОГО ЦИКЛА СЕТИ ИНТЕРНЕТА ВЕЩЕЙ
- ПРИЕМ РЕЧЕВЫХ СИГНАЛОВ В ШУМОВОЙ ОБСТАНОВКЕ С ИСПОЛЬЗОВАНИЕМ ДВУХЭЛЕМЕНТНЫХ МИКРОФОННЫХ РЕШЕТОК
- ИНФОРМАЦИЯ ПО УТИЛИЗАЦИИ РЕСУРСОВ ЦЕНТРА ОБРАБОТКИ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ СИСТЕМЫ ОЧЕРЕДЕЙ
- ОПРЕДЕЛЕНИЕ ОБЛАСТИ ПЕРЕКРЫТИЯ ИЗОБРАЖЕНИЙ ЭЛЕКТРОННЫХ МОДУЛЕЙ
- ИССЛЕДОВАНИЕ РОЛИ ЭМОДЖИ В ОНЛАЙН-СООБЩЕСТВЕ
- СРАВНЕНИЕ ПОДХОДОВ К ИДЕНТИФИКАЦИИ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ МОДЕЛИ УХОДА ГИРОСКОПА
- ГЕНЕРАТОР ПСЕВДОСЛУЧАЙНЫХ ЧИСЕЛ НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ
- РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ И МОДЕЛИРОВАНИЯ МНОГОСЕРДЦЕВИННОГО ВОЛОКОННОГО СВЕТОВОДА С МАССИВОМ ВОЛОКОННЫХ БРЭГГОВСКИХ РЕШЕТОК
ОПРЕДЕЛЕНИЕ ЧАСТОТЫ ИМПУЛЬСНОГО СИГНАЛА С ПОСТОЯННЫМ ТАКТОМ ПОСРЕДСТВОМ РЕКУРРЕНТНОГО ПРИМЕНЕНИЯ ПРЕОБРАЗОВАНИЯ ФУРЬЕ