Классификация коротких текстов с использованием волновой модели
Аннотация:
Предмет исследования. Алгоритмы квантовых вычислений активно развиваются и применяются в области обработки естественного языка. В работе предложен новый квантово-подобный метод классификации коротких текстов. Метод. Основу метода составляет представление текста в виде ансамбля элементарных частиц. В качестве критерия классификации выбрано значение амплитуды вероятности обнаружения данного ансамбля в выбранных точках векторного пространства, описываемого при помощи дистрибутивно-семантической модели языка. Предложен один из возможных способов интерпретации параметров волновой функции описания поведения элементарной частицы, а также алгоритм расчета амплитуды вероятности с учетом этих параметров. Основные результаты. Выполнена экспериментальная проверка описанного метода с применением классификации интернет-сообществ по тематикам. Для расчетов использованы наименования и сведения разделов «информация» по 100 группам социальной сети «ВКонтакте» по пяти различным темам. Предложенная модель показала достаточно высокую точность классификации, которая составила 91 % в целом на наборе данных и от 75 % до 95 % в пределах отдельных классов. Практическая значимость. Представленная модель может быть использована для классификации отзывов пользователей о товарах, услугах и событиях, а также при определении некоторых свойств психологических портретов пользователей интернет-сообществ.
Ключевые слова:
Постоянный URL
Статьи в номере
- Исследование влияния ограничений динамического диапазона волоконно-оптической буксируемой сейсмической косы на качество регистрируемых сейсмограмм
- Управление многоканальными линейными объектами с гарантией нахождения регулируемых переменных в заданных множествах
- Эллипсоидные оценки траекторной чувствительности многомерных процессов на основе обобщенной проблемы сингулярных чисел
- Нелинейные реологические модели и их применение для описания механического поведения высокоориентированных полимерных материалов
- Исследование эффективности шумоподавления при кодировании речевого сигнала без потерь
- Облегченный подход к обнаружению вредоносных доменов с использованием машинного обучения
- Имитационная модель облачных вычислений со спорадическим механизмом управления параллельным решением задач
- Методы выделения локальных признаков лица на изображении при аутентификации человека по термограмме
- Алгоритм энергоэффективного взаимодействия узлов беспроводной сенсорной сети
- Вспомогательный генератор сигнала произвольной формы для волоконно-оптического гироскопа
- Создание корпуса иракского арабского диалекта в Твиттере для анализа настроений
- Новая структура маршрутизации для предотвращения черных дыр в беспроводных датчиках с использованием гибридной сверточной сети
- Современные вариации криптосистем Мак-Элиса и Нидеррайтера
- Облегченный механизм аутентификации на основе ECC и токенов для WSN-IoT
- Модель акустического тракта раздельно-совмещенного оптико-акустического преобразователя
- Исследование уровня принимаемого сигнала фемтосоты с круглой и прямоугольной микрополосковой антенной для частоты 2,55 ГГц
- Взаимная биометрическая аутентификация для защищенного доступа к данным в облачной среде
- IRDFPR-CMDNN: энергоэффективный и надежный протокол маршрутизации для улучшенной передачи данных в MANET
- Исследование влияния параметров электромагнитно-акустического преобразователя на точность измерения толщины изделий
- Обнаружение поломки винта квадрокоптера методами машинного обучения
- Моделирование пропускной способности подвижных систем радиосвязи с применением методов пространственного кодирования сигнала
- Система визуального отображения изменения физиологического состояния пациентов с хроническим нарушением сознания
- Метод детектирования пространственного положения рук по данным глубинных камер для малопроизводительных вычислительных устройств