Анализ возможности применения различных лингвистических характеристик для идентификации автора анонимных коротких сообщений в глобальной сети Интернет
Аннотация:
Большинство исследований по идентификации автора сосредоточены на текстах больших объемов. В Интернете, в основном, используются достаточно короткие сообщения. Для проведения данного исследования использовались реальные записи блогов нескольких известных авторов, средняя длина текста которых составляет около 2700 символов. В работе производится анализ возможности применения различных характеристик текста и методов классификации для идентификации авторов коротких сообщений в Интернете. Анализируется точность идентификации при использовании различных видов лингвистических характеристик: лексические, синтаксические и структурные. Производится анализ возможности применения различных методов классификации для автоматизации процесса идентификации автора сообщения.
Ключевые слова:
Постоянный URL
Статьи в номере
- Определение потребности в модернизации средств технического обеспечения распределенной системы сбора и обработки информации
- Бионический метод построения бортовой аппаратуры анализа оптоэлектронных или радиолокационных изображений
- Оценка размеров зоны обслуживания и нижней границы пропускной способности узла радиодоступа диапазона ДКМВ
- Суточное изменение рабочих частот в зоне обслуживания узла односкачкового радиодоступа диапазона ДКМВ
- Инструмент обработки статистических данных с минимизацией времени исполнения и энергозатрат
- Математическая модель радиосигнала передатчика, учитывающая индивидуальные частотно-временные параметры формирующего тракта на основе свойств функции неопределенности радиосигнала
- Математическая модель данных при декомпрессии поврежденных архивов
- Применение инфокоммуникационных технологий в системах удаленного ухода за больными с умственными ограничениями
- Мониторинг физиологического состояния водителей
- Механизмы защиты информации и сетях DSRC
- Мониторинг безопасности информации в приложении к задачам управления качеством инфотелекоммуникационных сетей
- Стратегии обеспечения безопасности облачных вычислений
- Геоинформационная энергонезависимая система мониторинга пожарной обстановки на удаленных объектах
- Моделирование атмосферных явлений
- Исследование точности линейного решения задачи определения пространственных координат наземных объектов
- Концептуальная модель ГИС «Безопасный город». Часть 2. Заключительная
- Применение методов фрактального анализа и геоинформационных технологий для анализа дорожной сети урбанизированных территорий
- Взаимный маневр космических аппаратов при использовании непрерывных управляющих функций постоянной величины в орбитальной относительной системе координат
- Морфологический анализ проблематики математического моделирования процессов информационного взаимодействия космического аппарата с окружающей физической средой
- Эстетическое как энергийное. Проблема выразительности в философии Лосева