МЕЖСАЙТОВАЯ ЛИНГВИСТИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙ
Аннотация:
Исследованы вопросымежсайтовой лингвистической идентификации пользователей интернет-ресурсов по коротким электронным сообщениям, полученным из нескольких источников (сайтов, средств онлайн-коммуникации). Рассмотрена возможность идентификации пользователя одного интернет-ресурса по его сообщениям на другом интернет-ресурсе. Определена возможность формирования единого признакового пространства для сообщений, полученных из различных источников, обеспечивающая достаточную точность лингвистической идентификации. Показано, что существует стилистическая разница между текстами сообщений, созданными одним пользователем, но с использованием различных средств коммуникации.Рассмотрены две задачи межсайтовой идентификации: 1) идентификация по смешанным данным – обучающая и тестовая выборки сформированы из сообщений, полученных из нескольких источников (сайтов); 2) разделенные источники – обучающая выборка сформирована из сообщений одного источника, тестовая из сообщений другого источника.Результаты экспериментов показали, что при обучении на смешанных данных достоверность идентификации составляет 0,82, при обучении на данных различных источников достоверность идентификации – 0,74. Сделаны выводы, что существует стилистическая разница между текстами сообщений, созданными одним пользователем, но с использованием различных средств коммуникации.Но в то же времясуществует возможность сформировать единое признаковое пространство для сообщений, полученных из различных источников, обеспечивающее достаточную точность лингвистической идентификации
Ключевые слова:
Постоянный URL
Статьи в номере
- К ЮБИЛЕЮ АЛЕКСАНДРА ЛЬВОВИЧА ФРАДКОВА
- ЗАВИСИМОСТЬ СПЕКТРАЛЬНЫХ ХАРАКТЕРИСТИК ПОЛУПРОВОДНИКОВЫХ И ТВЕРДОТЕЛЬНЫХ ЛАЗЕРОВ ВИДИМОГО ДИАПАЗОНА ОТ ТЕМПЕРАТУРЫ АКТИВНОЙ СРЕДЫ
- ОЦЕНКА СТАБИЛЬНОСТИ СПЕКТРАЛЬНОЙ ЧУВСТВИТЕЛЬНОСТИ ЦИФРОВЫХ ЦВЕТНЫХ ФОТОАППАРАТОВ
- ОЦЕНКА ЭНЕРГЕТИЧЕСКОЙ ЭФФЕКТИВНОСТИ ОПТИКО-ЭЛЕКТРОННОЙ СИСТЕМЫ СПЕКТРАЛЬНОГО ОПТИЧЕСКОГО КОГЕРЕНТНОГО ТОМОГРАФА
- БИОСЕНСОР НА ОСНОВЕ МЕТАПЛЕНКИ ДЛЯ ОПРЕДЕЛЕНИЯ КОНЦЕНТРАЦИИ ГЛЮКОЗЫ В КРОВИ ЧЕЛОВЕКА
- АДАПТИВНАЯ РОБАСТНАЯ КОМПЕНСАЦИЯ ВОЗМУЩЕНИЙ В ЛИНЕЙНЫХ СИСТЕМАХ С ЗАПАЗДЫВАНИЕМ
- РОБАСТНАЯ СТАБИЛИЗАЦИЯ ДВУХРОТОРНОГО МНОГОКАНАЛЬНОГО ОБЪЕКТА
- ПОРИСТАЯ СТРУКТУРА И ФУНКЦИОНАЛЬНЫЕ СВОЙСТВА ВЫСОКОПРОНИЦАЕМЫХ ПЛЕНОК ПОЛИПРОПИЛЕНА
- СОЗДАНИЕ АКТИВНОЙ ДОБАВКИ К ШАМПУНЯМ НА ОСНОВЕ НАНОЧАСТИЦ РАЗЛИЧНОЙ ПРИРОДЫ
- ЛАЗЕРНЫЙ СИНТЕЗ НАНОЧАСТИЦ СЕЛЕНА В ЖИДКИХ МОНОМЕРАХ
- ПРИНЦИПЫ ОРГАНИЗАЦИИ ЦИФРОВЫХ ПРОЕКТНЫХ И ПРОИЗВОДСТВЕННЫХ ПРЕДПРИЯТИЙ ИНДУСТРИИ 4.0
- МЕТОДЫ ДЕТЕКТИРОВАНИЯ СПУФИНГ-АТАК ПОВТОРНОГО ВОСПРОИЗВЕДЕНИЯ НА ГОЛОСОВЫЕ БИОМЕТРИЧЕСКИЕ СИСТЕМЫ
- МАТРИЧНО-ИТЕРАЦИОННЫЙ МЕТОД РЕШЕНИЯ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ И ЕГО ПРИМЕНЕНИЕ В ТОМОГРАФИЧЕСКОМ СКАНИРОВАНИИ ПРОСТРАНСТВА С ИСПОЛЬЗОВАНИЕМ РАДИОЛОКАЦИОННОЙ СТАНЦИИ
- ИСПОЛЬЗОВАНИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ЛИЦ ДЛЯ ОСУЩЕСТВЛЕНИЯ ПОКУПОК В МОБИЛЬНЫХ УСТРОЙСТВАХ И ВЕБ-ПРИЛОЖЕНИЯХ
- МОДЕЛИРОВАНИЕ ETHERNET СЕТЕЙ В СРЕДЕ OMNET++ INET FRAMEWORK
- СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ С ПОЛИМОДАЛЬНЫМИ ПОТОКАМИ
- ВЕРИФИКАЦИЯ ПОВЕДЕНЧЕСКИХ МОДЕЛЕЙ БЛОКОВ ИНТЕГРАЛЬНЫХ СХЕМ С ПОМОЩЬЮ СРЕДСТВ ПРОГРАММИРУЕМОЙ ЛОГИКИ
- ИССЛЕДОВАНИЕ АЛГОРИТМОВ ТЕХНИЧЕСКОГО ЗРЕНИЯ ДЛЯ СИСТЕМ ПРОСТРАНСТВЕННОГО СЛЕЖЕНИЯ В ТИПОВЫХ РЕЖИМАХ ИХ ФУНКЦИОНИРОВАНИЯ
- АЛГОРИТМ СИНТЕЗА КОМПАКТНЫХ ЦИФРОВЫХ РЕГУЛЯТОРОВ В АРИФМЕТИКЕ С ФИКСИРОВАННОЙ ЗАПЯТОЙ
- ИМИТАЦИОННАЯ МОДЕЛЬ МНОГОКАНАЛЬНОГО ПРИОРИТЕТНОГО ОБСЛУЖИВАНИЯ РЕЗЕРВИРОВАННОЙ СИСТЕМЫ ПЕРЕДАЧИ ДАННЫХ
- АРХИТЕКТУРА ПЛАТФОРМЫ ДЛЯ СОЗДАНИЯ МОБИЛЬНЫХ ПРИЛОЖЕНИЙ С OUTDOOR-КВЕСТАМИ
- УСКОРЕННЫЕ АНАЛИТИКО-СТАТИСТИЧЕСКИЕ МЕТОДЫ ИМИТАЦИИ ТЕХНИЧЕСКИХ СИСТЕМ С РАСПРЕДЕЛЕННОЙ СТРУКТУРОЙ
- УСТОЙЧИВОСТЬ ВЯЗКОЙ ПЛЕНКИ НА ПОВЕРХНОСТИ СЛАБО НАКЛОНЕННОГО ВРАЩАЮЩЕГОСЯ ВЕРТИКАЛЬНОГО ЦИЛИНДРА
- МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ЦЕПОЧЕК РЕЗОНАТОРОВ В ПРИСУТСТВИИ ВНЕШНЕГО МАГНИТНОГО ПОЛЯ
- ФОРМИРОВАНИЕ ИНДИВИДУАЛЬНЫХ ТРАЕКТОРИЙ ОБУЧЕНИЯ НА ОСНОВЕ АНАЛИЗА ДОСТИЖЕНИЙ И ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ОБУЧАЮЩЕГОСЯ
- РАЗРАБОТКА МОДЕЛИ ОБУЧАЮЩЕЙ ПЛАТФОРМЫ ДЛЯ ИССЛЕДОВАНИЯ ПРОЦЕССА ПРОИЗВОДСТВА В КОНЦЕПЦИИ ИНДУСТРИЯ 4.0