Например, Бобцов

Компьютерная криминалистика: методика и программный комплекс для идентификации субъектов информационных процессов на основании лингвистических характеристик письменной речи

Сборник тезисов
Конференция:V Всероссийский конгресс молодых ученых
Раздел:Информационные и интеллектуальные системы и технологии
Рубрика:Технология программирования и защита информации
Год:2016

Компьютерная криминалистика: методика и программный комплекс для идентификации субъектов информационных процессов на основании лингвистических характеристик письменной речи

УДК:004.89

Аннотация

В данной работе исследованы вопросы идентификации и аутентификации пользователей, отправителей электронных сообщений в Интернет. В настоящий момент существует ряд проблем, ведущих к снижению качества обеспечения безопасности информационных процессов. Злоумышленник имеет возможность получения доступа к созданию и распространению информации без предъявления идентификатора(анонимно), предъявив подложный идентификатор (получение доступа от чужого имени), а также возможность создания неограниченного числа идентификаторов для распространения информации под вымышленными именами с различными корыстными целями. Необходимой является возможность идентифицировать или аутентифицировать пользователя, определить является ли пользователь, тем за кого он себя выдает, при информационном обмене в Интернет, а также при назначении прав доступа к электронному ресурсу для пользователя, который в прошлом проявлял некоторую активность, характерную для злоумышленника. Существующие существующих методы идентификации пользователей по лингвистических характеристикам их электронных сообщений на русском языке не обладают достаточной точностью на коротких текстах. В связи с этим, возникает задача повышения точности идентификации и аутентификации пользователей. В данной работе разработан алгоритм идентификации субъектов информационных процессов, размещающих некоторые электронные текстовые сообщения в сети Интернет. Алгоритм включает следующие этапы: 1) извлечение лингвистических идентификационных признаков пользователя; 2) дискретизация непрерывных признаков; 3) отбор подмножества наиболее информативных признаков; 4) идентификация пользователя-автора сообщения. Результатом работы является список пользователей, наиболее вероятных авторов текста, что позволяет установить подлинность субъекта информационных процессов. На базе данного алгоритма был разработан специализированный программный комплекс. Результаты экспериментов показали, что точность идентификации пользователя, автора некоторого сообщения, составляет 70,5%.

Материалы конференций