Например, Бобцов

Анализ возможности применения различных лингвистических характеристик для идентификации автора анонимных коротких сообщений в глобальной сети Интернет

Аннотация:

Большинство исследований по идентификации автора сосредоточены на текстах больших объемов. В Интернете, в основном, используются достаточно короткие сообщения. Для проведения данного исследования использовались реальные записи блогов нескольких известных авторов, средняя длина текста которых составляет около 2700 символов. В работе производится анализ возможности применения различных характеристик текста и методов классификации для идентификации авторов коротких сообщений в Интернете. Анализируется точность идентификации при использовании различных видов лингвистических характеристик: лексические, синтаксические и структурные. Производится анализ возможности применения различных методов классификации для автоматизации процесса идентификации автора сообщения.

Ключевые слова:

Статьи в номере