Решение задачи классификации текста на основе нейронных сетей
Аннотация
Доклад посвящен решению задачи классификации текста на основе нейронных сетей. В связи со стремительным ростом объемов текстовой информации в электронном виде она является как никогда актуальной. В рамках доклада рассмотрено решение как система, осуществляющая классификацию по предъявленным входным текстовым данным, анализируются существующие подходы к проектированию ее компонентов, а именно: предобработка исходного текста, приведение к виду n-мерного вектора и преобразования над ним, непосредственно сама классифицирующая сеть и алгоритмы ее обучения. При этом акцент ставится на то, что входными данными будет являться русскоязычный текст. Различные решения сравниваются, и по ряду критериев выбирается наиболее сбалансированное и универсальное, реализация которого впоследствии экспериментально исследуется.