Например, Бобцов

Использование машинного обучения в инвестиционной деятельности

Аннотация:

Этап развития современного общества можно охарактеризовать, как наиболее значимый и определяющий период для информационных технологий. Период, когда вычисления перешли от крупных электронных вычислительных машин к машинам и роботам с автоматическим управлением, с возможностью хранить данные в облаке. Но что делает этот период по-настоящему захватывающим, так это демократизация различных инструментов и методов, которые развивались одновременно с развитием вычислительной техники. Обработка данных, которая когда-то занимала несколько дней, сегодня занимает всего несколько минут, и все это благодаря развитию машинного обучения. Это причина, по которой Data Science получает колоссальные инвестиции каждый год, что увеличивает спрос на сертификаты в данной области. Российская венчурная компания и партнёр инвестиционной компании iTech Capital Алексей Соловьев представили исследование «Венчурный барометр» о российском венчурном рынке. К участию данного исследования было приглашено 312 представителей венчурного рынка, из которых 83 ответили на вопросы анкеты. Барометр ежегодно задает инвесторам вопрос о наиболее привлекательных сегментах рынка, и, в 2019 году, как и в прошлые 2 года, рейтинг возглавляет искусственный интеллект и машинное обучение. За данную нишу проголосовали 82% инвесторов, как за наиболее перспективную [15]. Данные и методы: Задачей данного исследования является построение оптимального алгоритма, прогнозирующего значение рейтинга инвестиционного проекта при заданном наборе данных. Рассмотрены подробно наиболее популярные алгоритмы машинного обучения, выполнен подробный анализ имеющихся данных, построена модель на основе алгоритма случайного леса по набору тренировочного набора данных, а также проведено тестирование на основе тестовых данных. Данная исследовательская работа выполнена на языке программирования R, с помощью которого осуществлен анализ данных, построение различных таблиц и графиков, а также построена модель и проведена оценка результатов, на основе сравнения с ранее построенными алгоритмами: линейная регрессия, логистическая регрессия. Анализ результатов: В ходе исследования было выявлено, что наиболее оптимальным алгоритмом для прогнозирования рейтинга инвестиционного проекта на основе имеющихся данных является алгоритм случайного леса, точность данного алгоритма на 3.7% выше точности алгоритма линейной регрессии на основе наиболее значимого набора показателей проекта.

Ключевые слова:

Статьи в номере