ПРЕДСКАЗАНИЕ УСЛОВИЙ РЕАКЦИЙ С ПОМОЩЬЮ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ
Аннотация:
Предмет исследования. Исследован метод предсказания различных свойств химических реакций: тип реакции, подходящие группы растворителей, катализаторов для проведения реакции. В качестве представления реакций рассчитаны разницы молекулярных отпечатков пальцев между продуктами и реагентами с использованием химической библиотеки RdKit. Молекулярные отпечатки пальцев широко используются для предсказания различных свойств молекул. Знание условий проведения реакции необходимо для успешного планирования ретросинтеза. Методы хемоинформатики могут эффективно находить взаимосвязь между реагентами реакции и необходимыми условиями для проведения реакции. При этом уменьшаются затраты времени и ресурсов на определение набора необходимых условий для проведения реакции. Прогноз групп растворителей может значительно улучшить качество моделей и применимость подходов. Метод. В качестве моделей машинного обучения применены LightGBM и нейронная сеть с механизмом выбора признаков Deep Feature Selection. Результаты оценивались с помощью метрики F1. Для обучения и оценки моделей данные были разбиты на химически непохожие части. Для перебора параметров использовалась байесовская оптимизация. Основные результаты. Выполнены эксперименты по предсказанию типа реакции, катализаторов и групп растворителей для проведения реакции. Полученные результаты показали, что на основе разницы молекулярных отпечатков между реагентами и продуктами модели машинного обучения можно предсказывать в среднем с мерой метрики F1: тип реакции MLP = 0,99, катализатор MLP = 0,7 и группу растворителей MLP = 0,68. Работа охватывает значительное количество катализаторов и растворителей. Практическая значимость. Автоматизированное планирование ретросинтеза является одним из актуальных направлений исследований. В ходе планирования составляется последовательность необходимых реакций. Предлагаемый метод может быть применен для выработки рекомендаций возможных группы катализаторов и растворителей и позволяет уменьшить затраты ресурсов и времени на определение необходимых условий реакции.
Ключевые слова:
Постоянный URL
Статьи в номере
- ИСПОЛЬЗОВАНИЕ НАВЕДЕННЫХ МЕХАНИЧЕСКИХ НАПРЯЖЕНИЙ ПРИ ФОРМООБРАЗОВАНИИ СФЕРИЧЕСКИХ ПОВЕРХНОСТЕЙ ПОДЛОЖЕК ИНТЕРФЕРЕНЦИОННЫХ ЗЕРКАЛ
- ИССЛЕДОВАНИЕ ИЗМЕНЕНИЯ ЧУВСТВИТЕЛЬНОСТИ НАКЛОННОЙ ВОЛОКОННОЙ БРЭГГОВСКОЙ РЕШЕТКИ ПРИ ЕЕ ХИМИЧЕСКОМ ТРАВЛЕНИИ
- ОСОБЕННОСТИ ПРИМЕНЕНИЯ ОПТИЧЕСКИХ ПОЛИМЕРОВ ПРИ ПРОЕКТИРОВАНИИ ОПТИЧЕСКИХ СИСТЕМ
- ОЦЕНКА ВЛИЯНИЯ РАСТИТЕЛЬНЫХ ЭКСТРАКТОВ НА АКТИВНОСТЬ ЗОЛОТИСТОГО СТАФИЛОКОККА МЕТОДОМ ЭЛЕКТРОХИМИЧЕСКОГО БИОТЕСТИРОВАНИЯ
- БЫСТРЫЙ АЛГОРИТМ ОЦЕНКИ ДВИЖЕНИЯ В ВИДЕОКОДЕКЕ СТАНДАРТА HEVC
- МОДИФИКАЦИЯ МЕТОДА СОВМЕСТНОЙ КЛАСТЕРИЗАЦИИ В ГРАФОВОМ И КОРРЕЛЯЦИОННОМ ПРОСТРАНСТВАХ
- ПРИМЕНЕНИЕ КОНЦЕПЦИИ ЦИФРОВЫХ ДВОЙНИКОВ НА ЭТАПАХ ЖИЗНЕННОГО ЦИКЛА ПРОИЗВОДСТВЕННЫХ СИСТЕМ
- ОПТИМИЗАЦИЯ ГИПЕРПАРАМЕТРОВ НА ОСНОВЕ ОБЪЕДИНЕНИЯ АПРИОРНЫХ И АПОСТЕРИОРНЫХ ЗНАНИЙ О ЗАДАЧЕ КЛАССИФИКАЦИИ
- ВЫВОД ГЕННЫХ РЕГУЛЯТОРНЫХ СЕТЕЙ ПО ДАННЫМ ЭКСПРЕССИИ ГЕНОВ ПРИ ПОМОЩИ БАЙЕСОВСКИХ СЕТЕЙ
- ПРИМЕНЕНИЕ ИНКРЕМЕНТАЛЬНЫХ SAT-РЕШАТЕЛЕЙ ДЛЯ РЕШЕНИЯ NP-ТРУДНЫХ ЗАДАЧ НА ПРИМЕРЕ ЗАДАЧИ СИНТЕЗА МИНИМАЛЬНЫХ БУЛЕВЫХ ФОРМУЛ
- ОЦЕНИВАНИЕ РАСПРЕДЕЛЕНИЯ ОТРАЖАТЕЛЬНЫХ ХАРАКТЕРИСТИК ПРИ КВАЗИНЕПРЕРЫВНОМ СВЕРХШИРОКОПОЛОСНОМ ЗОНДИРУЮЩЕМ СИГНАЛЕ
- АДАПТИВНАЯ ЗАДАЧА О РАСШИРЕННОМ ВОСПРОИЗВОДСТВЕ ПРИ МИНИМИЗАЦИИ ОБОБЩЕННЫХ ЗАТРАТ
- МОДЕЛИРОВАНИЕ ВЕРТИКАЛЬНЫХ СВЕТИЛЬНИКОВ ДЛЯ ДНЕВНОГО ОСВЕЩЕНИЯ ВНУТРЕННИХ ПОМЕЩЕНИЙ ПРОМЫШЛЕННЫХ ЗДАНИЙ(на англ. яз.)
- УРАВНЕНИЕ СОСТОЯНИЯ ПОЛИМЕРНЫХ НИТЕЙ
- ПРОГНОЗИРОВАНИЕ МЕХАНИЧЕСКИХ СВОЙСТВ ОДНОМЕРНЫХ ПОЛИМЕРНЫХ СТРУКТУР
- ПРИМЕНЕНИЕ МЕТОДА НЕЗАВИСИМЫХ КОМПОНЕНТ ДЛЯ ОПРЕДЕЛЕНИЯ НАЧАЛЬНОГО ПРИБЛИЖЕНИЯ ПРИ ПОИСКЕ АКТИВНЫХ МОДУЛЕЙ В БИОЛОГИЧЕСКИХ ГРАФАХ
- СИСТЕМА ПОДДЕРЖКИ КЛИНИЧЕСКИХ РЕШЕНИЙ С ОБРАБОТКОЙ МУЛЬТИМОДАЛЬНЫХ МЕДИЦИНСКИХ ДАННЫХ КАК СРЕДСТВО ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ РАБОТЫ ВРАЧА-РАДИОЛОГА