УЛУЧШЕНИЕ КАЧЕСТВА РАСПОЗНАВАНИЯ В СЕТЯХ ГЛУБОКОГО ОБУЧЕНИЯ С ПОМОЩЬЮ МЕТОДА ИМИТАЦИИ ОТЖИГА
Аннотация:
Предметом исследования в работе стали методы глубокого обучения, в которых происходит автоматическое построение признаковых преобразований при решении задач распознавания образов. В качестве конкретного типа сетей глубокого обучения были взяты многослойные автоэнкодеры, выполняющие нелинейное преобразование признаков, с логистической регрессией в качестве верхнего слоя, выполняющего классификацию. В целях проверки гипотезы о возможности повышения вероятности распознавания образов в сетях глубокого обучения, традиционно обучаемых послойно методом градиентного спуска, путем глобальной оптимизации параметров сети разработан и реализован оригинальный вариант метода имитации отжига применительно к настройке весов связей автоэнкодеров при дообучении слоя логистической регрессии с помощью стохастического градиентного спуска. Тестирование, проведенное на стандартной базе рукописных символов MNIST, показало уменьшение ошибок распознавания в 1,1–1,5 раза на тестовой выборке в случае модифицированного метода по сравнению с исходным методом, основанным на локальной оптимизации. Таким образом, не возникает эффект чрезмерно близкой подгонки, и подтверждается возможность улучшения качества обучения (в терминах повышения вероятности распознавания) сетей глубокого обучения с помощью методов глобальной оптимизации. Результаты работы могут быть использованы для повышения вероятности распознавания образов в областях, требующих автоматического построения нелинейных признаковых преобразований, в том числе при распознавании изображений.
Ключевые слова:
Постоянный URL
Статьи в номере
- УЧЁТ МНОГОЧАСТИЧНЫХ ВЗАИМОДЕЙСТВИЙ В МОЛЕКУЛЯРНЫХ J-АГРЕГАТАХ И НЕЛИНЕЙНЫЕ ОПТИЧЕСКИЕ ЭФФЕКТЫ В ЭТИХ СИСТЕМАХ
- ГКР СПЕКТРОСКОПИЯ МОЛЕКУЛ БАКТЕРИОРОДОПСИНА, АДСОРБИРОВАННЫХ НА СЕРЕБРЯНЫЕ НАНООСТРОВКОВЫЕ ПЛЕНКИ
- АБЛЯЦИЯ ТВЕРДОГО ТЕЛА ПОД ДЕЙСТВИЕМ СВЕРХКОРОТКИХ ЛАЗЕРНЫХ ИМПУЛЬСОВ: ИССЛЕДОВАНИЕ МЕТОДАМИ МОЛЕКУЛЯРНОЙ ДИНАМИКИ
- ФУНДАМЕНТАЛЬНАЯ МАТРИЦА ЛИНЕЙНОЙ НЕПРЕРЫВНОЙ СИСТЕМЫ В ЗАДАЧЕ ОЦЕНКИ ЕЕ ТРАНСПОРТНОГО ЗАПАЗДЫВАНИЯ
- ТЕПЛОВЫЕ И ЭЛЕКТРИЧЕСКИЕ ПОЛЯ ПРИ ИСКРОВОМ ПЛАЗМЕННОМ СПЕКАНИИ ТЕРМОЭЛЕКТРИЧЕСКИХ МАТЕРИАЛОВ
- ВЛИЯНИЕ ОДНОСТАДИЙНОЙ ОБРАБОТКИ КВАРЦЕВОЙ КЕРАМИКИ ГЕЛЕОБРАЗУЮЩИМИ ВОДНЫМИ РАСТВОРАМИ НА ПРОЧНОСТНЫЕ ХАРАКТЕРИСТИКИ
- ИССЛЕДОВАНИЕ СОРБЦИОННЫХ ХАРАКТЕРИСТИК ПОЛИМЕРНЫХ МИНЕРАЛ-НАПОЛНЕННЫХ КОМПОЗИТОВ ДЛЯ МЕДИЦИНЫ
- КИНЕТИКА КРИСТАЛЛИЗАЦИИ ПОЛИМЕРНЫХ НАНОКОМПОЗИТОВ НА ОСНОВЕ ПОЛИАМИДА 12, МОДИФИЦИРОВАННОГО НАНОЧАСТИЦАМИ Cr2O3
- НЕОРГАНИЧЕСКИЕ ЛЮМИНОФОРЫ В СТЕКЛЕ НА ОСНОВЕ СВИНЦОВО-СИЛИКАТНЫХ СТЕКОЛ
- ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ПРОГРАММНО-АППАРАТНЫХ СРЕДСТВ ВВОДА И ВЫДЕЛЕНИЯ РЕЧЕВОГО СИГНАЛА ПОЛЬЗОВАТЕЛЯ СИСТЕМ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ
- СОЗДАНИЕ СИСТЕМ ПОДДЕРЖКИ СОВМЕСТНЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ В НАУКАХ О ЗЕМЛЕ В СРЕДЕ COLLA НА ОСНОВЕ МЕТОДА КУСТА СОБЫТИЙ
- ДВУЯЗЫЧНАЯ МНОГОМОДАЛЬНАЯ СИСТЕМА ДЛЯ АУДИОВИЗУАЛЬНОГО СИНТЕЗА РЕЧИ И ЖЕСТОВОГО ЯЗЫКА ПО ТЕКСТУ
- СОВЕРШЕНСТВОВАНИЕ POLICE OFFICE MODEL ДЛЯ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ РОЕВЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМ
- ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННОЙ ТЕОРИИ ПРИ ОПТИМАЛЬНОМ ПРОЕКТИРОВАНИИ ИНТЕГРАЛЬНЫХ СХЕМ
- ОПТИМИЗАЦИЯ ИНТЕРВАЛОВ ПРОВЕРКИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ СИСТЕМ
- АЛГОРИТМ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА, ОСНОВАННЫЙ НА БАЗОВЫХ СЕМАНТИЧЕСКИХ ШАБЛОНАХ С УДАЛЕНИЕМ
- АРХИТЕКТУРА ВЕБ-ОРИЕНТИРОВАННОЙ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ТЕХНОЛОГИЧЕСКОЙ ПОДГОТОВКИ ПРОИЗВОДСТВА
- МОДЕЛИРОВАНИЕ ИМПУЛЬСНОГО ПРОБОЯ В ГЕЛИИ С ИСПОЛЬЗОВАНИЕМ АДАПТИВНЫХ МЕТОДОВ
- О ПОСТРОЕНИИ АЛГОРИТМОВ РАБОТЫ БЕСКАРДАННОГО ГИРОГОРИЗОНТКОМПАСА НА ЭЛЕКТРОСТАТИЧЕСКОМ ГИРОСКОПЕ
- МОДЕЛИРОВАНИЕ И ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ЧУВСТВИТЕЛЬНОГО ЭЛЕМЕНТА ВОЛОКОННО-ОПТИЧЕСКОГО ГИДРОФОНА
- К ВОПРОСУ ПОВЫШЕНИЯ РЕЗУЛЬТАТИВНОСТИ МАССОВОГО ОНЛАЙН-КУРСА
- ИНФОРМАЦИОННАЯ ИНФРАСТРУКТУРА ОБРАЗОВАТЕЛЬНОЙ СРЕДЫ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИИ ВИРТУАЛЬНЫХ МАШИН
- ДВУХСЛОЙНЫЕ ФАЗО-КОМПЕНСИРУЮЩИЕ ИНТЕРФЕРЕНЦИОННЫЕ СИСТЕМЫ
- ПРОТОТИП ПРОФЕССИОНАЛЬНОЙ СОЦИАЛЬНОЙ СЕТИ BARENTSNET ДЛЯ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ УПРАВЛЕНИЯ РАЗВИТИЕМ БАРЕНЦЕВА ЕВРО-АРКТИЧЕСКОГО РЕГИОНА