ПОВЫШЕНИЕ ТОЧНОСТИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ВИЗУАЛЬНОЙ РУССКОЙ РЕЧИ: ОПТИМИЗАЦИЯ ВИЗЕМНЫХ КЛАССОВ
Аннотация:
В задаче автоматического чтения речи по губам диктора ведутся поиски оптимального набора классов визем, необходимого для максимально эффективного распознавания визуальной речи. Предложен подход для выделения классов визем, позволяющий создавать набор карт соответствия фонема–визема, где каждый класс имеет различное количество визем, от 2 до 48, при неизменном количестве фонем. Виземные классы основаны на их отображении из классов фонем, которые преобразуются в виземные группы в процессе распознавания звучащей речи. Используя полученные карты соответствия, на основе базы данных аудиовизуальной русской речи HAVRUSв работе продемонстрирована зависимость точности распознавания визуальной речи от количества используемых виземных классов. Использование высокоскоростных видеоданных позволило расширить оптимальный набор виземных классов до 20, что привело к улучшению точности распознавания по сравнению с набором из 14 классов.
Ключевые слова:
Постоянный URL
Статьи в номере
- О СОВРЕМЕННОМ ПОДХОДЕ К ПРОЕКТИРОВАНИЮ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ САМОЛЕТНОГО ТИПА С КОРОТКИМ ВЗЛЕТОМ И ПОСАДКОЙ. ЧАСТЬ III. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ ВИХРЕВОЙ АЭРОДИНАМИКИ ЛЕТАТЕЛЬНОГО АППАРАТА МЕТОДОМ ДИСКРЕТНЫХ ВИХРЕЙ
- ЛОКАЛЬНОЕ ЛАЗЕРНОЕ ИСПАРЕНИЕ ПЛЕНОК СЛОЖНЫХ ТОПОЛОГИЙ ЧУВСТВИТЕЛЬНОГО ЭЛЕМЕНТА МИКРОГИРОСКОПА НА ПОВЕРХНОСТНЫХ АКУСТИЧЕСКИХ ВОЛНАХ
- РАСПРЕДЕЛЕНИЕ АМПЛИТУДЫ ОПТИЧЕСКОГО ПОЛЯ НА ТРАНСПАРАНТЕ ОПТИКО-ЭЛЕКТРОННОЙ СИСТЕМЫ ДЛЯ ИЗМЕРЕНИЯ ПАРАМЕТРОВ ВИБРОПОДСТАВКИ В ЛАЗЕРНОМ ГИРОСКОПЕ
- ВЫБОР ПАРАМЕТРОВ ОПТИКО-ЭЛЕКТРОННЫХ СИСТЕМ КОНТРОЛЯ СМЕЩЕНИЙ С АКТИВНЫМИ РЕПЕРНЫМИ МАРКАМИ
- МЕТОД КОНТРОЛЯ ДЕФОРМАЦИЙ КОМПОЗИТНЫХ КОНСТРУКЦИОННЫХ ЭЛЕМЕНТОВ С ПОМОЩЬЮ ВОЛОКОННО-ОПТИЧЕСКОГО ДАТЧИКА АКУСТИЧЕСКОЙ ЭМИССИИ
- ПОЛУПРОВОДНИКОВЫЙ СТАНДАРТ ЧАСТОТЫ НА ЛИНИИ P(16) ИЗОТОПА АЦЕТИЛЕНА СО СТАБИЛИЗАЦИЕЙ ПО ТЕМПЕРАТУРЕ ФАЗОМОДУЛЯЦИОННЫМ МЕТОДОМ
- УПРАВЛЕНИЕ ЭЛЕКТРИЧЕСКИМ ГЕНЕРАТОРОМ В УСЛОВИЯХ ВЫСОКОЧАСТОТНЫХ ПОМЕХ ИЗМЕРЕНИЯ
- ПЕРЕНОС ЗНАНИЙ В ЗАДАЧЕ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РУССКОЙ РЕЧИ В ТЕЛЕФОННЫХ ПЕРЕГОВОРАХ
- ОБРАБОТКА И АНАЛИЗ ЗВУКОВОЙ И ВИЗУАЛЬНОЙ СОСТАВЛЯЮЩИХ РЕЧИ НА ОСНОВЕ ПРОЕКЦИОННЫХ МЕТОДОВ
- ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА КОДИРОВАНИЯ ВНУТРИКАДРОВЫМ ПРЕДСКАЗАНИЕМ В СТАНДАРТЕ H.265/HEVC
- ПРИМЕНЕНИЕ СЕМАНТИЧЕСКОЙ МОДЕЛИ БАЗЫ ДАННЫХ ПРИ РЕАЛИЗАЦИИ ЕСТЕСТВЕННО-ЯЗЫКОВОГО ПОЛЬЗОВАТЕЛЬСКОГО ИНТЕРФЕЙСА
- ОРГАНИЗАЦИЯ ЦИФРОВЫХ ПРОИЗВОДСТВ ИНДУСТРИИ 4.0 НА ОСНОВЕ КИБЕРФИЗИЧЕСКИХ СИСТЕМ И ОНТОЛОГИЙ
- ПОДХОД К ВЫБОРУ ИНФОРМАТИВНОГО ПРИЗНАКА В ЗАДАЧЕ ИДЕНТИФИКАЦИИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
- МЕТОДОЛОГИЯ ПРОЕКТИРОВАНИЯ, РАЗРАБОТКИ И СОПРОВОЖДЕНИЯ ДОМЕННЫХ СЕМАНТИЧЕСКИХ ПОРТАЛОВ НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ
- ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ НАРУШЕНИЙ ЦЕЛОСТНОСТИ JPEG-ИЗОБРАЖЕНИЙ
- ОБЪЕКТНО-ПРОЦЕССНАЯ МОДЕЛЬ ДАННЫХ ДЛЯ СЕРВИС-ОРИЕНТИРОВАННОЙ АРХИТЕКТУРЫ ИНТЕГРИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
- ЗАДАЧИ АНАЛИЗА ЗАЩИЩЕННОСТИ ПОЛЬЗОВАТЕЛЕЙ ОТ СОЦИОИНЖЕНЕРНЫХ АТАК: ПОСТРОЕНИЕ СОЦИАЛЬНОГО ГРАФА ПО СВЕДЕНИЯМ ИЗ СОЦИАЛЬНЫХ СЕТЕЙ
- ОПТИМАЛЬНАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ОПИСАНИЯ ФИЗИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ
- МЕТОД СИНТЕЗА СХЕМОТЕХНИЧЕСКИХ МОДЕЛЕЙ ЦИФРО-АНАЛОГОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ ДЛЯ ИНТЕГРАЛЬНЫХ СХЕМ
- ВРЕМЕННОЙ АНАЛИЗ ИНТЕГРАЛЬНЫХ СХЕМ С УЧЕТОМ МОДЕЛЕЙ КОНТАКТНЫХ ПЛОЩАДОК И ПРОВОДНИКОВ РАЗВАРКИ
- ОБЪЕДИНЕНИЕ ПРИЗНАКОВ В ЗАДАЧЕ ОБУЧЕНИЯ НЕЙРОСЕТЕВЫХ АКУСТИЧЕСКИХ МОДЕЛЕЙ