АНАЛИЗ МЕТОДОВ МНОГОМОДАЛЬНОГО ОБЪЕДИНЕНИЯ ИНФОРМАЦИИ ДЛЯ АУДИОВИЗУАЛЬНОГО РАСПОЗНАВАНИЯ РЕЧИ
Аннотация:
В статье представлен аналитической обзор, охватывающий последние результаты, достигнутые в области аудиовизуального объединения (интеграции) многомодальной информации. Рассматриваются основные проблемы и обсуждаются методы их решения. Одной из важнейших задач аудиовизуальной интеграции является понимание того, как именно модальности взаимодействуют и влияют друг на друга. В данной работе этот вопрос рассматривается в контексте аудиовизуальной обработки речи, в особенности распознавания речи. В первой части обзора изложены базовые принципы аудиовизуального распознавания речи, приводится классификация типов аудио- и визуальных признаков речи. Отдельное внимание уделяется систематизации существующих способов и методов объединения аудиовизуальной информации. Во второй части, на основе проведенного анализа области исследований, приводится сводный список задач и приложений, использующих аудиовизуальное объединение с указанием методов, способов объединения информации и используемых аудио- и видеопризнаков. Предлагается структуризация методов аудиовизуальной интеграции по типам решаемых задач, а также обсуждаются преимущества и недостатки различных подходов. Приведены выводы, предложена оценка будущего развития области. В ходе дальнейших исследований планируется реализация системы аудиовизуального распознавания слитной русской речи с применением современных методов объединения многомодальной информации.
Ключевые слова:
Постоянный URL
Статьи в номере
- АНАЛОГО-ЦИФРОВОЕ ПРЕОБРАЗОВАНИЕ СИГНАЛОВ С УГЛОВОЙ МАНИПУЛЯЦИЕЙ ДЛЯ ПРОГРАММНО-ОПРЕДЕЛЯЕМЫХ РАДИОСИСТЕМ
- КВАНТОВО-МЕХАНИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННОЙ И ЗОННОЙ СТРУКТУРЫ СЦИНТИЛЛЯЦИОННОГО КРИСТАЛЛА Y3AL5O12
- ИССЛЕДОВАНИЕ СЛОЯ КРАСИТЕЛЯ МЕТОДОМ СПЕКТРОСКОПИИ НАРУШЕННОГО ПОЛНОГО ВНУТРЕННЕГО ОТРАЖЕНИЯ
- ИССЛЕДОВАНИЕ ЭФФЕКТА ВЛИЯНИЯ УГЛА ОСВЕЩЕНИЯ НА СПЕКТРЫ ОТРАЖЕНИЯ ПОВЕРХНОСТИ НЕРЖАВЕЮЩЕЙ СТАЛИ ПРИ ОКИСЛЕНИИ ИМПУЛЬСНЫМ ЛАЗЕРНЫМ ИЗЛУЧЕНИЕМ
- ОСОБЕННОСТИ ЗАПИСИ НАЛОЖЕННЫХ ГОЛОГРАММ В ФОТО-ТЕРМО-РЕФРАКТИВНОМ СТЕКЛЕ
- МЕТОД ОПРЕДЕЛЕНИЯ МАСШТАБНОГО КОЭФФИЦИЕНТА ЭЛЕКТРООПТИЧЕСКОГО МОДУЛЯТОРА ВОЛОКОННО-ОПТИЧЕСКОГО ГИРОСКОПА
- ИССЛЕДОВАНИЕ ВЛИЯНИЯ УГЛА ПОЛИРОВКИ ТОРЦОВ АНИЗОТРОПНЫХ ВОЛНОВОДОВ НА ПРЕОБРАЗОВАНИЕ СОСТОЯНИЯ ПОЛЯРИЗАЦИИ ИЗЛУЧЕНИЯ
- РЕШЕНИЕ ПРОБЛЕМЫ СИГНАЛЬНОЙ НЕОПРЕДЕЛЕННОСТИ ПРИ АНАЛИТИЧЕСКОМ КОНСТРУИРОВАНИИ ПОСЛЕДОВАТЕЛЬНОГО КОМПЕНСАТОРА В ЗАДАЧЕ УПРАВЛЕНИЯ ПЬЕЗОПРИВОДОМ
- МЕТОД ДИНАМИЧЕСКОГО ВЫБОРА ВСПОМОГАТЕЛЬНЫХ КРИТЕРИЕВ В МНОГОКРИТЕРИАЛЬНЫХ ЭВОЛЮЦИОННЫХ АЛГОРИТМАХ
- ИССЛЕДОВАНИЕ ДОСТУПНОСТИ УДАЛЕННЫХ УСТРОЙСТВ БЕСПРОВОДНЫХ СЕТЕЙ
- ИЕРАРХИЧЕСКИЙ АДАПТИВНЫЙ АЛГОРИТМ ШАБЛОННОГО ПОИСКА ДЛЯ ОЦЕНКИ ДВИЖЕНИЯ ПРИ АНАЛИЗЕ ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ
- АЛГОРИТМ АУТЕНТИФИКАЦИИ УЧАСТНИКОВ ИНФОРМАЦИОННОГО ВЗАИМОДЕЙСТВИЯ ПРИ УДАЛЕННОЙ ЗАГРУЗКЕ ОПЕРАЦИОННОЙ СИСТЕМЫ НА ТОНКИЙ КЛИЕНТ
- МЕТОД ПРОВЕДЕНИЯ ПОСТИНЦИДЕНТНОГО ВНУТРЕННЕГО АУДИТА СРЕДСТВ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ НА ОСНОВЕ ГРАФОВ
- АВТОМАТИЧЕСКАЯ СУММАРИЗАЦИЯ ВЕБ-ФОРУМОВ КАК ИСТОЧНИКОВ ПРОФЕССИОНАЛЬНО ЗНАЧИМОЙ ИНФОРМАЦИИ
- ЭКОЛОГИЧЕСКИ ЧИСТЫЙ СПОСОБ СЖИГАНИЯ ГАЗООБРАЗНОГО ТОПЛИВА С ПРИМЕНЕНИЕМ КВАЗИОПТИЧЕСКОГО СВЧ-ПУЧКА
- КОНЕЧНЫЕ ЦЕПИ МАРКОВА В МОДЕЛЬНОМ ПРЕДСТАВЛЕНИИ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА В КВАЗИСТАТИЧЕСКОЙ ФУНКЦИОНАЛЬНОЙ СРЕДЕ
- ОЦЕНКА ПОГРЕШНОСТЕЙ ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ СИЛЬНО АНОМАЛЬНОГО ГРАВИТАЦИОННОГО ПОЛЯ ЗЕМЛИ
- МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ЕМКОСТНЫХ ГРЕБЕНЧАТЫХ ПРЕОБРАЗОВАТЕЛЕЙ МИКРОМЕХАНИЧЕСКОГО ГИРОСКОПА RR-ТИПА С УЧЕТОМ ВИБРАЦИОННЫХ ВОЗДЕЙСТВИЙ
- ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ РЕФРАКЦИИ УДАРНОЙ ВОЛНЫ НА НАКЛОННОМ КОНТАКТНОМ РАЗРЫВЕ
- СПОСОБ ГРАФИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ОБОРУДОВАНИЯ В ПРОЦЕССЕ ТЕХНОЛОГИЧЕСКОЙ ПОДГОТОВКИ ПРОИЗВОДСТВА
- АЛГОРИТМ УЛУЧШЕНИЯ ИДЕНТИФИЦИРУЮЩИХ СВОЙСТВ В ЗАДАЧАХ ОЦЕНКИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ
- ОЦЕНКА ГИСТОГРАММ РАСПРЕДЕЛЕНИЯ ПРИРАЩЕНИЙ КООРДИНАТ ЦВЕТНОСТИ ДЛЯ СРЕДСТВА ОТОБРАЖЕНИЯ ИНФОРМАЦИИ
- КОНДУКТОМЕТРИЧЕСКОЕ БИОТЕСТИРОВАНИЕ В ПРИМЕНЕНИИ К ОЦЕНКЕ ПРО- И АНТИБАКТЕРИАЛЬНЫХ СВОЙСТВ КАТОЛИТОВ И АНОЛИТОВ
- О РАВНОМЕРНОСТИ ЗАСВЕТКИ РАСТРА ПРИ ЛАЗЕРНОМ СКАНИРОВАНИИ