Например, Бобцов

Моделирование взаимосвязи между модальностями для решения задач обработки аудиовизуальной речи

Сборник тезисов
Конференция:VI Всероссийский конгресс молодых ученых
Раздел:Инженерные системы и приборостроение
Рубрика:Речевые технологии
Год:2016

Моделирование взаимосвязи между модальностями для решения задач обработки аудиовизуальной речи

УДК:004.93

Аннотация

В работе представлена задача совместного моделирования голосовой и визуальной составляющей (модальностей) аудиовизуальной речи. Рассмотрены различные способы решения этой задачи; для проведения исследований выбран подход на основе кластеризации. Такой выбор обоснован особенностями структуры аудиовизуальной речи. Предложена модификация алгоритма K-средних, позволяющая учесть взаимную связь между модальностями. Эксперименты, проведённые на сгенерированных данных, показали работоспособность предложенного решения и целесообразность дальнейших исследований на аудиовизуальных данных.

Материалы конференций