Приведен аналитической обзор, охватывающий последние результаты, достигнутые в области аудиовизуального (АВ) объединения (интеграции) многомодальной информации. Рассмотрены основные проблемы и обсуждены методы их решения. Одной из важнейших задач АВ интеграции является понимание того, как именно модальности взаимодействуют и влияют друг на друга. В данной работе этот вопрос рассматривается в контексте АВ обработки речи, и, в особенности, распознавания речи. Приведены выводы и предложена оценка будущего развития области. В ходе дальнейших исследований планируется реализация системы аудиовизуального распознавания слитной русской речи с применением современных методов объединения многомодальной информации.