АКТУАЛЬНЫЕ ЗАДАЧИ И ДОСТИЖЕНИЯ СИСТЕМ ПАРАЛИНГВИСТИЧЕСКОГО АНАЛИЗА РЕЧИ
Аннотация:
Представлен аналитической обзор современных и актуальных задач, стоящих в области компьютерной паралингвистики, а также последних достижений автоматических систем паралингвистического анализа разговорной речи. Паралингвистика изучает невербальные аспекты человеческой коммуникации и речи: естественные эмоции, акценты, психофизиологические состояния, особенности произношения, параметры голоса диктора и т.д. Представлена архитектура базовой компьютерной системы акустического паралингвистического анализа, ее основные компоненты и используемые методы обработки речи. Приведена информация о международных соревнованиях по компьютерной паралингвистике Computational Paralinguistics Challenge (ComParE), которые c2009 года проходят ежегодно в рамках международной конференции INTERSPEECH, организуемой международной ассоциацией по речевой коммуникации ISCA. Представлены задачи (конкурсы), которые решались в рамках данного соревнования в период с 2009 по 2016 г.г., а также компьютерные системы, победившие в каждом из проведенных конкурсов, и полученные результаты. Последние завершенные соревнования ComParE-2015 проходили в сентябре 2015 года в Германии и содержали следующие 3 конкурса: 1) распознавание дикторов, которые говорят на родном для них языке (DN); 2) предсказание наличия болезни Паркинсона по речи (PC); 3) автоматическое определение, ест ли человек (диктор) во время говорения или диалога, и классификация вида пищи (определение одного из 7 типов), которую он принимает в это время. В последнем конкурсе («Eating ConditionSub-Challenge», EC) победу одержала совместная турецко-российская команда авторов данной статьи, которая разработала наиболее эффективную компьютерную систему для определения и классификации соответствующих акустических паралингвистических явлений. В статье представлена архитектура данной системы и основные модели и методы, описаны используемые обучающие и тестовые аудиоданные, а также наилучшие полученные результаты по машинной классификации акустических паралингвистических явлений.
Ключевые слова:
Постоянный URL
Статьи в номере
- МЕТОДЫ ПОСТРОЕНИЯ ВЫСОКОСТАБИЛЬНЫХ ЭРБИЕВЫХ СУПЕРЛЮМИНЕСЦЕНТНЫХ ВОЛОКОННЫХ ИСТОЧНИКОВ ОПТИЧЕСКОГО ИЗЛУЧЕНИЯ
- АНАЛИЗ ПЕЛЕНГАЦИОННЫХ ХАРАКТЕРИСТИК ИМПУЛЬСНОГО ОПТИЧЕСКОГО КООРДИНАТОРА ЦЕЛИ ПРИ ОБЛУЧЕНИИ САМОЛЕТОВ-ЦЕЛЕЙ
- ВЛИЯНИЕ МЕТОДОВ ОБРАБОТКИ И ОЧИСТКИ ПОВЕРХНОСТИ СИТАЛЛА СО-115М НА ПРОЧНОСТЬ ОПТИЧЕСКОГО КОНТАКТА
- РОБАСТНЫЕ АЛГОРИТМЫ ПАРАМЕТРИЧЕСКОГО ОЦЕНИВАНИЯ В НЕКОТОРЫХ ЗАДАЧАХ ОБЕСПЕЧЕНИЯ УСТОЙЧИВОСТИ
- ИНТЕРВАЛЬНАЯ ОЦЕНКА СОСТОЯНИЙ СИНГУЛЯРНЫХ СИСТЕМ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С ЗАПАЗДЫВАНИЕМ
- ИСПОЛЬЗОВАНИЕ ПУЛЬСАЦИЙ ДАВЛЕНИЯ КОЛЕБЛЮЩЕГОСЯ ГАЗОВОГО ПОТОКА ДЛЯ ОБРАБОТКИ ТЕРМОУПРОЧНЕННЫХ ОБРАЗЦОВ СТАЛИ 40Х
- СИНТЕЗ, СТРУКТУРА И СПЕКТРАЛЬНЫЕ СВОЙСТВА КАЛИЕВО-АЛЮМОБОРАТНЫХ СТЕКОЛ С НАНОКРИСТАЛЛАМИ ФЕРРИТА МАРГАНЦА
- КРИТЕРИИ ОЦЕНКИ И МОДЕЛИ ИНФОРМАЦИОННЫХ СИСТЕМ, ОБЛАДАЮЩИХ СВОЙСТВОМ ПОВЕДЕНИЯ
- ДИНАМИЧЕСКИЕ МОДЕЛИ ОТЛАДКИ ПРОГРАММ C ВЕРОЯТНОСТНЫМ ОБНАРУЖЕНИЕМ ОШИБОК И РАСПРЕДЕЛЕНИЕМ ЭРЛАНГА ДЛИТЕЛЬНОСТИ ИХ ИСПРАВЛЕНИЯ
- ИЗМЕРЕНИЕ РАССТОЯНИЯ ПО ЕДИНСТВЕННОМУ ДЕФОКУСИРОВАННОМУ СНИМКУ
- ПРИМЕНЕНИЕ БИНАРНЫХ ДЕСКРИПТОРОВ ДЛЯ ТРЕКИНГА МНОЖЕСТВА ЛИЦ В СИСТЕМАХ ВИДЕОНАБЛЮДЕНИЯ
- ТОЧНОСТЬ, СКОРОСТЬ И СЛОЖНОСТЬ УСТРОЙСТВ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ ПО ОПОРНЫМ ТОЧКАМ
- СИСТЕМА ОБУЧЕНИЯ ВИЗУАЛЬНЫМ ПОНЯТИЯМ НА ОСНОВЕ СООТНЕСЕНИЯ ЛЕКСЕМ И КЛЮЧЕВЫХ ТОЧЕК
- РЕАЛИЗАЦИЯ ТЕХНОЛОГИИ ОБНАРУЖЕНИЯ УТЕЧКИ ИНФОРМАЦИИ ПРИ ПРОВЕДЕНИИ АТАК ПО СТОРОННИМ КАНАЛАМ, ОСНОВАННОЙ НА МЕТОДЕ ВЫЧИСЛЕНИЯ НОРМАЛИЗОВАННОЙ ВНУТРИКЛАССОВОЙ ДИСПЕРСИИ
- РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ ЕГИПЕТСКОГО ДИАЛЕКТА АРАБСКОГО ЯЗЫКА В ТЕЛЕФОННОМ КАНАЛЕ
- РАСПРЕДЕЛЕНИЕ И АДАПТАЦИЯ ВИДЕОПОТОКА В ФОРМАТЕ SVC В ГЕТЕРОГЕННОЙ СЕТИ
- МОЛЕКУЛЯРНО-ДИНАМИЧЕСКОЕ МОДЕЛИРОВАНИЕ ВЗАИМОДЕЙСТВИЯ ЛИЗИНОВОГО ДЕНДРИМЕРА И ПЕПТИДОВ СЕМАКС
- ВОЛЬТ-АМПЕРНЫЕ ХАРАКТЕРИСТИКИ ДЛЯ ДВУХ СИСТЕМ КВАНТОВЫХ ВОЛНОВОДОВ С ПРИСОЕДИНЕННЫМИ КВАНТОВЫМИ РЕЗОНАТОРАМИ
- МОДЕЛЬНОЕ ИССЛЕДОВАНИЕ МАШИНЫ ДВОЙНОГО ПИТАНИЯ С ТОКОВЫМ УПРАВЛЕНИЕМ
- КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ПРОЧНОСТНЫХ ХАРАКТЕРИСТИК ДАТЧИКА ИНДУКЦИОННОГО ЛАГА
- ИССЛЕДОВАНИЕ РЕЖИМА СИЛЬНОГО КОНФАЙНМЕНТА КВАНТОВЫХ ТОЧЕК СЕЛЕНИДА КАДМИЯ ВО ФТОРОФОСФАТНЫХ СТЕКЛАХ
- СИСТЕМА ТЕХНИЧЕСКОГО ЗРЕНИЯ ДЛЯ РОБОТИЗИРОВАННОГО МАКЕТА НАДВОДНОГО СУДНА
- ИССЛЕДОВАНИЕ РОСТА НАНОКРИСТАЛЛОВ ХЛОРИДА СЕРЕБРА ВО ФТОРОФОСФАТНОМ СТЕКЛЕ