РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ ЕГИПЕТСКОГО ДИАЛЕКТА АРАБСКОГО ЯЗЫКА В ТЕЛЕФОННОМ КАНАЛЕ
Аннотация:
Приводится описание ряда систем автоматического распознавания речи для египетского диалекта арабского языка, построенных на основе набора данных CALLHOME Egyptian. Присутствует описание как классических систем, основанных на скрытых марковских моделях и смеси гауссовых распределений, так и акустических моделей на основе глубоких нейронных сетей. Продемонстрирован вклад от использования дикторозависимых акустических признаков (bottleneck), для извлечения которых были обучены три экстрактора на основе нейронных сетей. Для обучения экстракторов были использованы три набора данных на различных языках: русский, английский и различных диалектах арабского. Исследована возможность использования набора данных современного стандартного арабского языка малого объема для получения фонетических транскрипций. Эксперименты показали, что использование экстрактора, полученного на основе русскоязычного набора данных, позволяет значительно повысить качество распознавания арабской речи. Также установлено, что, хотя использование фонетических транскрипций, основанных на современном стандартном арабском, снижает качество распознавания, все же результаты работы системы остаются применимыми на практике. Дополнительно проведено исследование применения полученных моделей для решения задачи поиска ключевых слов. Полученные системы демонстрируют качество распознавания, сравнимое с современными опубликованными результатами. Предложены дальнейшие пути увеличения качества распознавания.
Ключевые слова:
Постоянный URL
Статьи в номере
- АКТУАЛЬНЫЕ ЗАДАЧИ И ДОСТИЖЕНИЯ СИСТЕМ ПАРАЛИНГВИСТИЧЕСКОГО АНАЛИЗА РЕЧИ
- МЕТОДЫ ПОСТРОЕНИЯ ВЫСОКОСТАБИЛЬНЫХ ЭРБИЕВЫХ СУПЕРЛЮМИНЕСЦЕНТНЫХ ВОЛОКОННЫХ ИСТОЧНИКОВ ОПТИЧЕСКОГО ИЗЛУЧЕНИЯ
- АНАЛИЗ ПЕЛЕНГАЦИОННЫХ ХАРАКТЕРИСТИК ИМПУЛЬСНОГО ОПТИЧЕСКОГО КООРДИНАТОРА ЦЕЛИ ПРИ ОБЛУЧЕНИИ САМОЛЕТОВ-ЦЕЛЕЙ
- ВЛИЯНИЕ МЕТОДОВ ОБРАБОТКИ И ОЧИСТКИ ПОВЕРХНОСТИ СИТАЛЛА СО-115М НА ПРОЧНОСТЬ ОПТИЧЕСКОГО КОНТАКТА
- РОБАСТНЫЕ АЛГОРИТМЫ ПАРАМЕТРИЧЕСКОГО ОЦЕНИВАНИЯ В НЕКОТОРЫХ ЗАДАЧАХ ОБЕСПЕЧЕНИЯ УСТОЙЧИВОСТИ
- ИНТЕРВАЛЬНАЯ ОЦЕНКА СОСТОЯНИЙ СИНГУЛЯРНЫХ СИСТЕМ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С ЗАПАЗДЫВАНИЕМ
- ИСПОЛЬЗОВАНИЕ ПУЛЬСАЦИЙ ДАВЛЕНИЯ КОЛЕБЛЮЩЕГОСЯ ГАЗОВОГО ПОТОКА ДЛЯ ОБРАБОТКИ ТЕРМОУПРОЧНЕННЫХ ОБРАЗЦОВ СТАЛИ 40Х
- СИНТЕЗ, СТРУКТУРА И СПЕКТРАЛЬНЫЕ СВОЙСТВА КАЛИЕВО-АЛЮМОБОРАТНЫХ СТЕКОЛ С НАНОКРИСТАЛЛАМИ ФЕРРИТА МАРГАНЦА
- КРИТЕРИИ ОЦЕНКИ И МОДЕЛИ ИНФОРМАЦИОННЫХ СИСТЕМ, ОБЛАДАЮЩИХ СВОЙСТВОМ ПОВЕДЕНИЯ
- ДИНАМИЧЕСКИЕ МОДЕЛИ ОТЛАДКИ ПРОГРАММ C ВЕРОЯТНОСТНЫМ ОБНАРУЖЕНИЕМ ОШИБОК И РАСПРЕДЕЛЕНИЕМ ЭРЛАНГА ДЛИТЕЛЬНОСТИ ИХ ИСПРАВЛЕНИЯ
- ИЗМЕРЕНИЕ РАССТОЯНИЯ ПО ЕДИНСТВЕННОМУ ДЕФОКУСИРОВАННОМУ СНИМКУ
- ПРИМЕНЕНИЕ БИНАРНЫХ ДЕСКРИПТОРОВ ДЛЯ ТРЕКИНГА МНОЖЕСТВА ЛИЦ В СИСТЕМАХ ВИДЕОНАБЛЮДЕНИЯ
- ТОЧНОСТЬ, СКОРОСТЬ И СЛОЖНОСТЬ УСТРОЙСТВ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ ПО ОПОРНЫМ ТОЧКАМ
- СИСТЕМА ОБУЧЕНИЯ ВИЗУАЛЬНЫМ ПОНЯТИЯМ НА ОСНОВЕ СООТНЕСЕНИЯ ЛЕКСЕМ И КЛЮЧЕВЫХ ТОЧЕК
- РЕАЛИЗАЦИЯ ТЕХНОЛОГИИ ОБНАРУЖЕНИЯ УТЕЧКИ ИНФОРМАЦИИ ПРИ ПРОВЕДЕНИИ АТАК ПО СТОРОННИМ КАНАЛАМ, ОСНОВАННОЙ НА МЕТОДЕ ВЫЧИСЛЕНИЯ НОРМАЛИЗОВАННОЙ ВНУТРИКЛАССОВОЙ ДИСПЕРСИИ
- РАСПРЕДЕЛЕНИЕ И АДАПТАЦИЯ ВИДЕОПОТОКА В ФОРМАТЕ SVC В ГЕТЕРОГЕННОЙ СЕТИ
- МОЛЕКУЛЯРНО-ДИНАМИЧЕСКОЕ МОДЕЛИРОВАНИЕ ВЗАИМОДЕЙСТВИЯ ЛИЗИНОВОГО ДЕНДРИМЕРА И ПЕПТИДОВ СЕМАКС
- ВОЛЬТ-АМПЕРНЫЕ ХАРАКТЕРИСТИКИ ДЛЯ ДВУХ СИСТЕМ КВАНТОВЫХ ВОЛНОВОДОВ С ПРИСОЕДИНЕННЫМИ КВАНТОВЫМИ РЕЗОНАТОРАМИ
- МОДЕЛЬНОЕ ИССЛЕДОВАНИЕ МАШИНЫ ДВОЙНОГО ПИТАНИЯ С ТОКОВЫМ УПРАВЛЕНИЕМ
- КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ПРОЧНОСТНЫХ ХАРАКТЕРИСТИК ДАТЧИКА ИНДУКЦИОННОГО ЛАГА
- ИССЛЕДОВАНИЕ РЕЖИМА СИЛЬНОГО КОНФАЙНМЕНТА КВАНТОВЫХ ТОЧЕК СЕЛЕНИДА КАДМИЯ ВО ФТОРОФОСФАТНЫХ СТЕКЛАХ
- СИСТЕМА ТЕХНИЧЕСКОГО ЗРЕНИЯ ДЛЯ РОБОТИЗИРОВАННОГО МАКЕТА НАДВОДНОГО СУДНА
- ИССЛЕДОВАНИЕ РОСТА НАНОКРИСТАЛЛОВ ХЛОРИДА СЕРЕБРА ВО ФТОРОФОСФАТНОМ СТЕКЛЕ