ТЕХНОЛОГИЯ СИНТЕЗА ЕСТЕСТВЕННОЙ РЕЧИ С ИСПОЛЬЗОВАНИЕМ БАЗЫ ДАННЫХ НЕБОЛЬШОГО ОБЪЕМА
Аннотация:
Представлен подход к созданию голоса для системы синтеза естественной речи в условиях малого объема исходного речевого материала. Эффективное решение данной проблемы необходимо для задачи восстановления голоса (синтез потерянных фрагментов записи на основе доступного материала известного диктора, например актера). Представленная система синтеза речи является гибридной, так как комбинирует достоинства систем, основанных на скрытых марковских моделях и методе Unit Selection. Подход, описанный в работе, использует статистические модели интонационных параметров, что позволяет сохранять в синтезированной речи особенности произношения диктора. Описан процесс подготовки базы данных для синтеза, в том числе и решение проблемы нехватки исходного речевого материала для обучения модели. Специальные алгоритмы конкатенации и модификации звуковых элементов помогают корректировать их параметры в соответствии с требованиями, обеспечивают общую тональную гладкость и уменьшают искажения в спектральной области на границах объединяемых фрагментов. Аудитивные тесты показали эффективность предложенных решений и доказали, что синтез естественной речи возможен даже в условиях малой речевой базы (вплоть до одного часа речи).
Ключевые слова:
Постоянный URL
Статьи в номере
- ФОТОНИКА И ОПТОИНФОРМАТИКА В ЕВРОПЕ: ТРЕНДЫ 2003–2013
- ДВУМЕРНАЯ ЛОКАЛИЗАЦИЯ АТОМНЫХ НАСЕЛЕННОСТЕЙ В ЧЕТЫРЕХУРОВНЕВЫХ КВАНТОВЫХ СИСТЕМАХ
- РЕКУРРЕНТНЫЙ АЛГОРИТМ ОБРАБОТКИ ИНТЕРФЕРОМЕТРИЧЕСКИХ СИГНАЛОВ НА ОСНОВЕ МУЛЬТИОБЛАЧНОЙ МОДЕЛИ ПРЕДСКАЗАНИЯ
- ИССЛЕДОВАНИЕ БИОЛОГИЧЕСКИХ ОБЪЕКТОВ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ ТОМОГРАФИИ С ОБРАБОТКОЙ ДАННЫХ ПОСЛЕДОВАТЕЛЬНЫМ МЕТОДОМ МОНТЕ-КАРЛО
- МЕТОД АВТОМАТИЧЕСКОЙ КАЛИБРОВКИ СТЕРЕОСКОПИЧЕСКОЙ СИСТЕМЫ
- МЕТОД ПОВЫШЕНИЯ КАЧЕСТВА СНИМКОВ КОСМИЧЕСКИХ ОБЪЕКТОВ
- РОБАСТНОЕ РЕГУЛИРОВАНИЕ СИСТЕМ С ПОЛИНОМИАЛЬНОЙ НЕЛИНЕЙНОСТЬЮ НА ПРИМЕРЕ БЫСТРЫХ ТЕРМИЧЕСКИХ ПРОЦЕССОВ
- НАНОСТРУКТУРИРОВАНИЕ КАК СПОСОБ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ТЕРМОЭЛЕКТРИКОВ
- СПЕКТРАЛЬНО-ЛЮМИНЕСЦЕНТНЫЕ СВОЙСТВА ИОНОВ ХРОМА В НАНОСТЕКЛОКЕРАМИКАХ НА ОСНОВЕ ФОРСТЕРИТА
- СПЕКТРАЛЬНО-ЛЮМИНЕСЦЕНТНЫЕ СВОЙСТВА ФТОРОФОСФАТНЫХ СТЕКОЛ, АКТИВИРОВАННЫХ ИТТЕРБИЕМ И ЭРБИЕМ
- ОПТИМИЗАЦИЯ ПАРАМЕТРОВ МЕТАЛЛ-ДИЭЛЕКТРИЧЕСКИХ НАНОСТРУКТУР ДЛЯ СЕНСОРНЫХ ПРИМЕНЕНИЙ
- ПРИМЕНЕНИЕ HLD-МЕТОДОЛОГИИ ДЛЯ ПРОЕКТИРОВАНИЯ РЕКОНФИГУРИРУЕМЫХ ВСТРАИВАЕМЫХ СИСТЕМ
- ОПРЕДЕЛЕНИЕ КЛИППИРОВАННЫХ ФРАГМЕНТОВ В АКУСТИЧЕСКИХ СИГНАЛАХ
- ДВУХУРОВНЕВЫЙ МЕТОД ИЕРАРХИЧЕСКО-КООРДИНАЦИОННОГО ОБСЛУЖИВАНИЯ ОЧЕРЕДЕЙ НА УЗЛАХ ТЕЛЕКОММУНИКАЦИОННОЙ СЕТИ
- МЕТОД ПОИСКА ПОВТОРЯЮЩИХСЯ ФРАГМЕНТОВ ТЕКСТА В ТЕХНИЧЕСКОЙ ДОКУМЕНТАЦИИ
- МЕТОДИКА ОЦЕНКИ ЭФФЕКТИВНОСТИ СИСТЕМЫ МЕНЕДЖМЕНТА ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ПО ВРЕМЕНИ РЕАКЦИИ СИСТЕМЫ НА ИНЦИДЕНТЫ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
- ИДЕНТИФИКАЦИЯ ДВИЖУЩЕГОСЯ ЧЕЛОВЕКА В СИСТЕМАХ ВИДЕОНАБЛЮДЕНИЯ
- ПРИМЕНЕНИЕ МУЛЬТИСЕНСОРНОЙ СИСТЕМЫ ДЛЯ АНАЛИЗА ГОРЬКОСТИ ПРЕПАРАТОВ КИТАЙСКОЙ НАРОДНОЙ МЕДИЦИНЫ
- ОПРЕДЕЛЕНИЕ ПОГРЕШНОСТИ БЕСКОНТАКТНОГО ИЗМЕРЕНИЯ ПЛОЩАДИ ДЕФЕКТОВ НА ПОВЕРХНОСТЯХ СЛОЖНОЙ ФОРМЫ ПРИ ВИДЕОЭНДОСКОПИЧЕСКОМ КОНТРОЛЕ
- СРАВНИТЕЛЬНЫЙ АНАЛИЗ СИСТЕМ ЗАПАСАНИЯ ЭНЕРГИИ И ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНЫХ ОБЛАСТЕЙ ПРИМЕНЕНИЯ СОВРЕМЕННЫХ СУПЕРМАХОВИКОВ
- МНОГОСЕТОЧНЫЙ МЕТОД УСКОРЕНИЯ СХОДИМОСТИ ПРИ РЕШЕНИИ ЗАДАЧ ГАЗОВОЙ ДИНАМИКИ НА НЕСТРУКТУРИРОВАННЫХ СЕТКАХ
- РАСШИРЕНИЕ ТЕНЗОРНОГО ПРОИЗВЕДЕНИЯ ОПЕРАТОРОВ НА ПРИМЕРЕ ОПЕРАТОРА ДИРАКА
- МОЛЕКУЛЯРНО-ДИНАМИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПЕПТИДНЫХ ПОЛИЭЛЕКТРОЛИТОВ
- ИДЕНТИФИКАЦИЯ ПАРАМЕТРОВ НЕЛИНЕЙНОЙ МАТЕМАТИЧЕСКОЙ МОДЕЛИ БЫСТРЫХ ТЕРМИЧЕСКИХ ПРОЦЕССОВ