Например, Бобцов

МЕТОД АВТОМАТИЧЕСКОЙ РАССТАНОВКИ ПАУЗ ДЛЯ КАЗАХСКОГО ЯЗЫКА

Аннотация:

Предложен новый метод паузации для систем синтеза интонационной речи, основанный на анализе дистрибутивной семантики в больших текстовых корпусах. Для предсказывания паузы использовался классификатор на основе метода опорных векторов и два речевых корпуса на казахском языке. Предсказание мест паузации проводилось на уровне биграмм, где входными параметрами биграммы служили векторные представления обоих ее лексем и их битовое представление в кластерной модели Брауна. Проведенные исследования показали, что предложенный метод паузации для систем автоматического синтеза казахской речи в повествовательном стиле обеспечивает расстановку пауз с высокой точностью. Экспериментально подтверждена важность использования однородных данных для решения такого рода задач. Предложенный подход может быть использован при создании систем автоматического синтеза речи для множества языков.

Ключевые слова:

Статьи в номере