Статистические методы формирования фонетических транскрипций
Аннотация
В речевых технологиях, в частности в системах синтеза и распознавания речи, большую роль играют методы, устанавливающие соответствие между орфографической (написание) и фонетической (произношение) формами слова. Эту задачу можно решать несколькими способами, в том числе составлением словаря, или созданием правил преобразования написания в произношение. В любом случае это требует больших трудозатрат и специальных лингвистических знаний. Особенно эта проблема актуальна при внедрении новых языков, если специалистов по ним достаточно трудно найти. Здесь особое значение приобретает использование статистических методов формирования фонетических транскрипций. В работе проведен анализ двух наиболее часто используемых подходов к статистическому транскрибированию. Приведены результаты экспериментов для трех языков: русского, английского и казахского.