«Размножение» элементов компиляции

Thursday, April 25, 2024

При «размножении» элементов компиляции учитывается известный факт [183] идентичности слухового восприятия аллофонов некоторых гласных русской речи в безударных позициях, а именно:

– E и Y первой степени редукции после твёрдых согласных не перед паузой;

– A, E и Y второй степени редукции после твёрдых согласных не перед паузой;

– A и E первой степени редукции после мягких согласных не перед паузой;

– A, E и I второй степени редукции после мягких согласных не перед паузой.

Таким образом, отсутствующий в БД мультифон может быть заменён другим, содержащим гласные, идентичные по слуховому восприятию с требуемыми для синтеза.

С учётом используемых по разработанной классификации аллофонов гласных первой и второй степеней редукции, описанных в Приложении 2, а также индексов аллофонов гласных, описанных в разделе 4.3, правила замены аллофонов при «размножении» элементов компиляции следующие:

Операции «размножение» подвергаются диаллофоны, а также внутрисловные и внутрисинтагменные слоговые комплексы первого типа.

Необходимо отметить, что при замене аллофонов могут не учитываться фонетические особенности различных диалектов, а также индивидуальные фонетико-акустические особенности произношения. Таким образом, создаются элементы компиляции, которые, возможно, не в полной мере отражают индивидуальные фонетико-акустические особенности голоса диктора, что влечёт в результате некоторое уменьшение естественности синтезируемой речи. Но при операции дублирования количество элементов компиляции в БД увеличивается, таким образом, при синтезе речи вместо отдельных аллофонов используются мультифоны, что влечёт меньшие искажения сигнала в процессе просодической модификации и, как следствие, повышение разборчивости синтезируемой речи.

Процесс «размножения» сегментов может осуществляться статически – путём добавления сегментов в фонетико-акустическую БД, и динамически – при поиске речевого сегмента в процессе синтеза речи. Во втором случае, если требуемый сегмент отсутствует в БД, формируется список сегментов, которые могут использоваться вместо требуемого, и происходит поиск одного из них.

Статическое размножение сегментов влечёт увеличение объёма фонетико-акустической БД при практически неизменном содержании, но при этом, в отличие от динамического размножения, не увеличивается время поиска сегментов в процессе синтеза речи. Таким образом, в прикладных программах, где критическим ресурсом является объём памяти, целесообразней использовать динамическое размножение, в то время как в прикладных программах, критичных к временнóму ресурсу, необходимо использовать статическое размножение.