Преобразование фонема-аллофон осуществляется в два этапа. На первом этапе происходит преобразование фонем в позиционные аллофоны, на втором – преобразование позиционных аллофонов в позиционно-комбинаторные.

Преобразование фонем в позиционные аллофоны (которые показывают позицию фонемы по отношению к словесному ударению) особенно важно для гласных, поскольку они в большой степени подвержены количественной и качественной редукции. Наибольшую длительность и силу звука имеют сильноударные гласные, несколько меньшую – слабоударные. Следующие по длительности и силе звука – гласные первой степени редукции, и, наконец, наименьшую выразительность имеют гласные второй степени редукции.

Как показали проведённые исследования, первую степень редукции имеют гласные, находящиеся в фонетическом слове непосредственно перед ударным гласным (т.е. первые предударные) либо являющиеся первым или последним звуком фонетического слова. К гласным, имеющим вторую степень редукции, относятся не первые предударные и заударные гласные (в случае, если они не являются первым или последним звуком фонетического слова).

Эти факторы учитываются правилами генерации позиционных аллофонов гласных, представленными на рис. 4.13. Обозначив позиционный аллофон индексом i, следующим за именем фонемы, будем иметь следующие значения i для гласных: 0 – сильноударный, 1 – слабоударный, 2 – гласный первой степени редукции, 3 – гласный второй степени редукции.

Правила формирования позиционного индекса гласных

Рис.4.13. Правила формирования позиционного индекса гласных

Редукция согласных в естественной речи по сравнению с гласными мала, и здесь с учётом слухового восприятия нужно различать две ситуации: согласный находится в ударном слоге и в безударном слоге. Такое разделение, однако, увеличивает количество аллофонов согласных в два раза, что влечёт увеличение размера речевого корпуса, времени на его запись, а также времени на подготовку фонетико-акустической БД. Принимая во внимание эти факторы, можно отказаться от учёта позиционной аллофонии согласных. Такое упрощение в какой-то мере компенсируется на последующих этапах синтеза, когда из фонетико-акустической БД выбираются аллослоговые сегменты, содержащие требуемые для синтеза позиционные аллофоны согласных.

Для идентичности обозначения аллофонов для согласных также вводится позиционный индекс, но он в отличие от гласных показывает удвоение фонемы и означает следующее: 0 – обычная фонема, 1 – удвоенная фонема. Правила формирования позиционного индекса согласных приведены на рис. 4.14.

Правила формирования позиционного индекса согласных

Рис.4.14. Правила формирования позиционного индекса согласных

Примечательно, что при использовании таких правил позиционный аллофон, формируемый по двум одинаковым согласным фонемам, будет совпадать с позиционным аллофоном, формируемым по двум согласным фонемам, парным по твёрдости-мягкости. Например, в фонемной последовательности «p, a, d, d’, e, r’, e, v, a, m» (орфографический текст «под деревом») пара фонем d, d’ (твёрдая и мягкая) преобразуется в позиционный аллофон d’1 ; в фонемой последовательности «h, o, d’, d’, e, r’, e, v, a» (орфографический текст «хоть дерево») пара фонем d’, d’ (обе мягкие) также преобразуется в позиционный аллофон d’1. В таких ситуациях твёрдость-мягкость фонемы учитывается на последующем этапе (описанном ниже) – при преобразовании позиционных аллофонов в комбинаторные, причём будут различными комбинаторные индексы аллофона, находящегося перед парой одинаковых либо парных по твёрдости-мягкости согласных.

Следующий этап блока преобразования фонема-аллофон – преобразование к позиционно-комбинаторным аллофонам. Комбинаторный фактор учитывает ближайшее окружение фонемы, т. е. левый контекст – фонему, расположенную непосредственно перед данной, и правый контекст – фонему, расположенную непосредственно за данной фонемой. Комбинаторные характеристики обозначаются индексами j и k, при этом индекс j указывает группу левого контекста, индекс k – группу правого контекста.

Как показали проведённые исследования (см. раздел 3.1), правила генерации комбинаторных аллофонов различны для фонем, разных по способу образования.

Для генерации комбинаторных аллофонов всё множество фонем разбивается на следующие классы:

– негубные гласные {a, i, e, y},

– губные гласные {u, o},

– большинство глухих согласных {p, p', t, t', k', c, ch', f, f’, s, s’, sh, sh’, h'},

– твёрдые аспиративные согласные {k, g, h},

– звонкие взрывные, щелевые и сонорные согласные { b, b’, d, d’, g', z, z’, zh, l, l’, m, m’, n, n’, r, r’},

– плавные сонорные согласные {v, v’, j'}.

Левый и правый фонемные контексты группируются по месту образования, но они различны для разных классов фонем. Наибольшее количество групп левых контекстов (шесть) имеют гласные, а наименьшее (один левый контекст) – все согласные, кроме плавных сонорных. Наибольшее количество правых контекстов (четыре) приходится на гласные, а также на звонкие и плавные сонорные, наименьшее (два контекста) – на глухие согласные.

Группы левых и правых контекстов для разных по способу образования фонем, а также соответствующие позиционные индексы аллофонов приведены в Приложении 2.

Группировка фонем в левые и правые контексты имеет следующие особенности:

– согласная фонема l включается в группу губных согласных при определении левого и правого контекстов негубных гласных; при определении левого и правого контекстов губных гласных фонема l включается в группу переднеязычных согласных;

– все группы левых контекстов (и соответствующие позиционные индексы) для гласных совпадают внутри слова и на границах слов, за исключением группы мягких согласных. В случае, если гласная находится внутри слова после мягкой согласной, индекс j принимает значение 4, если же гласная находится в начале слова, а предыдущее слово заканчивается на мягкий согласный, индекс j принимает значение 5.

Реальное число используемых аллофонов меньше, чем полученное теоретически, поскольку некоторые комбинации фонем не встречаются в русской речи. Полный перечень мини-набора аллофонов, используемых в системе синтеза речи, приведен в Приложении 2. Общее количество аллофонов полноударных гласных – 122, частично-ударных гласных – 117, гласных первой степени редукции – 95, гласных второй степени редукции – 36.

Общее количество аллофонов согласных – 181, из которых 100 - одиночных, и 81 – удвоенных.

Общее количество аллофонов мини-набора равно 551, из которых 370 – гласных и 181 – согласных.

 


 

 

 

Добавить комментарий