Описанные выше артикуляторные признаки места и способа образования характеризуют систему фонем русского языка в статическом виде. В потоке речи в зависимости от конкретных условий акустико-артикуляторные характеристики фонем изменяются, что 30 приводит к появлению оттенков фонем, или аллофонов. Аллофоны подразделяются на позиционные и комбинаторные.

Позиционные аллофоны определяются положением фонемы по отношению к ударному слогу в слове. Наличие сильноцентрированного словесного ударения (полного или частичного) является одной из главных фонологических особенностей русского языка [28]. Эта особенность поддерживается ярким фонетическим контрастом ударных и безударных гласных благодаря существенным различиям их количественных (длительность и амплитуда) и качественных (спектральная окраска) характеристик. Ударные слоги в качественном и количественном отношении реализуются наиболее полно, в то время как безударные слоги, а, в особенности, гласные в заударных слогах могут редуцироваться в очень сильной степени (эффект редукции). Редукция безударных гласных подчиняется строгим закономерностям, что позволило ещё в XIX веке вывести русскому филологу А.А. Потебня [29] знаменитую формулу ритмической организации русского слова:

2–1–0–2 (1.1)

где номер обозначает степень редукции гласного; 0 – отсутствие редукции, 1 – первая и 2 – вторая степень редукции.

В расширенном виде, с учётом неприкрытого начального слога и открытого конечного слога в слове, эта формула может быть записана как:

Г1 – (СГ2 – …– СГ2) – СГ1 – СГ0 – (СГ2 – … – СГ2) – CГ1 (1.2)

где Г обозначает гласный звук, С – согласный; степень редукции гласного показана индексом при букве Г.

Комбинаторные аллофоны определяются ближайшим контекстом фонемы и обусловлены наложением в потоке речи артикуляции одного звука на другой в результате действия эффектов коартикуляции и ассимиляции. В результате коартикуляции согласная фонема в значительной степени приобретает окраску последующей гласной фонемы (например, огубление согласной /х/ в слове «сухую - сухуйу» в сравнении с «сухая - сухая»). Гласная же фонема в значительной степени приобретает окраску предшествующей согласной (например, смягчение гласной /а/ в слове «тяпки – т’aпк’и» в сравнении с «тапки – тапк’и»). Эффекты ассимиляции в наибольшей степени проявляются при стечении двух или более согласных (например, смягчение и потеря взрывного сегмента согласной /т/ в слове «отнять – ат’н’ат’».

Эффекты редукции, коартикуляции и ассимиляции проявляются в основном внутри слоговых комплексов, в меньшей степени на стыках слогов и в ещё меньшей степени, но всё ещё заметной, на стыках слов внутри синтагмы. Описанные эффекты практически полностью прекращают своё действие только на стыках синтагм и фраз.

Описание фонем в потоке речи в виде последовательности аллофонов может быть осуществлено с различной степенью подробности. В общем случае невозможно дать точную оценку количества аллофонов, т.к. она напрямую зависит от степени детализации учёта влияния позиционных и комбинаторных факторов. При этом общее количество получаемых аллофонов может колебаться от нескольких сотен до нескольких десятков тысяч.

Рассмотрим два практически опробованных варианта аллофонных наборов, обеспечивающих достаточно подробное описание оттенков фонем в потоке речи, подтверждённое результатами тестирования синтезированной речи.

Схема генерации аллофонов гласных фонем по первому варианту представлена на рис. 1.2.

Фонемно-аллофонное преобразование обеспечивает генерацию следующих позиционных аллофонов гласных: ударный, частично ударный, безударный первой степени редукции и безударный второй степени редукции. Всего – 4 различных позиционных вариантов. С учётом левого контекста генерируются следующие комбинаторные аллофоны гласных: после паузы, после твёрдых губных, переднеязычных, заднеязычных, после /M/, после /N/, после /L/, после /R/, большинства мягких, после /M’/, после /N’/, после /L’/, после /R’/, после гласных /U/, /O/, /A/, /E/, /Y/, /I/. Всего - 19 левых контекстов. С учётом правого контекста генерируются следующие комбинаторные аллофоны гласных: перед паузой, перед твёрдыми губными, переднеязычными и заднеязычными, перед мягкими. Всего - 5 правых контекстов. Итого, для 5-ти гласных фонем /U, O, A, E, I(Y)/обеспечивается генерация Nv = 5*4*19*5 = 1900 аллофонов.

Аллофоны согласных также генерируются с учётом комбинаторных факторов левого и правого контекста (см. рис 1.3).

Левый контекст: после паузы, после глухих согласных, после звонких согласных, после гласных. Правый контекст: перед паузой, перед глухими согласными, перед звонкими согласными, перед безударными гласными, перед ударными гласными. Итого, для 36-ти согласных фонем обеспечивается генерация Nc = 36*4*5= 720 аллофонов.

Схема образования аллофонов гласных фонем

Рис.1.2. Схема образования аллофонов гласных фонем

Полученная оценка общего количества аллофонов Nv + Nc = 1900 + 720 = 2620 не претендует, конечно, на абсолютную точность, однако указывает на порядок этого числа и иллюстрирует степень вариативности фонем в речевом потоке. В работе [30] описанное количество аллофонов предложено называть макси-набором. Возможны и другие оценки количества аллофонов в зависимости от требуемой точности описания влияния позиционных и комбинаторных факторов при синтезе речи.

Схема образования аллофонов согласных фонем

Рис. 1.3. Схема образования аллофонов согласных фонем

В работе кроме макси-набора авторами предложен также мини-набор аллофонов. При использования мини-набора для синтеза русской речи создаётся тот же набор позиционных аллофонов, однако набор комбинаторных аллофонов существенно сокращён. С учётом левого контекста создаются следующие комбинаторные аллофоны гласных: после синтагматической паузы, после твёрдых губных согласных, после твёрдых передне-и среднеязычных согласных, после твёрдых заднеязычных согласных и гласных, после мягких согласных. Всего 5 левых контекстов. С учётом правого контекста создаются следующие комбинаторные аллофоны гласных: перед паузой, перед переднеязычными и заднеязычными твёрдыми согласными и гласными /U/, /O/, /A/, /E/, /Y/, перед губными согласными, перед мягкими согласными и гласной /I/. Итого, для 5-ти типов гласных создаются Nv = 5*4*5*4 = 400 аллофонов. Аллофоны согласных создаются только с учётом правого контекста: перед паузой, перед глухими согласными, перед звонкими согласными, перед безударными гласными, перед ударными гласными. Итого, для всех 36-ти согласных создаются Nc = 36*5= 180 аллофонов. Всего создаётся: 400+180=580 аллофонов русской речи. Предлагаемый мини-набор аллофонов обеспечивает достаточно высокую разборчивость синтезированной речи при относительно невысокой в сравнении с макси-набором её естественности.

Каждый из генерируемых аллофонов обозначается именем фонемы и следующими за ним тремя целочисленными индексами: i, j, k. Индекс i для гласной указывает её позицию по отношению к словесному ударению и может принимать одно из следующих значений: 0 – полноударный,1 – частично-ударный, 2 – гласный первой степени редукции, 3 – гласный второй степени редукции. Индекс i для согласной указывает удвоение фонемы и может принимать одно из следующих значений: 0 – обычная фонема, 1 – удвоенная фонема. Для гласных и согласных индекс j указывает группу левого контекста, а индекс k – группу правого контекста.


 

 

 

Добавить комментарий