С точки зрения образования слог представляет собой звук или несколько звуков, произносимых одним выдыхательным толчком.

Со стороны акустической слог - это звуковой отрезок речи, в котором один звук выделяется наибольшей звучностью в сравнении с соседними - предшествующим и последующим. Гласные звуки, как наиболее звучные, являются слогообразующими, притягивая к себе соседствующие, менее звучные, согласные.

Согласно одному из определений слога [18], звуки в нём располагаются от наименее звучного к наиболее звучному. Закон восходящей звучности проиллюстрирован на приводимых ниже примерах, где степень звучности обозначена цифрами: 3 – гласные, 2 – сонорные согласные, 1 – остальные согласные и паузу.

Примеры: Во-да: 1-3/1-3; лод-ка: 2-3-1/1-3; ма-сло: 2-3/1-2-3; волна: 1-3-2/2-3; ин-тер-на-ци-о-наль-ный: 3-2/1-3-2/2-3/1-3/3/2-3-2/2-3-2.

Описанный закон слогоделения, впервые предложенный в работах Л.В. Щербы [166], вызывал много споров относительно истинного положения границы слогораздела. В работах Л.В. Бондарко [167] предложено и фонетически обосновано более простое определение слога, когда граница слогораздела всегда устанавливается непосредственно после гласного звука, а сам слог получил название открытого слога.

Ввиду относительной автономности слогов, составляющих слово, они могут быть использованы наряду с аллофонами и диаллофонами как эффективные элементы компиляции при синтезе речи [152]. При этом, на наш взгляд, целесообразно использовать понятие открытого слога, предложенное Л.В. Бондарко, ввиду простоты и однозначности его определения.

Определение открытого слога, однако, может быть положено в основу разметки речевого корпуса на слоговые комплексы только с некоторыми уточнениями. Действительно, основным аргументом при выборе слога в качестве элемента компиляции является предположение об относительной лёгкости его вычленения в речевом потоке, т.е. об относительно большой величине контраста акустических параметров звуков (их спектрально-временных характеристик) на слоговых границах. Однако это не всегда так. Ослабление межслоговых контрастов может вызываться следующими факторами:

– взаимной ассимиляцией звуков;

– редукцией, вплоть до полного исчезновения, некоторых сонорных согласных, находящихся между гласными;

– редукцией, вплоть до полного исчезновения, безударных гласных, находящихся между согласными.

Для уточнения условий проявления указанных явлений были проведены экспериментальные исследования акустических характеристик слоговых составляющих на материале фонограмм речи нескольких дикторов, которыми был начитан текстовый корпус [168], подготовленный для создания БД элементов компиляции и клонирования речи (см. приложение 1). По полученным фонограммам определялись спектральные характеристики изучаемых слогов, по которым затем рассчитывались значения межслоговых контрастов (конечных разностей спектров) на границах различных типов слогов в соответствии со следующей формулой:

где ΔS (i) – усредненная конечная разность спектра по времени;

K – интервал усреднения конечных разностей спектра;

S(i) – i -й спектральный отсчет по времени.

В результате проведенного анализа оказалось, что для большинства типов слогов значения межслоговых контрастов имеют значимую величину, по которой межслоговая граница может быть определена с достаточной для практики точностью. Однако имеется определённая часть типов слогов, для которых, вследствие действия указанных выше 3-х факторов, межслоговая граница определяется не достаточно точно. К таким типам относятся слоги, в которых проявляется значительное ослабление межслогового контраста вследствие следующих причин:

– взаимной ассимиляции в сочетаниях «гласный+гласный» (см. пример на рис 3.8);

– взаимной ассимиляции в сочетаниях «гласный + /J’/» (см. пример на рис 3.9);

– редукции межслогового сонанта /J’/, вплоть до полного исчезновения, находящегося между безударными гласными (см. пример на рис 3.10).

– редукции безударных гласных, вплоть до полного исчезновения, находящихся между согласными, по крайней мере один из которых является глухим согласным (см.рис. 3.11 а,б,в).

При синтезе речи, основанном на компиляции аллослогов, целесообразно ввести определения слоговых комплексов 3-х типов.

1. Слоговой комплекс 1-го типа определяется как открытый слог в соответствии с правилом: – граница слогораздела всегда устанавливается непосредственно после гласного звука.

Примеры:

В слове «физиологии» – «F’, I, Z’, I, A, L, O+,G’, I, I» – будут выделены слоги: <F’I>, <Z’I>, <A>, <LO+>,<G’I>, <I> (здесь и в последующих примерах границы слога помечаются символами «<», «>», ударная гласная – знаком +).

В слове «на рейде» – «N, A, R’, E+, J’, D’, E» – будут выделены слоги: <NA>, <R’E+>, <J’D’E>.

В слове «изучает» – «I, Z, U, CH’, A+, J’, E, T» – будут выделены слоги: <I>, <ZU>, <CH’A+>, <J’ET>.

В слове «чечевицу» – «CH’, E, CH’, E, V’, I+, C, U» – будут выделены слоги <CH’E>, <CH’E>, <V’I+>, <CU>.

В слове «весело» – «V’, E+, S’, E, L, A» – будут выделены слоги <V’E+>, <S’E>, <LA>.

В слове «посадочный» – «P, A, S, A+, D, A, CH’, N, Y, J’» – будут выделены слоги <PA>, <SA+>, <DA>, <CH’NYJ’>.

2. Слоговой комплекс 2-го типа определяется в соответствии с правилом пункта 1 за исключением тех случаев, когда в слоге проявляются описанные выше эффекты ассимиляции гласных и согласных звуков. При этом действуют следующие 2 правила:

– если за гласным, определяющим конец слога, находится гласный, он присоединяется к текущему слогу.

– если за гласным, определяющим конец слога, следует не менее двух согласных, первый из которых – сонант J’, а последующий – любой согласный, то граница определяется после первого из них.

Примеры:

В слове «физиологии» – «F’, I, Z’, I, A, L, O+,G’, I, I» – будут выделены слоги: <F’I>, <Z’IA>, <LO+>,<G’II>.

В слове «на рейде» – «N, A, R’, E+, J’, D, E» – будут выделены слоги: <NA>, <R’E+J’>, <D’E>.

3. Слоговой комплекс 3-го типа определяется в соответствии с правилами пунктов 1, 2 за исключением тех случаев, когда в слоге проявляются описанные выше эффекты редукции согласных и гласных звуков. При этом действуют следующие 2 правила:

– если за гласным, определяющим конец слога, находится последовательность «J’ – безударный гласный», вся последовательность присоединяется к текущему слогу».

– безударный слог, содержащий гласный второй степени редукции, находящихся между согласными, по крайней мере один из которых является глухим согласным, присоединяется к предыдущему или последующему слогу, содержащему гласный меньшей степени»

Примеры:

В слове «изучает» – «I, Z, U, CH’, A+, J’, E, T» – будут выделены слоги: <I>, <ZU>, <CH’A+J’ET>.

В слове «чечевицу» – «CH’, E, CH’, E, V’, I+, C, U» – будут выделены слоги <CH’ECH’E>, <V’I+>, <CU>.

В слове «весело» – «V’, E+, S’, E, L, A» – будут выделены слоги <V’E+S’E>, <LA>.

В слове «посадочный» – «P, A, S, A+, D, A, CH’, N, Y, J’» – будут выделены слоги <PA>, <SA+DA>, <CH’NYJ’>.

На рис. 3.8 – 3.11 межслоговые границы, соответствующие строгому определению открытого слога показаны пунктирными линиями, а сплошными линиями – новые границы в соответствии с описанными выше правилами.

Разметка на слоговые комплексы может проводиться двумя способами: пословно и посинтагменно. В первом случае разметка осуществляется в отдельности для каждого фонетического слова, входящего в синтагму. Во втором случае осуществляется разметка всей последовательности слов в синтагме, рассматриваемой как единый речевой поток. С использованием такой разметки при синтезе речи автоматически учитываются межсловные фонетико-акустические явления, описанные в разделе 3.1.


 

 

 

Добавить комментарий