Для создания речевого материала нескольким русскоязычным и польск язычным дикторам предлагалось начитать тексты приблизительно одинакового научного содержания.
Объём текстов на каждом из языков составлял около 00 слов. Ниже приведены фрагменты используемых текстов.
Фрагмент русскоязычного текста:
«Спектр результирующего речевого сигнала ожет быть представлен в виде произведения спектра источника вука на передаточные функции речевого тракта и каналов передачи звуко ых сигналов, плюс – спектры различного рода сигналов акуст ческих помех».
Фрагмент польскоязычного текста:
«Widmo sygnał mowy obliczamy przez pomnożenie aparatu wokalnego, źródła mowy, tylu mowy, mnożymy to tez razy mikrofon, czyli jakie występują tam w paczenia i dodajemy do tego wszystkiego lokalną akustykę».
Полученные результате записи звуковые файлы в формате WAVE PCM подвергали ь дальнейшему анализу.
Этапы исследования интонационных характеристик для создания набора мелодических портретов показаны на рис. 3.12.
Прежде всего, речевой материал прослушивается, из него удаляются неинформативные участки: шумы, вдохи, «лишние» звуки (например, «э-э-э»). Затем каждая фраза фонограммы и соответствующий ей текст предложения стенограммы обрабатывается опытными экспертами-фонетистами: разбивается на синтагмы, акцентные единицы и определяется, к какому интонационному типу принадлежит синтагма: завершенному или незавершенному. В фонограмме границы синтагм отмечаются регионами, в стенограмме – знаком «//», границы АЕ отмечаются, соответственно, маркерами и знаком «/», интонационный тип завершенности обозначается точкой, незавершенности - запятой. В стенограмме, кроме того, для каждого слова АЕ указываются сильное (обозначается знаком /+/) или слабое (обозначается знаком / = /) ударения.
Рис.3.12. Процедура создания мелодических портретов
Фрагменты обработанных таким образом стенограмм для русского и польского языков показаны в табл. 3.1 и 3.2 соответственно.
Таблица 3.1
Фрагмент русского текста с делением на синтагмы, АЕ, с указанием интонационного типа
Таблица 3.2
Фрагмент польского текста с делением на синтагмы, АЕ, с указанием интонационного типа
Следующий этап обработки – получение интонационных контуров синтагм – значений частоты основного тона F0 на вокализованных участках речи – может осуществляться с использованием программного пакета PRAAT [165]. Каждая АЕ синтагмы предварительно делится на ядро – ударный гласный, предъядро – участок АЕ перед ударным гласным, и заядро - участок АЕ после ударного гласного. На рис. 3.13, 3.14 приведены сравнительные примеры мелодических контуров (значений F0) 2-хакцентных синтагм с интонацией незавершённости (рис. 3.13) и завершённости (рис. 3.14) для русского (рис. 3.13а, рис. 3.14а) и польского (рис. 3.13б, рис. 3.14б) языков. На рисунках указаны границы АЕ, а также области предъядра, ядра и заядра каждой АЕ.
Рис. 3.13. Примеры интонационных контуров незавершённости для синтагм:
а) «в виде мультипликативной», б) «z pewnym dialektem»
Рис. 3.14. Примеры интонационных контуров завершённости для синтагм:
а) «слайд один», б) «pod pewnym kierunkiem»
Согласно интонационной ПАЕ-модели, мелодический портрет представляется нормированными значениями F0 на участках предъядра, ядра и заядра каждой АЕ синтагмы.
Процесс создания мелодического портрета синтагмы показан на рис. 3.15 на примере фразы “которые могут быть представлены”, произнесённой мужским голосом. Данная фраза является синтагмой с интонацией незавершённости, состоящей из 3 АЕ.
Рис. 3.15. Процесс создания мелодического портрета синтагмы
а) спектрограмма и интонограмма речевого сигнала, границы АЕ и участков предъядра, ядра, заядра; б) экстраполяция контура F0; в) нормированный «портрет» контура F0
Для речевого сигнала вычисляются значения F0 на всех вокализованных участках (рис. 2.15а), осуществляется разметка границ АЕ и границ областей предъядра, ядра, заядра для каждой АЕ, а также интерполяция значений на невокализованные участки (рис. 2.15б), и, наконец, осуществляется нормализация каждой из областей по длительности и частоте.
Нормализация по длительности осуществляется уравниванием длительности областей предъядра, ядра и заядра. Для нормализации по частоте определяются минимальное – F0 min – и максимальное – F0 max – значения на всей исследуемой фонограмме. Нормированное значение F0 вычисляется согласно формуле:
В данном примере F0 min и F0 max были определены равными, соответственно, 70 Гц и 180 Гц.
Результататом описанных операций является создание последовательности нормированных мелодических портретов АЕ, составляющих синтагму (см. рис. 2.15в).