Пользовательский интерфейс системы «Мультифон» (рис. 4.36) включает следующие блоки:

– окно отображения входного текста;

– блок окон отображения результатов просодической и фонетической обработки текста, содержащий список синтагм, где для каждой синтагмы указаны её тип, количество АЕ, просодически обработанный текст – орфографический текст с указанием позиций словесных ударений и границ АЕ, и фонетически обработанный текст – последовательность аллофонов синтагмы;

– функциональные кнопки работы со звуком;

– диалоговые окна настроек параметров системы.

Общий вид пользовательского интерфейса системы синтеза речи 

Рис. 4.36. Общий вид пользовательского интерфейса системы синтеза речи

Окно отображения входного текста (рис. 4.37) предназначено для отображения содержимого текстового файла и (или) ввода текстовой информации пользователем.

Окно отображения входного текста 

Рис. 4.37. Окно отображения входного текста

Блок окон отображения результатов просодической и фонетической обработки текста показан на рис. 4.38. Просодическая разметка текста каждой синтагмы включает метки границ синтагм (обозначенные символом «/»), а также словесных ударений: сильного (обозначенного символом «+» после ударного гласного) и слабого (обозначенного символом «=» после ударного гласного). Фонетически обработанный текст является последовательностью аллофонов, в которой сохранены метки границ АЕ, кроме того, установлены метки границ слоговых сегментов (символ «>»).

 Блок окон отображения результатов просодической и фонетической обработки текста

Рис. 4.38. Блок окон отображения результатов просодической и фонетической обработки текста

Функциональные кнопки работы со звуком (рис. 4.39) предназначены для воспроизведения синтезированного речевого сигнала и включают функции проигрывания звука, паузы и остановки.

Функциональные кнопки работы со звуком
Рис. 4.39. Функциональные кнопки работы со звуком

Диалоговое окно настроек системы (рис. 4.40) включает выбор фонетико-акустической БД (“Voice base”), просодической БД (“Prosody style”), указание диапазона изменения частоты основного тона (“Frequency range”), опции использования интонационных, ритмических и динамических портретов при синтезе просодических параметров речевого сигнала (“Use frequency”, “Use rhythm”, “Use energy”), а также указание значений темпа речи (“Tempo”) и уровня громкости (“Volume”).

 Диалоговое окно настроек системы

Рис. 4.40. Диалоговое окно настроек системы


 

 

 

Добавить комментарий