Пользовательский интерфейс системы «Мультифон» (рис. 4.36) включает следующие блоки:
– окно отображения входного текста;
– блок окон отображения результатов просодической и фонетической обработки текста, содержащий список синтагм, где для каждой синтагмы указаны её тип, количество АЕ, просодически обработанный текст – орфографический текст с указанием позиций словесных ударений и границ АЕ, и фонетически обработанный текст – последовательность аллофонов синтагмы;
– функциональные кнопки работы со звуком;
– диалоговые окна настроек параметров системы.
Рис. 4.36. Общий вид пользовательского интерфейса системы синтеза речи
Окно отображения входного текста (рис. 4.37) предназначено для отображения содержимого текстового файла и (или) ввода текстовой информации пользователем.
Рис. 4.37. Окно отображения входного текста
Блок окон отображения результатов просодической и фонетической обработки текста показан на рис. 4.38. Просодическая разметка текста каждой синтагмы включает метки границ синтагм (обозначенные символом «/»), а также словесных ударений: сильного (обозначенного символом «+» после ударного гласного) и слабого (обозначенного символом «=» после ударного гласного). Фонетически обработанный текст является последовательностью аллофонов, в которой сохранены метки границ АЕ, кроме того, установлены метки границ слоговых сегментов (символ «>»).
Рис. 4.38. Блок окон отображения результатов просодической и фонетической обработки текста
Функциональные кнопки работы со звуком (рис. 4.39) предназначены для воспроизведения синтезированного речевого сигнала и включают функции проигрывания звука, паузы и остановки.
Рис. 4.39. Функциональные кнопки работы со звуком
Диалоговое окно настроек системы (рис. 4.40) включает выбор фонетико-акустической БД (“Voice base”), просодической БД (“Prosody style”), указание диапазона изменения частоты основного тона (“Frequency range”), опции использования интонационных, ритмических и динамических портретов при синтезе просодических параметров речевого сигнала (“Use frequency”, “Use rhythm”, “Use energy”), а также указание значений темпа речи (“Tempo”) и уровня громкости (“Volume”).
Рис. 4.40. Диалоговое окно настроек системы