Текстовый процессор (рис. 4.2) включает два основных блока, которые поддерживаются соответствующими базами данных, словарями и правилами.

Он выполняет предварительную обработку входного текста, а также морфологическую и акцентную маркировку слов текста.

Структура текстового процессора

Рис. 4.2. Структура текстового процессора

На вход системы синтеза речи могут поступать тексты, взятые из разных источников и зачастую содержащие графические объекты, ссылки, числовые значения, формулы, а также другие объекты и символы, непригодные для синтеза речи. Основной задачей первого блока - блока предварительной обработки - является нормализация текста, т.е. приведение его к такому виду, когда текст состоит из последовательности слов русского языка. Следующий блок – блок морфо-фонетической маркировки – осуществляют маркировку каждого слова входного текста, необходимую для адекватного синтеза звуков и интонации речи. Для такой маркировки используется грамматический словарь, в котором каждое слово снабжено пометой позиции ударения.


 

 

 

Добавить комментарий