Данная глава посвящена описанию экспериментальных исследований, направленных на выявление особенностей реализации фонетико-акустических и просодических явлений в естественной речи различных дикторов.

Результаты проведённых исследований используются при разработке алгоритмических основ синтеза и клонирования речи путём создания общеязыковых и индивидуализированных баз данных.

В первом разделе приводятся методика и результаты сравнительных исследований внутрисловных и межсловных явлений в естественной русской речи на фонетическом и акустическом уровнях [150]. Полученные результаты позволили сформулировать алгоритмы преобразования «буква-фонема», «фонема-аллофон» и обосновать выбор расширенного набора аллофонов и мультифонов, используемых в процессе синтеза и клонирования фонетико-акустических явлений [151] в речевом потоке.

Во втором разделе приводятся результаты исследования фонетико-акустических особенностей сегментации последовательности слов на слоги [152, 153]. Предлагаются три различных способа сегментации речи на слоговые комплексы и обосновывается целесообразность их совместного использования в процессах синтеза и клонирования речи.

В третьем разделе описана методика анализа межъязыковых и междикторских различий интонации речи [154]. Обсуждаются особенности реализации интонационных контуров завершённости и незавершённости на примере русского и польского языков, показаны их межъязыковые и междикторские различия.

В четвёртом разделе описана методика исследования особенностей синтагматического членения речи на примере фонограмм речи трёх профессиональных дикторов [155]. Получены количественные оценки [156] числа акцентных единиц в синтагмах, длительности межсинтагменных пауз, вероятности сочетаемости синтагм и др. Проведенное исследование позволило сформулировать алгоритмические основы технологии клонирования синтагматических характеристик речи [157] и применения результатов при синтезе персонализированной речи по тексту [158, 159].


 

 

 

Добавить комментарий