Компьютерный синтез и клонирование речи

От голоса робота - к персональному клону голоса человека

Фонетико-акустические основы синтеза речи по тексту

1.1.Общие сведения о языке и речи

1.2. Система фонем русского языка

1.3. Оттенки фонем и система аллофонов русской речи

1.4. Особенности преобразования «буква-фонема» (ПБФ) для русского языка  

1.5. Просодические характеристики русской речи

1.6. Акустические характеристики речи

1.7. Информационная и модуляционная структура речевого сигнала

 

Методы синтеза фонетико-акустических характеристик речи

2.1. Методы персонализированного синтеза речевого сигнала

2.1.1. Основные характеристики артикуляторного метода синтеза речи по тексту

2.1.2. Основные характеристики формантного метода синтеза речи по тексту

2.1.3. Основные характеристики компиляционного метода синтеза речи по тексту

2.1.4. Основные характеристики корпусного метода синтеза речи по тексту

2.1.5. Выбор метода синтеза речи по тексту для передачи индивидуальности голоса и манеры чтения

 

2.2. Методы моделирования просодических характеристик речи

2.2.1. Автосегментная просодическая модель

2.2.2. Просодическая модель IPO

2.2.3. Суперпозиционная просодическая модель

2.2.4. Непрерывная параметрическая просодическая модель

2.2.5. Просодическая модель портретов акцентных единиц

 

2.3. Методы выбора базовых речевых единиц для синтеза речи 

2.4. Методы формирования речевых и текстовых корпусов для создания индивидуализированных речевых баз данных 

2.5. Методы сегментации и маркировки естественного речевого сигнала

 

Глава 3. Экспериментальные исследования фонетико- акустических и просодических характеристик речи

3.1. Исследование внутрисловных и межсловных фонетико- акустических явлений в русской речи

3.1.1. Методика эксперимента

3.1.2. Гласные в сочетаниях «гласная-гласная»

3.1.3 Гласные в сочетаниях «согласная – гласная», «гласная - согласная»

3.1.4 Акустические характеристики согласных

 

3.2. Исследование фонетико-акустических особенностей сегментации последовательности слов на слоги 

3.3. Исследование межъязыковых и междикторских различий просодических характеристик речи

3.3.1. Методика создания мелодических портретов акцентных единиц

3.3.2. Результаты исследования межъязыковых различий

3.3.3. Результаты исследования междикторских различий

 

3.4. Исследование персональных особенностей синтагматического членения речи

3.4.1. Методика эксперимента

3.4.2. Статистические характеристики синтагматического членения

3.4.4. Обсуждение результатов эксперимента 

 

Глава 4 Компьютерная модель мультиволнового синтеза речи по тексту

4.1. Структура синтезатора речи по тексту 

4.2. Текстовый процессор 

4.2.1. Блок предварительной обработки

4.2.2. Блок морфологической и акцентной маркировки слов

 

4.3. Просодический процессор

4.3.1. Блок членения текста на предложения, пунктационные и лексические синтагмы

4.3.2. Блок членения ПС и ЛС на синтаксические синтагмы и их разметка на акцентные единицы

4.3.3. Блок маркировки интонационного типа синтагм 

 

4.4. Фонетический процессор

4.4.1. Блок преобразования слов – фонетических исключений

4.4.2. Блок преобразования буква-фонема

4.4.3. Блок преобразования фонема-аллофон

 

4.5. Акустический процессор

4.5.1. Блок синтеза акустико-просодических характеристик речевого сигнала

4.5.2. Блок синтеза акустико-фонетических характеристик речевого сигнала

4.5.3. Алгоритм просодической обработки речевого сигнала в акустическом процессоре

 

4.6. Программная реализация системы синтеза речи "Мультифон"

4.6.1. Функциональная схема системы

4.6.2. Пользовательский интерфейс системы «Мультифон» 

4.6.3. Оценка разборчивости синтезированной речи

 

Глава 5. Компьютерное клонирование индивидуальных характеристик речи

5.1. Факторы вариативности речевого сигнала

 

5.2. Основные этапы компьютерной технологии клонирования фонетико-акустических характеристик речи

5.2.1. Выбор и подготовка текстовых и речевых корпусов

5.2.2. Разметка речевого корпуса на фонетические и просодические сегменты

5.2.3. Автоматическая сегментация и маркировка речевого сигнала

5.2.4 Создание оптимального набора элементов компиляции

 

5.3. Алгоритмы автоматического создания БД фонетических элементов компиляции

5.3.1 Алгоритмы «отсекающего отбора» речевых сегментов

5.3.2. «Селекция» речевых сегментов

5.3.3 «Диагностика» и «коррекция» сегментов

5.3.4 «Размножение» элементов компиляции

 

5.4. Компьютерная система клонирования фонетико- акустических характеристик речи – «ФоноКлонатор»

5.4.1. Функциональная схема системы

5.4.2. Пользовательский интерфейс системы «ФоноКлонатор»

5.4.3. Результаты практического использования системы «ФоноКлонатор»

 

5.5. Компьютерная система клонирования просодических характеристик речи – «ИнтоКлонатор»

5.5.1. Функциональная схема и алгоритмы работы системы

5.5.2. Пользовательский интерфейс системы «ИнтоКлонатор»

5.5.3. Результаты практического использования системы «ИнтоКлонатор» 

 

5.6. Оценка правдоподобия синтезированного речевого клона


 

 

 

Добавить комментарий