В основу классификации речевых сегментов положено понятие аллофона – позиционного и комбинаторного оттенка фонемы.
Аллофонная разметка речевого корпуса может осуществляется как «вручную», так и автоматически в процессе ДП-сопоставления синтезированного и естественного речевых сигналов (см. раздел 5.2.3). На основе аллофонной разметки создются следующие группы фонетических сегментов: аллофоны – {Sa}, диаллофоны – {Sda}, аллослоги – {Sas}.
Разметка корпуса на диаллофоны осуществляется посинтагменно, т.е. создаваемые диаллофонные сегменты могут находиться как внутри фонетического слова, так и на границе фонетических слов. Согласно алгоритмам преобразования фонема-аллофон, описанным в разделе 4.3.2, внутрисловное и межсловное различие существенно для диаллофонов типа ГГ и СГ (где Г обозначает гласный, С - согласный). Это различие в местоположении диаллофонов однозначно определяется позиционными индексами аллофонов.
Особенности процедуры разметки речевого корпуса на слоговые комплексы, учитывающие фонетическую и артикуляторно-акустическую природу слога, описаны ранее в разделе 3.2, где дано определение слоговых комплексов трёх типов. Трудность вычленения в речевом потоке (при ручной или автоматической разметке корпуса) того или иного типа слоговых комплексов различна. Этот факт наглядно представлен на примере, приведенном в таблице 5.1. Из приводимого примера видно также, что одновременно с уменьшением трудности сегментации, возрастает количество фонетических элементов в слоге.
Разметка на слоговые комплексы проводится двумя способами: пословно и посинтагменно. В первом случае разметка осуществляется независимо для каждого отдельного фонетического слова, входящего в синтагму. Во втором случае последовательность слов в синтагме рассматривается как единый речевой поток с учётом межсловных фонетико-акустический явлений, исследованных в разделе 3.1. Очевидно, что поскольку на стыках слов могут встретиться любые сочетания фонем, невозможно создать речевой корпус разумного размера, в котором бы реализовались все сочетания. Целесообразно поэтому при использовании ограниченного по объёму речевого корпуса воспользоваться обоими способами его разметки.
В общем случае каждая речевая синтагма может быть размечена на аллослоги различного типа шестью способами. Пример такого рода разметки синтагмы «Олимпийские чемпионы вернулись на родину» приведен в таблице 5.1, где границы аллослогов помечены значками «<», «>».
Таблица 5.1
При создании БД просодических элементов компиляции аллофонные сегменты группируются в сегменты более высокого уровня, чем диаллофоны и аллослоги, а именно: в сегменты, соответствующие АЕ – акцентным единицам и ЭАЕ – элементам АЕ. Правила объединения аллофонов в АЕ и ЭАЕ описаны в разделе 4.4. Примеры разметки синтагмы на просодические сегменты АЕ (ограничены знаками - | ) и ЭАЕ (ограничены знакaми - / ) представлены в двух нижних строках таблицы 5.1.