Главная > Разное > Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Б. Подходы к синтезу речевых сигналов. Модели формирования речи.

Параметры голосового тракта, рассматриваемого как линейная система, и параметры возбуждения, определенные при анализе, служат исходными данными для синтеза речевых сигналов. Используются различные способы моделирования речи. Некоторые из предложенных схем цифрового синтеза речевых сигналов показаны на рис. 5.2 [89,100, 101]. Другие схемы синтеза будут упомянуты в ходе дальнейшего изложения. Ниже приводятся лишь краткие сведения о моделях формирования речевых сигналов, более подробно методы синтеза будут описаны в § 4. Перспективному методу обработки сигналов, пока нами здесь не рассматриваемому, будет посвящен § 5.

На рис. 5.2, а представлена схема модели так называемого форматного синтезатора речевого сигнала, воспроизводящего передаточную функцию голосового тракта. Для рисунка приняты следующие обозначения: 1 и 2 — соответственно звонкая и глухая компоненты синтезируемой речи; 3 — синтезированный речевой сигнал; 4 — фильтр — формирователь возбуждения; 5 — модель голосового тракта; 6 — сопротивление излучения; 7 — задание параметров формант; 8, 9, 10 и 11 — формирователи формант. При синтезе речевого сигнала по этой схеме принимается, что передаточная функция голосового тракта описывается только с учетом ее полюсов и не принимаются во внимание ее нули. Эффекты, определяемые влиянием последних, частично учитываются подстройкой ширины полосы первой форманты.

При другой схеме, здесь нами не рассматриваемой, голосовой тракт представляется в виде набора акустических трубок, параметры которых задаются так, что они отражают параметры реальных процессов распространения волн давления и скорости течения в голосовом тракте.

Рис. 5.2

Одной из основных схем цифрового синтеза речевых сигналов является схема, приведенная на рис. 5.2,6. На этом рисунке: 1 — генератор импульсов; 2 — задание периода основного тона; 3 — генератор случайных сигналов; 4 — переключатель; 5 — задание амплитуды; б - цифровой фильтр с переменными параметрами; 7 — задание коэффициентов цифрового фильтра, отражающих то, что относится к характеристикам голосового тракта: 8 — отсчеты речевого сигнала. Генератор импульсов через заданное число отсчетов выдает импульс (интервал между импульсами является периодом основного тона). Период основного тона задается системой внешней синхронизации. Генератор случайных чисел воспроизводит шумовое возбуждение. Цифровой фильтр имитирует характеристики голосового тракта. Для того чтобы правильно были отражены характеристики голосового тракта, коэффициенты цифрового фильтра должны изменяться в среднем через каждые 0,01 секунды. Изменением амплитуды устанавливается громкость выходного сигнала. На выходе получаются дискретные сигналы, поступающие с частотой, величина которой обратно пропорциональна величине периода основного тона.

На рис. 5.2,в представлена универсальная схема речевого синтеза. От ранее рассмотренных она отличается тем, что синтезируемый речевой сигнал может быть получен при одновременном суммировании тоновой и шумовой составляющих. Формирование последней производится системой, имеющей передаточную функцию с управляемыми полюсом и нулем. Для рассматриваемого рисунка приняты следующие обозначения: 1 — генератор импульсов; 2 — задание периода основного тона; 3 — амплитудный модулятор; 4 — генератор белого шума; 5 — модулятор, регулирующий дисперсию шума; 6 — система разонаторов с управляющими входами 7, 8, и 9; 10 — фильтр с входами 11 и 12 для управления расположением полюса и нуля передаточной функции шумовой составляющей; 13-шумовая составляющая; 14 — тоновая составляющая; 15 - фильтр для компенсации спектра; 16 — синтезируемый речевой сигнал. В усовершенствованном варианте

этой модели предусмотрено использование десяти цифровых фильтров, выходного цифроаналогового преобразователя, и в основной части схемы — использование специальной цепи возбуждения звонких фрикативных звуков.

Последняя при независимом ее применении имеет такой вид, как показано на рис. 5.2, г. Здесь: 1 — генератор импульсов; 2 — задание периода основного тона; 3 — генератор шума; 4 — формирующий фильтр; 5 — формантная цепь; 6 — фрикативная цепь; 7 — резонатор; 8 — задание порогового уровня, вычитаемого из выходного сигнала резонатора; 9 — однополупериодный выпрямитель; 10 — тоновая составляющая звонких фрикативных звуков; 11 — шумовая составляющая звонких фрикативных звуков; 12 — синтезируемый речевой сигнал.

Эффективной моделью синтеза речевых сигналов является такая, в которой синтез производится на основе линейного прогнозирования речи. В соответствующей схеме, изображенной на рис. 5.2,д, обозначения 1, 2, 3 и 4 приняты для тех же элементов схемы, что и на рис. 5.2,6; 5 - адаптивная линейная система прогнозирования; 6 - задание параметров системы прогнозирования; 7 — фильтр нижних частот; 8 — выходной сигнал.

<< Предыдущий параграф Следующий параграф >>
Оглавление