Главная > Разное > Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

В. Применения ДПФ и ОДПФ при гомоморфной обработке речевых сигналов.

Гомоморфная обработка речевых сигналов производится так, как было указано в предшествующем разделе: в результате выполнения входной операции осуществляется описанным образом разделение компонент речевого сигнала; каждая из них раздельно обрабатывается линейной частью системы; затем выполняется обратная входной выходная операция и синтезируется обработанный речевой сигнал. На рис. 5.4,г приведен пример разделения, гомоморфной фильтрации и восстановления речевого сигнала [89]. Здесь: 1 — исходный речевой сигнал (отрезок гласной); 2 — комплексный кепстр этого сигнала; 3 — выделенная взвешенная последовательность основного тона; 4 — восстановленный импульс отклик голосового тракта; 5 — речевой сигнал, синтезированный по импульсному отклику 4 и возбуждающему сигналу, оцененному по кенстру 2. Шкала времени для всех этих пяти характеристик приведена в нижней части рисунка.

Разработаны различные варианты системы гомоморфной обработки речевых сигналов с применением ДПФ и ОДПФ. Одна из схем анализа речевых сигналов, описанная в источнике [100], представлена на рис. 5.4, д. По этой схеме производились операции, использовавшиеся для оценки параметров передаточной функции голосового тракта и функции возбуждения. Для рис. 5.4, д приняты следующие обозначения: 1 — анализируемый дискретизированный речевой сигнал; 2 — весовая функция сигнала (здесь это окно Хэмминга, онисанное в гл. III); 3 — весовая функция кепстра; 4 — выходной сигнал системы анализа. Остальные обозначения раскрыты на рисунке. Буквами обозначены характерные точки системы. Характеристики, полученные при гомоморфном анализе речи, подробно рассмотрены в указанном источнике; здесь лишь коротко опишем их. Анализируемый речевой сигнал импульсная характеристика голосового тракта, сигнал возбуждения. В результате выполнения ДПФ от в точке В получается сигнал, представляющий собой произведение ДПФ компонент исходного сигнала. Сигнал в точке С равен сумме логарифмов модулей ДПФ от Далее в результате ОДПФ, взвешивания и следующего ДПФ в точке получается выходной сигнал системы анализа. Фильтрация выполняется в области преобразований Фурье как мультипликативная операция. Так как ОДПФ является линейной операцией, сигнал в точке являющийся кепстром сигнала в точке А, представляет собой сумму кепстров импульсной характеристики голосового тракта и функции возбуждения. С помощью кепстров оказывается возможным отделить информацию об импульсной характеристике голосового тракта от информации о функции возбуждения.

Характеристики, изображенные в верхней части рис. 5.4, е, получены при анализе тоновой речи. Характеристика в левой части рисунка представляет собой нормированный и взвешенный по Хэммингу отрезок входного сигнала, в средней части рисунка изображен кепстр сигнала. В том и другом случае по горизонтальной оси отложено время. Характеристика в правой части рисунка является характеристикой спектра, получаемого на выходе системы анализа. По оси ординат здесь отложены значения логарифма модуля, но горизонтальной оси — значения частоты. Волнистая

линия отражает отвечающую возбуждению быстроизменяющуюся компоненту, а медленно изменяющаяся — составляющую, соответствующую характеристике голосового тракта. Высокий пик кепстра, изображенного в средней части рисунка, отражает период основного тона. Информация о возбуждении устраняется умножением кепстра на весовую функцию с максимумом в начале координат и выполнением ДПФ. При этом получается плавная кривая, которая показана на рассмвтренном рисунке. Анализируя максимумы спектра в точке Е, определяют частоту основных формант исходного сигнала.

Аналогичны характеристики случайных колебаний, возбуждающих глухие звуки, приведенные в нижней части рисунка. Однако трактовка полученных данных здесь уже иная. Кепстр в этом случае не содержит высоких пиков. По этому судят о том, что образуется глухой звук. Быстро изменяющаяся кривая на графике логарифма модуля ДПФ получена как комбинация случайной компоненты, создаваемой источником возбуждения, и медленно изменяющейся компоненты, отражающей характеристику голосового тракта. Частотная характеристика голосового тракта, представленная медленно изменяющейся кривой, получена здесь так же, как и при ранее рассмотренных преобразованиях.

Объединяя описанную систему анализа речевого сигнала с системой синтеза, образуют полную систему кодирования речи. Это так называемый гомоморфный вокодер. В гомоморфном вокодере система синтеза имеет нелинейную часть с экспоненциальной характеристикой, компенсирующую логарифмирование, выполненное при анализе. В системе синтеза имеется блок ОДПФ, компенсирующий ранее выполненное ДПФ. На выходе гомоморфного вокодера получается синтезированная речь.

<< Предыдущий параграф Следующий параграф >>
Оглавление