ВОССТАНОВЛЕНИЕ ГАРМОНИЧЕСКОЙ СТРУКТУРЫ ИСКАЖЕННЫХ РЕЧЕВЫХ ВОКАЛИЗМОВ ПОСРЕДСТВОМ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ ДИНАМИЧЕСКИХ СПЕКТРОГРАММ

Виктор Михайлович Алюшин, Сергей Владимирович Дворянкин

Аннотация


В данной работе представлен метод реконструкции гармонической структуры зашумленного речевого сигнала, основанный на определении частоты основного тона и кратных ему гармоник на вокализованных участках изображений спектрограмм. Рассмотрен алгоритм уточнения частоты основного тона по вершинам парабол в окрестностях локальных максимумов на текущих срезах спектральных разверток. Полученные результаты могут быть использованы при решении задач восстановления разборчивости речи из шумов и помех, синтеза и кодирования звукового сигнала, а также автоматической идентификации диктора.

Ключевые слова


речь; звуковой сигнал; помехи; шум; синтез; кодирование; основной тон; шумоочистка; спектральные развертки

Полный текст:

PDF

Литература


1 Максимов Е. М., Ромашкин Ю. Н., Лопатина С. А. Актуальные задачи речевой акустики // Речевые технологии. 2008. № 2. С. 66-70.

2 Хитров М. В. Распознавание русской речи: состояние и перспективы // Речевые технологии. 2008. № 1. С. 83-87.

3 Михайлов В. Г. Из истории исследований преобразования речи // Речевые технологии. 2008. № 1. С. 93-113.

4 Колоколов А. С., Павлова М. И. Способ обработки речевого сигнала в частотной области. Патент РФ № 2454735. 2006.

5 Пэй У. Частотный фильтр и способ фильтрации в частотной области. Патент РФ № 2308153. 2006.

6 Ронгшан Юй Браун, Филлип С. Повышение разборчивости речи с помощью четкости голоса. Патент РФ № 2469423, 2008.

7 Азаров И. С., Петровский А. А. Вычисление мгновенных гармонических параметров речевого сигнала // Речевые технологии. 2008. № 1. С. 67-77.

8 Жиляков Е. Г., Курлов А. В., Эсауленко А. В., Котович Н. В. Об одном методе очистки речи от шумов на основе применения фильтрующей субполосной матрицы // Доклады 11-й Международной конференции DSPA-2011. Обработка сигналов в системах телекоммуникаций. С. 197- 200. http://www.autex.spb.ru/dspa2011.php http://www.autex.spb.ru/dspa/dspa2011-3-2.doc

9 Рабинер Л. Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ. / Под ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь, 1981. - 496 с.

10 Дворянкин С. В. Цифровая шумоочистка аудиоинформации / Под ред. д.т.н., профессора А. В. Петракова. М.: ИП РадиоСофт, 2011. - 208 с.

11 Калинцев Ю. К. Разборчивость речи в цифровых вокодерах. М.: Радио и связь, 1991. - 218 с.

12 Кузнецов В. Б., Чучупал В. Я. Классификация звуков русской речи с помощью бинарных решающих деревьев // Речевые технологии. 2008. № 2. С. 24-35.

13 Женило В. Р. Компьютерная фоноскопия. М.: Изд-во Акад. МВД России, 1995. - 208 c.


Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.