MSU 32 kbps Audio Codecs Comparison

MSU Graphics & Media Lab (Audio Group)

Руководитель: Александр Жирков
Замеры, обработка, текст: Валентин Вербовой
Консультант: Дмитрий Ватолин


Статистика


  • Тестовых последовательностей - 5.
  • Всего протестировано 6 кодеков с помощью различных метрик.
  • Сравнение результатов автоматического тестированя с оценкой на слух.
  • Отчет о тестировании - 45 страниц в PDF.
MSU 32 kbps Codec Comparison (скачать PDF - 4.4 Mb).
    В планах:
    • Публикация статьи А. Страбыкина и В. Вербового с результатами поностью автоматического тестирования по числовым характерисикам описанных кодеков на различном битрейте.
    • Для получения более адекватной картины аналитическо-визуальной картины аудио-персептивному восприятию, необходимо вычислять более тонкие акустические свойства сигнала. В первую очередь к ним относится оценки гармоничности, шумности, звуковые удары и атаки. Эти свойства сигнала очень существенны для человеческого восприятия, однако качественность их передачи невозможно оценить использую рассматриваемые в этой статье спектральные метрики.

Введение в сравнение кодеков


В интернете присутствует множество статей о сравнении аудио-кодеков. Одни из них хвалят один кодек, другие другой. В данной статье мы постараемся не ставить однозначных оценок качественности того или иного кодека, а дадим некоторые факты для размышления и вытекающие из них следствия. Рассмотрим метрики для сравнения кодеков, их плюсы, минусы и адекватность их работы относительно восприятия на слух.


Особенности автоматических метрик


Почти все автоматические метрики способны корректно работать только с определенным классом кодеков. Так, например, метрики использующие в сравнении сигналов только данные о форме волны, совершенно непригодны при сравнении кодеков не стремящихся сохраняющить точную огибающую волны, а метрики в частотно временном пространстве сигнала, хоть и работают с данными кодеками, тем не менее, мало пригодны для анализа кодеков, учитывающих особенности психоакустики. Таким образом, часто оказывается что перед метрикой встает задача сравнения сигналов, содержащих сходную для человеческого восприятия звуковую информацию, но имеющих различный вид как и формы волны сигнала, так и его спектрограммы.


Сравнения сигналов по форме волны. (горизонтальная ось - время, вертикальная - амплитуда сигнала)

Сравнения по спектрограмме, в частотно-временном пространстве (частота по вертикале, время по горизонтале, цвет отвечает амплитуде сигнала)

Некоторые кодеки изменяют среднюю энергию сигналов, малейшее изменение которой сильно влияет на результат работы подавляющего большинства метрик.
Отдельно нужно отметить, что многие кодеки вносят задержки в сжатые сигналы, в результате чего при восстановлении звуковая волна оказывается сдвинута на некоторое количество временных отсчетов (семплов), и в случае если это не будет замечено метрикой также отрицательно повлияет на адекватность ее работы.


На данном изображении представлены спектры двух сигналов (синяя область + красная = спектр первого сигнала, а синяя + зеленая = спектр второго сигнала). Очивидно, что на одинаковых частотных полосах сигналы имеют разную энергию. (ветикальная ось - амплитуда в децибелах, горизонтальная - частота)

Данные особенности с несохранением общей энергии сигнала скорее является недоработкой в кодеке, чем особенностью его работы с целью увеличение качества сохранения параметров исходного сигнала. Использванные метрики позволили найти несколько ошибок обработки сигнала кодеком.


Download


Связаться с нами можно по адресу: 


Другие материалы


Материалы по видео


Смотрите также материалы:
- По цветовым пространствам
- По JPEG
- По JPEG-2000