Электронные издания



         

Форматы представления аудиофайлов - часть 2


отнесено к одному из двух соседних уровней, между которыми находится реальное значение сигнала. Сказанное иллюстрируется рис. 3.4
Рис. 03.04.
. Нетрудно сообразить, что при частоте дискретизации в 44100 Гц и квантовании каждого такого уровня 16-двоичными разрядами (4096 уровней квантования) хранение одной минуты цифрового аудио потребует около 5 Мб информационного пространства, а 30 минут стереозвучания - около 300 Мб.

Закодированные описанным способом цифровые аудиоданные характеризуются значительной избыточностью, т. е. они могут быть упакованы, а затем восстановлены без всякой потери качества. Однако применение для сжатия цифрового аудио архиваторов обычного типа, таких как ARJ или ZIP, позволяет сжать исходный файл приблизительно лишь на 20%, т. е. оно неэффективно.

Основная идея сжатия аудиосигнала с потерями - пренебрежение теми фрагментами звука, которые лежат вне пределов восприятия человеческого уха. Первая такая возможность определяется маскирующим эффектом, в соответствии с которым сильные звуки приводят к невосприимчивости уха к слабым в том же самом частотном диапазоне. Поэтому слабые звуки можно кодировать с малым количеством уровней, в результате чего сокращается количество информации, используемое при кодировании звука.

Далее, весь частотный диапазон делится на подполосы, каждая из которых обрабатывается отдельно, причем маскирующий эффект используется как внутри каждой подполосы, так и между ними, т. е. очень мощный звук в одной из подполос приводит к маскированию во всех остальных. Затем используются особенности психоакустической модели человеческого слуха, в соответствии с которой тщательно сохраняются звуки хорошо воспринимаемых частот и удаляются звуки тех частот, которые не воспринимаются.

Для стереозвучания используется дополнительный прием, связанный с тем, что стереоэффект воспринимается человеком только в области средних звуковых частот. Поэтому сигнал низких и высоких частот передается в монофоническом звучании.

Наконец, используются специальные алгоритмы сжатия, основанные на высокой предсказуемости звукового сигнала, т. е.


Содержание  Назад  Вперед