Lossy vs Lossless: принципы сжатия аудиофайлов

В недавней статье о беспроводном звуке мы коснулись темы кодирования цифрового аудиопотока с потерями и без потерь. Сегодня мы остановимся на этой теме поподробнее. 

Итак, у нас есть аналоговый звук, который при цифровой звукозаписи и/или для последующего хранения на компьютере и других электронных носителях информации оцифровывается в аудиофайл — электронный документ, состоящий из информации об амплитуде и частоте звука, с помощью которой впоследствии возможно обратное цифро-аналоговое преобразование и воспроизведение содержащегося в файле звука.

Формат звука зависит от способа квантования аналогово-цифровым преобразователем (АЦП), распространение получили два вида квантования:

  • импульсно-кодовая модуляция (PCM, большинство форматов от MP3 до FLAC)

  • сигма-дельта-модуляция (Delta-sigma, формат DSD)

Основными параметрами цифрового звука являются разрядность квантования (бит) и частота дискретизации (кГц/МГц), которые указывают для различных устройств записи и воспроизведения как формат представления цифрового звука, например, 24 бита / 192 кГц.

Существуют аудиоформаты без сжатия (например, WAV, AIFF), но для более удобного хранения/распространения, часто используются кодеки, которые сжимают аудиоданные. Сжатие данных (data compression) производится с целью уменьшения занимаемого файлами объема и основано на устранении избыточности, содержащейся в исходных данных. Есть два типа форматов со сжатием данных:

  • Lossless — сжатие без потерь (FLAC, ALAC, APE)

  • Lossy — сжатие с потерями (MP3, Ogg, AAC)

Сжатие без потерь позволяет сделать полное восстановление исходных данных, сжатие с потерями позволяет восстановить данные с определенными искажениями. 

Сжатие с потерями обладает значительно большей, чем сжатие без потерь, эффективностью и применяется, когда полное соответствие исходных и восстановленных данных не требуется, а сокращение объема является приоритетным.

Кодированный с потерями файл очень сильно отличаться от оригинала на уровне побайтного сравнения, но для неподготовленного человеческого слуха разница может быть не такой сильной, а иногда даже незаметной. Это достигается за счет того, что методы сжатия с потерями фокусируются на физических особенностях органов чувств человека, например, психоакустическая модель, которая определяет то, как сильно звук может быть сжат без ухудшения воспринимаемого человеком качества. Недостатки, причиненные сжатием с потерями, которые заметны для человеческого слуха, считаются артефактами сжатия. 

Спектрограмма MP3 (слева) и оригинального файла (справа)

Примеры распространенных Lossy-форматов:

  • MP3 — определен спецификацией MPEG-1, пожалуй, все еще самый распространенный формат

  • Ogg Vorbis — отличается отсутствием патентных ограничений и более высоким качеством при одинаковом с MP3 битрейтом

  • AAC, AAC+ — существует в нескольких вариантах, определённых спецификациями MPEG-2 и MPEG-4, получил широкое распространение вместе с техникой от Apple

  • eAAC+ — формат, предлагаемый Sony, как альтернатива AAC и AAC+

  • WMA — формат, разработанный Microsoft

  • Dolby AC-3

  • DTS

Ранее аудиоформаты сжатия без потерь чаще использовались для архивного хранения данных и в случаях, когда искажения недопустимы или нежелательны, а большинство обычных слушателей использовали музыку в сжатых с потерями форматах. Но объемы памяти электронных устройств неуклонно растут, а цены на нее снижаются, поэтому все больше людей переходят на прослушивание Lossless форматов, позволяющих воспринимать музыку в первозданном виде. Кроме того, поддержка Lossless форматов сегодня появилась практически на всех потребительских устройствах, даже отдельные стриминговые сервисы начинают передавать звук в качестве без потерь, например, представленный в России Deezer или отсутствующий у нас официально Tidal. 

Примеры распространенных Lossless-форматов:

  • Free Lossless Audio Codec — FLAC — самый распространенный свободный формат

  • ALAC — Apple Lossless Audio Codec — вариант от Apple

  • Audio Lossless Coding — также известен как MPEG-4 ALS

  • Direct Stream Transfer — DST

  • Dolby TrueHD

  • DTS-HD Master Audio

  • Meridian Lossless Packing — MLP

  • Monkey's Audio — Monkey’s Audio APE

  • WavPack — WavPack lossless

  • WMA Lossless — Windows Media Lossless

Нужен ли вам Lossless или можно продолжать пользоваться классическими MP3 или AAC? Здесь все не так однозначно. Конечное качество сжатого с потерями файла будет зависеть и от битрейта, и от используемого алгоритма/кодека, тогда как Lossless, вне зависимости от формата, будет соответствовать оригиналу. Ну и, конечно, чем лучше техника, на которой воспроизводится музыка, тем очевиднее будет преимущество Lossless над Lossy. А учитывая, что объемы памяти продолжают расти, имеет ли смысл экономить на качестве?




Комментарии (4):
Спасибо за краткое и понятное разъяснение. Возможно, в виде вставок, можно было бы пояснить "битность и частоту" (или дать ссылку на Ваши статьи об этом, т.к. некоторые (ребёнку объяснял отдельно) не сразу понимают о чём речь.
Ещё раз - спасибо!
ОтветитьЦитировать
Д
Цитата
Николай пишет:
Спасибо за краткое и понятное разъяснение. Возможно, в виде вставок, можно было бы пояснить "битность и частоту" (или дать ссылку на Ваши статьи об этом, т.к. некоторые (ребёнку объяснял отдельно) не сразу понимают о чём речь.
Ещё раз - спасибо!
Здравствуйте, мы стараемся объяснять сложные вещи простым языком. В блоге есть более углублённый материал: https://doctorhead.ru/blog/dsd-protiv-pcm-kakoy-format-luchshe-v-2022-godu/  
ОтветитьЦитировать
О DSD Написано очень много. Для понимания разницы нужно и хорошее оборудование и записи, которые изначально записаны в этом формате. Иначе различия будут в нюансах.
ОтветитьЦитировать
Расскажите, пожалуйста, о DSD и о его особенностях. Послушал, сравнил с FLAC, не понял чем лучше, а весит больше.  
ОтветитьЦитировать
Текст сообщения*
Перетащите файлы
Ничего не найдено