Информационные технологии

Системы кодирования аудио- и видеоинформации

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий видеоадаптер, звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить аудио- и видеоинформацию. Развитие сетевых технологий передачи мультимедийной информации предъявляет жесткие требования к объему передаваемой информации, с максимальным сохранением ее качества.

Алгоритм компрессии видео в основном основывается на следующем принципе, при кодировании исходного изображения кодек ищет и сохраняет ключевые кадры, на которых происходит смена сюжета. А вместо сохранения промежуточных кадров прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация сжимается по алгоритмам компрессии, аналогичным тем, что применяются в архиваторах.

Для кодирования звукового сопровождения может использоваться несколько методов. Основная идея сжатия, по крайней мере, в MPEG Layer 3, построена на упрощении формы звукового сигнала, которое производится с учетом свойств человеческого слуха и практически не влияет на качество закодированного звука.

В MPEG-2 предусмотрено использование не одного (как в MPEG-1), а нескольких звуковых сигналов. Благодаря этому возможно создание эффектов объемного звучания, а также многоязычного сопровождения фильмов.

Аббревиатура MPEG (Motion Picture Expert Group) расшифровывается как «Международная комиссия по выработке стандартов цифрового сжатия, хранения и передачи видеоинформации». Алгоритмы кодирования (сжатия) цифрового сигнала, – созданные по стандартам MPEG, основаны на внутрикадровой компрессии видеоизображения. Коэффициент сжатия при этом колеблется в пределах от 100/1 до 200/1.

MJPEG, MPEG-1 (его частный случай – аудио MPEG-1 Layer 1, 2, 3 = MPG, MP2, MP3), MPEG-2 (вещательный стандарт и DVD), MPEG-3 (HDTV = High Definition TV), MPEG-4 (WMA, ASF, DivX).

MP3 (MPEG 1/2/2.5 Layer 3) – самый известный цифровой формат на сегодняшний день. Он создавался с целью упростить и удешевить пересылку музыкальных файлов большого формата по Интернету. Использует специальный математический алгоритм сжатия, который позволяет убирать неразличимые человеческим ухом звуки из записи. Благодаря этому объем записи значительно сокращается по сравнению с традиционными аналоговыми методами записи музыки, например Audio CD.

Соотношение объем / качество определяется степенью сжатия (также называемое битрейтом) которая может меняться от 8 до 320 кбит/с. Т.е. битрейт – показатель количества информации, которым кодируется одна секунда звучания. Самые популярные битрейты – 128 и 256 кбит/с.

MP3-файлы могут содержать имя исполнителя, название трека и альбома, год его выхода, и т.д. Совокупность этих данных называется тегами ID3.

OGG (Ogg Vorbis) – набирающий все большую популярность новый стандарт цифрового аудио, схож по принципу действия с известными форматами, однако использует оригинальный математический алгоритм.

Принцип работы Ogg Vorbis позволяет осуществлять сжатие данных на битрейтах от 8 до 512 кбит/с, а также кодирование с переменным битрейтом VBR (Variable Bit Rate). В случае данного вида сжатия кодирующая программа разделяет файл на фрагменты разной спектральной насыщенности и кодирует их с подходящим битрейтом.

Ogg Vorbis – свободный и полностью открытый формат цифровой звукозаписи. Использование этого формата не требует никаких отчислений ни разработчикам, ни поставщикам музыки, а все исходные коды программ общедоступны.

ASF (Active Streaming Format) – формат файлов, предложенный компанией Microsoft. Он призван обеспечить доставку и синхронизированное воспроизведение различных типов мультимедийных файлов, в том числе видео, анимации, графики, аудио, MIDI-музыки и текста. По утверждениям Microsoft формат ASF способен заменить ряд традиционных стандартов аудио и видео файлов, таких как AVI той же Microsoft, QuickTime компании Apple, а также общеупотребительные MPEG-1 и MPEG-2.

WMA (Windows Media Audio) – еще один формат сжатия аудио сигнала, предложенный Microsoft, представляет собой аналог MP3, но с возможностью защиты авторских прав. В теории файлы, записанные в этом формате, имеют защиту от несанкционированного копирования и обмена.

DivX – технология сжатия видеоданных формата DVD, позволяет 3–4 Гб данных превратить примерно в 600 Мб без потери качества. Основу DivX составляет видеотехнология компании Microsoft – MPEG-4 и технология потокового аудио MP3. В сравнении с другими технологиями видеокомпрессии DivX демонстрирует целый ряд заметных преимуществ в качестве и объеме сжимаемой информации.

XviD – технология сжатия видеоданных, схожая с технологией DivX, но отличается высокой четкостью при динамических сценах. Кодек XviD постоянно обновляется. Это результат того, что его код является открытым и любой желающий может принять участие в доработке программы. Последние версии (альфа и бета) уже совместимы с MPEG-4 (фильмы, сжатые при помощи кодека XviD, будут просматриваться декодером DivX).

AVI (Audio Video Interleaved – «перемежающееся аудио / видео») – стандарт системы Windows для сохранения звуковых и видеоданных. Порции видеоданных следуют за порциями аудиоданных в строгом порядке. Особенность формата – отсутствие жесткой системы кодирования данных: аудио и видео могут кодироваться совершенно разными кодеками, что позволяет оптимизировать сжатие данных.

Многообразие существующих в настоящее время стандартов кодирования и современные технологии их реализации позволяют передавать мультимедийную информацию по сети без существенных потерь.

А.В. Иванова