Vbr 2 прохода что это
H 1pass vs 2pass (and more) в черновиках Из песочницы
Допустим, вы решили закодировать своё хоум видео (не от алкоголизма, а в h264). И энкодер просит выбрать количество пассов (pass). Давайте разберёмся, что эти пассы из себя представляют.
Немного о терминологии, необходимой для понимания темы. Пасс — в данном случае «проход». Энкодер спрашивает, за сколько проходов видео будет кодироваться. Битрейт — количество памяти, затраченной для хранения секунды видео. CBR (constant bitrate) — постоянный битрейт. VBR (variable bitrate) — переменный битрейт.
1 pass — видео кодируется на «лету». Быстро и сердито. Плюсы режима: это единственный возможный вариант кодирования live-стриминга. Без затрат времени на дополнительный анализ файла. В этом режиме энкодер тратит одинаковое количество бит на хранение каждой секунды видео.
2 pass — кодирование производится в два этапа. Первый проход — анализирует видео. Миссия первопроходца — оставить заметки в своем бортовом журнале, прикинуть, сколько бит имеет смысл потратить на каждый кадр. Например, для качественного хранения статичного кадра с «Полностью Чёрным Квадратом» Казимира Малевича необходимо меньше бит, чем для пёстрого, динамичного кадра с нового клипа PSY. Целью первопроходимца как раз и является задача обнаружить и порешать. А уже второй проход, следуя подсказкам первого, делает конечный файл. Логично, что этот режим эффективен только при VBR. Время на кодировку видео при этом режиме увеличивается вдвое.
3 and more pass — все то же, что и при двухпроходном режиме, только каждый дополнительный проход производит более тщательный анализ. А последний проход всегда отвечает за производство файла.
Поговаривают, что один проход вытягивает лишь 60% потенциального качества результирующего видео. При двух проходах можно вытянуть 90% потенциального качества, а при трех — 98%. Я лично не придумал как проверить эти цифры. На самом деле, «набитый глаз» без труда заметит превосходство двухпроходного кодирования над однопроходным при аналогичном битрейте.
Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).
Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).
Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).
Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).
Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).
Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).
Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.
Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
Несжатый (RAW) формат данных
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…
Оцифровка старых видеокассет. Моя методика.
Итак, после ряда экспериментов и штудирования Интернета, я определился с методикой оцифровки своих видеокассет. Опишу её здесь. Может, кому-нибудь ещё пригодится. Не знаю, будет ли кто читать всю эту муть, но мне бы хотелось. Я старался :-)))
Цепь оцифровки складывается из нескольких звеньев (этапов), которые я здесь опишу.
Звено 1. Видеомагнитофон
Итак, самым важным звеном в цепи оцифровки видеокассет является видеомагнитофон. От того, насколько качественно он сможет читать аналоговую запись, в большей степени будет зависеть конечный результат оцифровки. Видеомагнитофон вносит в качество оцифровки основной вклад. Всё остальное — вторично.
У меня в кладовке скопилось 5 видаков. Два моих (нижние), и ещё три мне относительно недавно отдали:
Моя четырёхголовочная Sony SLV-436EE и двухголовочный Panasonic NV-SD3 оказались сломаны. У Соньки размякли и растянулись пассики и заглючила электроника, а у Панасоника тоже с электроникой что-то (а пассик там зубчатый, вроде ещё держится). Я честно старался реанимировать свою четырёхголовую Соньку, как потенциально могущую дать наиболее качественную картинку. Даже вспомнил технологии 80-х годов оперативного ремонта магнитофонов, и распотрошил на временные пассики дежурную пачку презервативов, чтобы понять, работает ли вообще кинематика, или же нет. После запуска Соньки, кинематика вроде проглотила тестовую кассету, но при попытках её воспроизвести, благополучно отключалась. Электроника тоже барахлила, приходилось полностью вытаскивать видак из сети, а затем через несколько секунд снова его включать, чтобы он начинал хотя бы пытаться слушаться команд. В общем, ни Соньку, ни Панасоник реанимировать так и не удалось.
Следующим (третьим) на фото снизу вверх идёт старинный но очень крутой на вид Bondstec BT-350. К сожалению, и у него та же самая проблема с пассиками, что и у Соньки. А ещё, кажется, что-то с кнопками включения и выброса кассеты. В общем, тоже не жилец.
А вот самые дешёвые на вид Sharp VC-MA33 и Samsung SVR-243 оказались исправны. Возможно, в них вообще отсутствуют пассики, как таковые. По крайней мере, я их не увидел, пока пылесосил внутренности этих аппаратов. Сравнительный анализ воспроизводимого видео с этих двух магнитофонов выявил существенную разницу в его качестве. У Самсунга картинка оказалась какая-то мыльная (даже после протирки головок спиртом), тогда как обшарпанный Шарп, оправдывая наименование своего бренда (Sharp — резкий, отчётливый), дал вполне себе чёткую картинку, насколько это было возможно, учитывая любительскую запись возрастом 22 года.
Таким образом, с первым звеном я определился. Им стал Sharp VC-MA33.
Звено 2. DVD-рекордер
Второе звено — аппарат, производящий оцифровку, то есть, содержащий АЦП (аналого-цифровой преобразователь). От мощности этого АЦП зависит качество оцифровки. АЦП даёт второй по значимости вклад в качество видео (после видеомагнитофона). У меня было опять же два варианта — использовать старый ТВ-тюнер AVerTV Studio 307, плата которого вставляется в PCI-разъём внутрь компьютера, или применить навороченный DVD-рекордер Panasonic DMR-EH67EE-K.
Я попробовал оцифровать и тюнером, и рекордером, и на моё удивление оказалось, что АЦП рекордера справляется с этой задачей куда лучше, несмотря на все мои попытки настроить должным образом ТВ-тюнер. Разбору этого удивительного феномена я даже посвятил свой предыдущий пост.
Таким образом, со вторым звеном оцифровки я также определился. Им стал DVD-рекордер Panasonic DMR-EH67EE-K:
Звено 3. Настройка формата записи оцифрованного материала рекордером
Мой DVD-рекордер DMR-EH67EE-K может вести запись и на собственный жёсткий диск, и на DVD-RW. К сожалению, прямое копирование на внешний жёсткий диск у этого аппарата не предусмотрено, поэтому остаётся писать только на DVD-RW, и переносить оцифрованное видео на компьютер через них.
Рекордер может писать диски с разным битрейтом (с разной степенью сжатия оцифрованного материала). Это режимы EP ( Extra Long Play), LP (Long Play), SP (Standart Play) и XP ( Extra High Quality Play). Обычно DVD-диски пишут в режиме SP, когда на один диск ёмкостью 4,7 ГБ помещается 120 минут записи. При этом средний битрейт видеоканала находится в районе 4,2 Мбит/с с пиками до 9 Мбит/с.
Но у меня сильно зашумлённое любительское видео, а шумы, как известно, очень хорошо сжирают битрейт. Если такому видео сильно урезать битрейт, то его качество упадёт в большей степени, чем это бы произошло у качественного видео. Поэтому я решил дать шумам (а значит, и полезному сигналу) простор, и кодировать его в режиме XP со средним битрейтом около 8,7 Мбит/с с пиками до 9 Мбит/с (как я понял, 9 Мбит/с является пределом пропускной способности канала в DVD-рекордере). В этом режиме на один DVD-диск влезает 60 минут записи. Вполне достаточная порция для обработки в программе видеомонтажа, пока будет писаться следующий диск.
Помимо видеоканала в рекордере можно настроить и формат сохранения аудиоканала. Тут выбор невелик. Или сжатие в формате AC-3 (Dolby digital), или несжатое аудио LPCM (Linear pulse-code modulation). Поскольку качество звука в любительских видеозаписях неактуально, писать в LPCM я особого смысла не вижу. AC-3 с прекрасным качеством закодирует любой звук. Кроме того, несжатое аудио отъест у видео немного больше битрейта. Так, вместо среднего битрейта 8,7 Мбит/с у нас останется 7,3 Мбит/с, а пиковый битрейт вместо 9 Мбит/с будет 8 Мбит/с. Смысла кодировать аудио в ущерб видео я не вижу.
Но тут есть один нюанс. Дело в том, что программа видеомонтажа Adobe Premiere Pro, начиная с последних версий, уже не осуществляет работу с форматом AC-3, а перекладывает эту функцию на плечи операционной системы. Но поддержка AC-3 операционной системой Windows начинается только с восьмой версии. Поэтому в Windows 7 программа видеомонтажа Adobe Premiere Pro будет безбожно ругаться на этот формат сжатия звука. А я как раз таки использую Windows 7, и апгрейдить систему, чтобы получить неудобный дизайн, рассчитанный на планшеты, не собираюсь.
Тут у нас два варианта. Либо всё-таки писать в LPCM (в принципе, вряд ли вы заметите разницу в качестве видео при битрейте 7,3 Мбит/с вместо 8,7 Мбит/с), либо какой-нибудь программой выдирать из готового файла аудиоканал, и импортировать его в Adobe Premiere Pro отдельно. Я выбрал второй вариант, поскольку это хоть и лишний шаг, но очень простой. О нём я расскажу при описании следующего звена.
Звено 4. Выдирание материала с DVD-диска в файл
DVD-диск представляет собой обычную дискету, только очень большой ёмкости, а именно, вся информация там хранится в обычной файловой системе. Поскольку DVD-стандарт подразумевает наличие на диске меню и прочей фигни, помимо видеофайлов там будет куча файлов других форматов, не имеющих прямого отношения к нашему оцифрованному видеоматериалу. Всё наше видео со звуком упаковано в файлах с расширением VOB. Этих файлов будет несколько, потому что максимальный размер такого файла по стандарту не может превышать 1 ГБ. Вот они там и лежат несколько штук по 1 ГБ, а последний — меньше, там оставшийся хвостик 🙂
Основные программы видеомонтажа Adobe Premiere Pro и Vegas читают файлы VOB, но не всегда корректно. Кроме того, неудобно работать с несколькими кусками, хорошо бы их перед импортом объединить в один файл, чтобы не засорять таймлайн программы монтажа разными «объединениями», ибо в настоящий единый кусок их в них склеить нельзя. Vegas может импортировать DVD-диск целиком, но почему-то опять же бъёт его на несколько ещё более мелких кусков, даже не равных VOB-файлам. Причём это даже не эпизоды, а фиг знает что. В общем, ни Adobe Premiere Pro, ни Vegas нормально со своей задачей по импорту материала с DVD-диска у меня не справились.
Можно было бы объединить материал одной из многочисленных утилит-рипперов с сохранением объединённого куска в любой формат, но тут есть важный нюанс. Объединять в один файл желательно без пережимания материала, чтобы не потерять качество на лишнем пережатии. Из всех перебранных мною программ, импорт с DVD-диска и объединение (вроде бы без пережатия) могут две достаточно известные программы. Это программы видеомонтажа Pinnacle Studio и Nero Video. Не знаю уж, совсем ли они обходятся без пережатия, но, по крайней мере, результат Pinnacle Studio по объёму равен сумме всех VOB-ов, а Nero Video может сохранять результат в формат avi вообще без сжатия.
Для любителей халявного софта замечу, что взломанный Nero Video, лежащий на торрентах, через несколько минут работы начинает доставать окном с сообщением о том, что код модифицирован, а после закрытия уже не запускается. А вот Pinnacle Studio в этом плане более сговорчива. Но и тут есть подводный камень. Версия 21 у меня очень долго и некорректно делала импорт. Хулиганила, стучала головками DVD-привода. Причём она начинала что-то читать с DVD-диска сразу после запуска, без всякой команды, не дожидаясь импорта, и, видимо, эти две задачи мешали друг другу, отсюда и возня головками. В общем, я рекомендую использовать для импорта с DVD версию 15. Она прекрасно с этим справляется.
Итак, видеофайл у нас есть, но со звуком AC-3, который, как я уже упоминал, не прочтётся в последней версии Adobe Premiere Pro CC 12 под Windows 7. Поэтому в той-же Pinnacle Studio я бросаю импортированный видеофайл на таймлайн и вывожу отдельно аудиофайл в формате MP3 с пользовательскими настройками 48 кГц, стерео, 320 кбит/с, то есть, с максимально возможными параметрами. В Adobe Premiere Pro я просто импортирую оба файла, кидаю их на таймлайн друг под друга и связываю. Всё.
Звено 5. Выбор программы видеомонтажа
Выше я уже частично осветил вопрос о выборе программы для видеомонтажа. Я выбрал Adobe Premiere Pro. Но можно использовать и простые программы, например, тот же самый Pinnacle Studio. Вероятно, для оцифровки домашних видеокассет больше и не надо. Если хочется попробовать свои силы на чём-то более серьёзном, можно поработать в Vegas. Ну и для тех, кто хочет вникнуть в ещё более продвинутый монтаж, используйте Adobe Premiere Pro.
Я не уверен, что качество монтажа будет увеличиваться с увеличением сложности программы. Но вот, говорят, скорость кодирования и качество итогового результата у Pinnacle Studio ниже, чем у Vegas и Adobe Premiere Pro. В общем, тут надо пробовать и тестировать. Что касается меня, я сделал ставку на максимальный авторитет — Adobe Premiere Pro.
Звено 6. Выбор настроек для вывода видео
Давайте рассмотрим настройки кодеков H.264 и AAC на примере окна экспорта программы Adobe Premiere Pro. Окно вызывается нажатием кнопок Ctrl+M. Вот настройки верхней части окна:
Тогда я попробовал подключиться ещё раз. Сначала вход элементарно молча не выполнялся без каких бы то ни было сообщений. Когда он всё же выполнился, я ещё раз попробовал сделать экспорт и публикацию, после чего у меня вылезла уже вот эта ошибка:
Кроме всего прочего, в программе не оказалось возможности повторно попробовать отправить на видеохостинг экспортированный файл без повторного его рендеринга, если произошла подобная ошибка. В общем, эта возможность ещё очень сырая. К тому же, она хороша, когда ты точно уверен, что файл экспортирован как надо. У меня же пока такой уверенности в экспортированных мною файлах нет. Поэтому я всё же предпочитаю после экспорта проверять размер, качество и монтаж видео в целом перед выкладыванием его в Интернет, что и вам рекомендую делать.