Оптимизация скорости и искажений - Википедия - Rate–distortion optimization
Оптимизация скорости искажения (RDO) - метод улучшения качество видео в сжатие видео. Название относится к оптимизации количества искажение (потеря качества видео) по сравнению с объемом данных, необходимых для кодирования видео, ставка. Хотя он в основном используется видеокодерами, оптимизацию скорости и искажения можно использовать для улучшения качества в любой ситуации кодирования (изображение, видео, аудио или иначе), когда необходимо принимать решения, которые одновременно влияют как на размер файла, так и на качество.
Фон
Классический метод принятия решений о кодировании заключается в том, что видеокодер выбирает результат, обеспечивающий наивысшее качество выходного изображения. Однако у этого есть недостаток, заключающийся в том, что сделанный выбор может потребовать большего количества битов, но дает сравнительно небольшое улучшение качества. Один из распространенных примеров этой проблемы - в оценка движения,[1]и, в частности, в отношении использования оценка движения с точностью до четверти пикселя. Добавление дополнительной точности к движению блокировать во время оценки движения может повысить качество, но в некоторых случаях это дополнительное качество не стоит дополнительных битов, необходимых для кодирования вектора движения с более высокой точностью.
Как это устроено
Оптимизация скорости и искажения решает вышеупомянутую проблему, выступая в качестве показателя качества видео, измеряя как отклонение от исходного материала, так и битовую стоимость для каждого возможного результата решения. Биты математически измеряются путем умножения стоимости битов на Лагранжиан, значение, представляющее отношение между битовой стоимостью и качеством для определенного уровня качества. Отклонение от источника обычно измеряется как среднеквадратичная ошибка, чтобы максимизировать PSNR показатель качества видео.
Расчет стоимости долота затруднен из-за энтропийные кодеры В современных видеокодеках требуется, чтобы алгоритм оптимизации скорости-искажения передавал каждый блок видео, который должен быть протестирован, энтропийному кодеру для измерения его фактической битовой стоимости. В MPEG кодеков, весь процесс состоит из дискретное косинусное преобразование, с последующим квантование и энтропийное кодирование. Из-за этого оптимизация скорости и искажения выполняется намного медленнее, чем большинство других показателей сопоставления блоков, таких как простой сумма абсолютных разностей (САД) и сумма абсолютных преобразованных разностей (SATD). Таким образом, он обычно используется только на последних этапах оценка движения процесс, например, выбор между разными типами разделов в H.264 / AVC.
Список кодировщиков, поддерживающих RDO
- Атеме H.264 кодировщик
- Grass Valley Кодеры ViBE (SD и HD MPEG-2 / MPEG-4)
- Кодировщик Harmonic Electra 8000 (SD и HD MPEG-2 / MPEG-4)
- libavcodec
- MainConcept H.264 кодировщик
- Microsoft ВК-1 кодировщик
- TANDBERG Television SD MPEG-2 EN8100
- TANDBERG Television HD MPEG-4 EN8190
- TANDBERG Television SD и HD MPEG-4 iPlex
- Теора 1.1-alpha1 и выше (ветка "Туснельда")
- x264 Кодировщик H.264
- x265 Кодировщик H.265
- Xvid MPEG-4 ASP кодировщик
- H.264 / AVC эталонное программное обеспечение JM (Joint Model)
- HEVC эталонное программное обеспечение HM (тестовая модель HEVC)
- Квазар (частичный)[2]
Рекомендации
- ^ Д. Т. Хоанг, П. М. Лонг и Джеффри Виттер, Оптимизация скорости и искажения для оценки движения при кодировании видео с низкой скоростью передачи данных, IEEE Transactions по схемам и системам для видеотехнологий, 8 (4), August 1998, 488-500. Более короткая версия появляется в Материалы конференции по сжатию цифрового видео, Симпозиум IS & T / SPIE 1996 г. по электронным изображениям: наука и технологии, 2668, Сан-Хосе, Калифорния, январь-февраль 1996 г., 18-27.
- ^ http://ultravideo.cs.tut.fi/#encoder