Сжатие изображения - Image compression
Эта статья включает в себя список общих использованная литература, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты.Апрель 2010 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Сжатие изображения это тип Сжатие данных применительно к цифровые изображения, чтобы снизить их стоимость на место хранения или коробка передач. Алгоритмы может воспользоваться визуальное восприятие и статистический свойства данных изображения для обеспечения превосходных результатов по сравнению с обычными Сжатие данных методы, которые используются для других цифровых данных.[1]
Сжатие изображений с потерями и без потерь
Сжатие изображения может быть с потерями или без потерь. Сжатие без потерь предпочтительнее для архивных целей и часто для медицинских изображений, технических чертежей, клип арт, или комиксы. Методы сжатия с потерями, особенно при использовании битрейты, вводить артефакты сжатия. Методы с потерями особенно подходят для естественных изображений, таких как фотографии, в приложениях, где допустима незначительная (иногда незаметная) потеря точности для достижения существенного снижения скорости передачи данных. Сжатие с потерями, которое дает незначительные различия, можно назвать визуально без потерь.
Методы для сжатие с потерями:
- Преобразование кодирования - Это наиболее часто используемый метод.
- Дискретное косинусное преобразование (DCT) - наиболее широко используемая форма сжатия с потерями. Это тип Преобразование Фурье, и изначально был разработан Насир Ахмед, Т. Натараджан и К. Р. Рао в 1974 г.[2] DCT иногда называют «DCT-II» в контексте семейства дискретных косинусных преобразований (см. дискретное косинусное преобразование ). Как правило, это наиболее эффективная форма сжатия изображений.
- Недавно разработанные вейвлет-преобразование также широко используется, за которым следует квантование и энтропийное кодирование.
- Уменьшение цветовое пространство к наиболее распространенным цветам на изображении. Выбранные цвета указаны в цвете палитра в заголовке сжатого изображения. Каждый пиксель просто ссылается на индекс цвета в цветовой палитре, этот метод можно комбинировать с дизеринг избежать постеризация.
- Подвыборка цветности. Это использует преимущество того факта, что человеческий глаз воспринимает пространственные изменения яркости более резко, чем изменения цвета, путем усреднения или отбрасывания некоторой информации о цветности в изображении.
- Фрактальное сжатие.
Методы для сжатие без потерь:
- Кодирование длин серий - используется в методе по умолчанию в PCX и как один из возможных в BMP, TGA, TIFF
- Сжатие изображения области
- Прогнозирующее кодирование - используется в DPCM
- Энтропийное кодирование - два наиболее распространенных метода энтропийного кодирования: арифметическое кодирование и Кодирование Хаффмана
- Алгоритмы адаптивного словаря, такие как LZW - используется в Гифка и TIFF
- ВЫПУСКАТЬ - используется в PNG, MNG, и TIFF
- Цепные коды
Другие свойства
Наилучшее качество изображения при заданной степени сжатия (или битрейт ) является основной целью сжатия изображений, однако есть и другие важные свойства схем сжатия изображений:
Масштабируемость обычно относится к снижению качества, достигаемому манипулированием потоком битов или файлом (без декомпрессии и повторного сжатия). Другие названия масштабируемости: прогрессивное кодирование или встроенные битовые потоки. Несмотря на свою противоположную природу, масштабируемость также может быть обнаружена в кодеках без потерь, обычно в форме сканирования пикселей от грубого до тонкого. Масштабируемость особенно полезна для предварительного просмотра изображений при их загрузке (например, в веб-браузере) или для обеспечения доступа переменного качества, например, к базам данных. Есть несколько типов масштабируемости:
- Прогрессивное качество или прогрессивный уровень: битовый поток последовательно улучшает восстановленное изображение.
- Прогрессивное разрешение: Сначала закодируйте изображение с более низким разрешением; затем закодируйте разницу в более высоком разрешении.[3][4]
- Компонентный прогрессивный: Сначала закодируйте версию в оттенках серого; затем добавляем полный цвет.
Кодирование интересующей области. Некоторые части изображения кодируются с более высоким качеством, чем другие. Это может сочетаться с масштабируемостью (сначала кодируйте эти части, а затем - другие).
Мета информация. Сжатые данные могут содержать информацию об изображении, которая может использоваться для категоризации, поиска или просмотра изображений. Такая информация может включать статистику цвета и текстуры, небольшую предварительный просмотр изображения, а также информацию об авторе или авторских правах.
Вычислительная мощность. Алгоритмы сжатия требуют разного количества вычислительная мощность кодировать и декодировать. Некоторые алгоритмы с высокой степенью сжатия требуют высокой вычислительной мощности.
Качество метода сжатия часто измеряется пиковое отношение сигнал / шум. Он измеряет количество шума, вносимого посредством сжатия изображения с потерями, однако субъективное суждение зрителя также считается важной мерой, возможно, самой важной мерой.
История
Энтропийное кодирование началось в 1940-х годах с введением Кодирование Шеннона – Фано,[5] основа для Кодирование Хаффмана который был разработан в 1950 году.[6] Преобразование кодирования восходит к концу 1960-х годов, с появлением быстрое преобразование Фурье (БПФ) в 1968 году и Преобразование Адамара в 1969 г.[7]
Важное развитие имиджа Сжатие данных был дискретное косинусное преобразование (DCT), а сжатие с потерями метод, впервые предложенный Насир Ахмед в 1972 г.[8] Сжатие DCT стало основой для JPEG, который был введен Объединенная группа экспертов в области фотографии (JPEG) в 1992 году.[9] JPEG сжимает изображения до файлов гораздо меньшего размера и стал наиболее широко используемым формат файла изображения.[10] Его высокоэффективный алгоритм сжатия DCT во многом стал причиной широкого распространения цифровые изображения и цифровые фотографии,[11] с несколько миллиардов изображений JPEG, создаваемых каждый день по состоянию на 2015 год.[12]
Лемпель – Зив – Велч (LZW) - это сжатие без потерь алгоритм, разработанный Авраам Лемпель, Джейкоб Зив и Терри Уэлч в 1984 году. Используется в Гифка формат, представленный в 1987 году.[13] ВЫПУСКАТЬ, алгоритм сжатия без потерь, разработанный Фил Кац и указанный в 1996 году, используется в Переносимая сетевая графика (PNG) формат.[14]
Вейвлет кодирование, использование вейвлет-преобразования в сжатии изображений, началось после развития кодирования DCT.[15] Внедрение DCT привело к развитию вейвлет-кодирования, варианта DCT-кодирования, в котором вместо блочного алгоритма DCT используются вейвлеты.[15] В JPEG 2000 Стандарт был разработан с 1997 по 2000 год комитетом JPEG под председательством Тураджа Эбрахими (впоследствии президента JPEG).[16] В отличие от алгоритма DCT, используемого в исходном формате JPEG, JPEG 2000 вместо этого использует дискретное вейвлет-преобразование (DWT) алгоритмы. Он использует CDF 9/7 вейвлет-преобразование (разработано Ингрид Добеши в 1992 г.) за алгоритм сжатия с потерями,[17] и вейвлет-преобразование LeGall-Tabatabai (LGT) 5/3[18][19] (разработан Дидье Ле Галлом и Али Дж. Табатабаи в 1988 году)[20] за его алгоритм сжатия без потерь.[17] JPEG 2000 технология, которая включает Motion JPEG 2000 расширение, было выбрано в качестве стандарт кодирования видео для цифровое кино в 2004 г.[21]
Примечания и ссылки
- ^ «Сжатие данных изображения».
- ^ Насир Ахмед, Т. Натараджан и К. Р. Рао, "Дискретное косинусное преобразование," IEEE Trans. Компьютеры, 90–93, январь 1974.
- ^ Burt, P .; Адельсон, Э. (1 апреля 1983 г.). «Лапласова пирамида как компактный код изображения». Транзакции IEEE по коммуникациям. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. Дои:10.1109 / TCOM.1983.1095851.
- ^ Шао, Дан; Кропач, Вальтер Г. (3–5 февраля 2010 г.). Шпачек, Либор; Франк, Войтех (ред.). "Неправильная пирамида лапласовского графа" (PDF). Зимний семинар по компьютерному зрению 2010. Нове Грады, Чешская Республика: Чешское общество распознавания образов.
- ^ Клод Элвуд Шеннон (1948). Alcatel-Lucent (ред.). «Математическая теория коммуникации» (PDF). Технический журнал Bell System. 27 (3–4): 379–423, 623–656. Дои:10.1002 / j.1538-7305.1948.tb01338.x. HDL:11858 / 00-001M-0000-002C-4314-2. Получено 2019-04-21.
- ^ Дэвид Альберт Хаффман (Сентябрь 1952 г.), «Метод построения кодов с минимальной избыточностью» (PDF), Труды IRE, 40 (9), стр. 1098–1101, Дои:10.1109 / JRPROC.1952.273898
- ^ Уильям К. Пратт, Джулиус Кейн, Гарри К. Эндрюс: "Кодирование изображений с преобразованием Адамара ", в Proceedings of the IEEE 57.1 (1969): Seiten 58–68
- ^ Ахмед, Насир (Январь 1991 г.). "Как я пришел к дискретному косинусному преобразованию". Цифровая обработка сигналов. 1 (1): 4–5. Дои:10.1016 / 1051-2004 (91) 90086-Z.
- ^ «T.81 - ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ТОНОВЫХ ИЗОБРАЖЕНИЙ - ТРЕБОВАНИЯ И РЕКОМЕНДАЦИИ» (PDF). CCITT. Сентябрь 1992 г.. Получено 12 июля 2019.
- ^ «Объяснение формата изображения JPEG». BT.com. BT Group. 31 мая 2018. Получено 5 августа 2019.
- ^ «Что такое JPEG? Невидимый объект, который вы видите каждый день». Атлантический океан. 24 сентября 2013 г.. Получено 13 сентября 2019.
- ^ Баранюк, Крис (15 октября 2015 г.). «Защита от копирования может быть применена к файлам JPEG». Новости BBC. BBC. Получено 13 сентября 2019.
- ^ «Противоречие GIF: взгляд разработчика программного обеспечения». Получено 26 мая 2015.
- ^ Л. Питер Дойч (Май 1996 г.). DEFLATE Спецификация формата сжатых данных версии 1.3. IETF. п. 1 сек. Абстрактные. Дои:10.17487 / RFC1951. RFC 1951. Получено 2014-04-23.
- ^ а б Хоффман, Рой (2012). Сжатие данных в цифровых системах. Springer Science & Business Media. п. 124. ISBN 9781461560319.
По сути, вейвлет-кодирование - это вариант кодирования с преобразованием на основе DCT, который уменьшает или устраняет некоторые из его ограничений. (...) Еще одно преимущество заключается в том, что вместо работы с блоками 8 × 8 пикселей, как это делают JPEG и другие блочные методы DCT, вейвлет-кодирование может одновременно сжимать все изображение.
- ^ Таубман, Дэвид; Марселлин, Майкл (2012). JPEG2000: основы, стандарты и практика сжатия изображений: основы, стандарты и практика сжатия изображений. Springer Science & Business Media. ISBN 9781461507994.
- ^ а б Unser, M .; Блю Т. (2003). «Математические свойства вейвлет-фильтров JPEG2000» (PDF). IEEE Transactions по обработке изображений. 12 (9): 1080–1090. Bibcode:2003ITIP ... 12.1080U. Дои:10.1109 / TIP.2003.812329. PMID 18237979. S2CID 2765169.
- ^ Салливан, Гэри (8–12 декабря 2003 г.). «Общие характеристики и конструктивные соображения для кодирования видео временного поддиапазона». ITU-T. Группа экспертов по кодированию видео. Получено 13 сентября 2019.
- ^ Бовик, Алан С. (2009). Основное руководство по обработке видео. Академическая пресса. п. 355. ISBN 9780080922508.
- ^ Галл, Дидье Ле; Табатабай, Али Дж. (1988). «Подполосное кодирование цифровых изображений с использованием симметричных коротких ядерных фильтров и методов арифметического кодирования». ICASSP-88., Международная конференция по акустике, речи и обработке сигналов: 761–764 т.2. Дои:10.1109 / ICASSP.1988.196696. S2CID 109186495.
- ^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональное руководство. Тейлор и Фрэнсис. п. 147. ISBN 9780240806174.
внешние ссылки
- Сжатие изображения - лекция от MIT OpenCourseWare
- Основы кодирования изображений
- Исследование о сжатии изображений - с основами, сравнивая различные методы сжатия, такие как JPEG2000, JPEG и JPEG XR / HD Photo
- Основы сжатия данных - включает сравнение форматов PNG, JPEG и JPEG-2000
- Вопросы и ответы: каковы современные достижения в области сжатия изображений без потерь? от comp.compression
- IPRG - открытая группа, связанная с ресурсами исследования обработки изображений