Zip (формат файла) - Zip (file format)

Формат файла ZIP
Расширения имени файла.zip, .zipx (более новые алгоритмы сжатия)
Тип интернет-СМИприложение / zip[1]
Единый идентификатор типа (UTI)com.pkware.zip-архив
Магическое число
  • никто
  • ПК x03 x04
  • ПК x05 x06 (пустой)
  • ПК x07 x08 (натянуто)
РазработанPKWARE, Inc.
изначальный выпуск14 февраля 1989 г.; 31 год назад (1989-02-14)
Последний релиз
6.3.9
(15 июля 2020 г.; 4 месяца назад (2020-07-15))
Тип форматаСжатие данных
Расширен доБАНКА (EAR, RAR (Java), ВОЙНА )
Office Open XML (Microsoft)
Соглашения об открытой упаковке
OpenDocument (ODF)
XPI (Расширения Mozilla)
СтандартПРИЛОЖЕНИЕ из PKWARE
ISO / IEC 21320-1: 2015 (подмножество файла ZIP в формате 6.3.3)
Открытый формат ?да

ZIP является формат файла архива что поддерживает сжатие данных без потерь. ZIP-файл может содержать один или несколько файлов или каталогов, которые могли быть сжаты. Формат файла ZIP допускает некоторое сжатие. алгоритмы, хотя ВЫПУСКАТЬ самый распространенный. Этот формат был первоначально создан в 1989 году и впервые был реализован в PKWARE, Inc. с PKZIP полезность,[2] в качестве замены предыдущего ARC формат сжатия Тома Хендерсона. Формат ZIP затем быстро стал поддерживаться многими программными утилитами, кроме PKZIP. Microsoft включила встроенную поддержку ZIP (под названием «сжатые папки») в версии Майкрософт Виндоус с 1998 года. Apple включила встроенную поддержку ZIP в Mac OS X 10.3 (через BOMArchiveHelper, сейчас Утилита архивирования ) и позже. Наиболее бесплатные операционные системы имеют встроенную поддержку ZIP аналогично Windows и Mac OS X.

ZIP-файлы обычно используют расширения файлов .zip или .ZIP и MIME тип СМИ приложение / zip.[1] ZIP используется в качестве базового формата файла во многих программах, обычно под другим именем. При навигации по файловой системе через пользовательский интерфейс графический иконки представление файлов ZIP часто отображается как документ или другой объект с заметным молния.

История

В .ZIP формат файла был разработан Фил Кац из ПО и Гэри Конвей из Infinity Design Concepts. Формат был создан после того, как Systems Enhancement Associates (SEA) подала иск против PKWARE, утверждая, что архивные продукты последнего, названные PKARC, были производными от SEA ARC система архивирования.[3] Название «застежка-молния» (что означает «двигаться с высокой скоростью») было предложено другом Каца, Робертом Махони.[4] Они хотели дать понять, что их продукт будет быстрее, чем ARC и другие форматы сжатия того времени.[4] Самая ранняя известная версия .ZIP спецификация формата файла был впервые опубликован как часть PKZIP 0.9 под файлом APPNOTE.TXT в 1989 году.[нужна цитата ] Благодаря распространению формата zip-файла в APPNOTE.TXT совместимость с форматом zip-файла широко распространилась в общедоступном Интернете в 1990-е годы.[5]

14 февраля 1989 года PKWARE и Infinity Design Concepts выпустили совместный пресс-релиз. .ZIP формат файла в всеобщее достояние.[6][7][8][9][10]

История версий

Спецификация формата файла .ZIP имеет собственный номер версии, который не обязательно соответствует номерам версий для инструмента PKZIP, особенно с PKZIP 6 или более поздней версии. В разное время в PKWARE добавлялись предварительные функции, позволяющие продуктам PKZIP извлекать архивы с использованием расширенных функций, но продукты PKZIP, которые создают такие архивы, не будут доступны до следующего основного выпуска. Другие компании или организации поддерживают спецификации PKWARE в своем собственном темпе.

Спецификация формата файла .ZIP официально называется «APPNOTE - .ZIP File Format Specification» и публикуется на веб-сайте PKWARE.com с конца 1990-х годов.[11] Несколько версий спецификации не были опубликованы. Технические характеристики некоторых функций, таких как BZIP2 сжатие, строгая спецификация шифрования и другие были опубликованы PKWARE через несколько лет после их создания. URL-адрес онлайн-спецификации менялся несколько раз на веб-сайте PKWARE.

Краткое изложение основных достижений в различных версиях спецификации PKWARE:

  • 2.0: (1993)[1] Записи файлов могут быть сжаты с помощью ВЫПУСКАТЬ и использовать традиционное шифрование PKWARE (ZipCrypto).
  • 2.1: (1996) Сжатие Deflate64
  • 4.5: (2001)[12] Документированный 64-битный zip-формат.
  • 4.6: (2001) сжатие BZIP2 (не опубликовано в Интернете до публикации APPNOTE 5.2)
  • 5.0: (2002) SES: DES, Тройной DES, RC2, RC4 поддерживается для шифрования (не опубликовано в Интернете до публикации APPNOTE 5.2)
  • 5.2: (2003)[13][14] Поддержка шифрования AES для SES (определенного в APPNOTE 5.1, который не был опубликован в сети) и AES из WinZip («AE-x»); исправленная версия RC2-64, поддерживающая шифрование SES.
  • 6.1: (2004)[15] Документированное хранилище сертификатов.
  • 6.2.0: (2004)[16] Документированное шифрование центрального каталога.
  • 6.3.0: (2006)[17] Документированный Unicode (UTF-8 ) имя файла хранилище. Расширенный список поддерживаемых хешей, сжатие (LZMA, PPMd + ), алгоритмы шифрования.
  • 6.3.1: (2007)[18] Исправлены стандартные хеш-значения для SHA-256/384/512.
  • 6.3.2: (2007)[19] Документированный метод сжатия 97 (WavPack ).
  • 6.3.3: (2012)[20] Изменения в форматировании документов для облегчения ссылок на указания по применению PKWARE из других стандартов с использованием таких методов, как JTC 1 Referencing Explanatory Report (RER), как указано в JTC 1 / SC 34 N 1621.
  • 6.3.4: (2014)[21] Обновляет адрес офиса PKWARE, Inc.
  • 6.3.5: (2018)[22] Задокументированы методы сжатия 16, 96 и 99, эпоха и точность временной метки DOS, добавлены дополнительные поля для ключей и дешифрования, а также опечатки и пояснения.
  • 6.3.6: (2019)[23] Исправлена ​​опечатка.
  • 6.3.7: (2020)[24] Добавлен Zстандарт ID метода сжатия 20.
  • 6.3.8: (2020)[25] Идентификатор метода сжатия Zstandard перемещен с 20 на 93, отказавшись от прежнего. Документированные идентификаторы метода 94 и 95 (MP3 и XZ соответственно).
  • 6.3.9: (2020)[26] Исправлена ​​опечатка в описании выравнивания потока данных.

WinZip, начиная с версии 12.1, использует расширение .zipx для файлов ZIP, использующих методы сжатия более новые, чем DEFLATE; в частности, методы BZip, LZMA, PPMd, Jpeg и Wavpack. Последние 2 применяются к соответствующим типам файлов, когда выбрано сжатие «Лучший метод».[27][28]

Стандартизация

В апреле 2010 г. ISO / IEC JTC 1 инициировал голосование, чтобы определить, следует ли инициировать проект по созданию формата международного стандарта ISO / IEC, совместимого с ZIP.[29] Предлагаемый проект под названием Упаковка документов, предусматривал ZIP-совместимый «минимальный сжатый формат архива», подходящий для использования с рядом существующих стандартов, включая OpenDocument, Office Open XML и EPUB.

В 2015 году был опубликован ISO / IEC 21320-1 «Файл-контейнер документа - Часть 1: Ядро», в котором говорится, что «Файлы-контейнеры документов соответствуют файлам Zip». Это требует следующих основных ограничений формата файла ZIP:[30]

  • Файлы в архивах ZIP могут храниться только в несжатом виде или с использованием сжатия «deflate» (т.е. метод сжатия может содержать значение «0» - сохранено или «8» - спущено).
  • Функции шифрования запрещены.
  • Использование цифровой подписи (от SES) запрещено.
  • Функции "исправленных данных" (от PKPatchMaker) запрещены.
  • Архивы не могут занимать несколько томов или быть сегментированными.

Дизайн

.ZIP файлы - это архивы, в которых хранится несколько файлов. ZIP позволяет сжимать содержащиеся файлы, используя множество различных методов, а также просто сохранять файл без сжатия. Каждый файл хранится отдельно, что позволяет сжимать разные файлы в одном архиве разными методами. Поскольку файлы в ZIP-архиве сжимаются по отдельности, их можно извлекать или добавлять новые без применения сжатия или распаковки ко всему архиву. Это контрастирует с форматом сжатого деготь файлы, для которых такая обработка произвольного доступа затруднена.

Каталог помещается в конец ZIP-файла. Это определяет, какие файлы находятся в ZIP-архиве, и определяет, где в ZIP-архиве находится этот файл. Это позволяет читателям ZIP загружать список файлов без чтения всего ZIP-архива. ZIP-архивы также могут содержать дополнительные данные, не относящиеся к ZIP-архиву. Это позволяет превратить ZIP-архив в самораспаковывающийся архив (приложение, которое распаковывает содержащиеся в нем данные), добавив программный код к ZIP-архиву и пометив файл как исполняемый. Хранение каталога в конце также позволяет скрыть заархивированный файл, добавив его к безобидному файлу, например к файлу изображения GIF.

В .ZIP формат использует 32-битный алгоритм CRC и включает две копии структуры каталогов архива для обеспечения большей защиты от потери данных.

Структура

ZIP-64 Внутренняя компоновка

ZIP-файл правильно идентифицируется по наличию конец записи центрального каталога который расположен в конце структуры архива, чтобы можно было легко добавлять новые файлы. Если конец записи центрального каталога указывает на непустой архив, имя каждого файла или каталога в архиве должно быть указано в центральный каталог запись, а также другие метаданные о записи и смещение в ZIP-файле, указывающее на фактические данные записи. Это позволяет относительно быстро составлять список файлов архива, так как не нужно читать весь архив, чтобы увидеть список файлов. Записи в ZIP-файле также включают эту информацию для избыточности в заголовок локального файла. Поскольку ZIP-файлы могут быть добавлены, допустимы только файлы, указанные в центральном каталоге в конце файла. Сканирование ZIP-файла на предмет заголовков локальных файлов недопустимо (за исключением случаев поврежденных архивов), поскольку центральный каталог может объявить, что некоторые файлы были удалены, а другие обновлены.

Например, мы можем начать с ZIP-файла, который содержит файлы A, B и C. Затем файл B удаляется, а файл C. Этого можно достичь, просто добавив новый файл C в конец исходного файла ZIP и добавив новый центральный каталог, в котором перечислены только файл A и новый файл C. Когда ZIP был впервые разработан, передача файлов с помощью гибких дисков была обычным явлением, однако запись на диски занимала очень много времени. Если у вас есть большой zip-файл, возможно, охватывающий несколько дисков, и вам нужно обновить только несколько файлов, а не читать и перезаписывать все файлы, было бы значительно быстрее просто прочитать старый центральный каталог и добавить новые файлы затем добавьте обновленный центральный каталог.

Порядок записей файлов в центральном каталоге не обязательно должен совпадать с порядком записей файлов в архиве.

Каждая запись, хранящаяся в ZIP-архиве, обозначается значком заголовок локального файла с информацией о файле, такой как комментарий, размер файла и имя файла, за которыми следуют необязательные «дополнительные» поля данных, а затем возможно сжатые, возможно зашифрованные данные файла. «Дополнительные» поля данных являются ключом к расширяемости формата ZIP. «Дополнительные» поля используются для поддержки формата ZIP64, WinZip-совместимого шифрования AES, атрибутов файлов и временных меток файлов NTFS или Unix с более высоким разрешением. Другие расширения возможны через поле «Дополнительно». Согласно спецификации, инструменты ZIP игнорируют дополнительные поля, которые они не распознают.

Формат ZIP использует определенные 4-байтовые «подписи» для обозначения различных структур в файле. Каждая запись файла помечена определенной подписью. Конец записи центрального каталога обозначается его конкретной подписью, и каждая запись в центральном каталоге начинается с 4-байтового подпись заголовка центрального файла.

В спецификации ZIP нет маркеров BOF или EOF. Обычно в ZIP-файле первым делом является запись в формате ZIP, которую можно легко идентифицировать по подпись заголовка локального файла. Однако это не обязательно так, поскольку это не требуется спецификацией ZIP - в частности, самораспаковывающийся архив начинается с заголовка исполняемого файла.

Инструменты, которые правильно читают ZIP-архивы, должны сканировать конец подписи записи центрального каталога, а затем, при необходимости, другие указанные записи центрального каталога. Они не должны сканировать записи из верхней части ZIP-файла, потому что (как упоминалось ранее в этом разделе) только центральный каталог указывает, где начинается фрагмент файла и что он не был удален. Сканирование может привести к ложным срабатываниям, так как формат не запрещает другим данным находиться между фрагментами, а также потокам данных файлов не содержать такие подписи. Однако инструменты, которые пытаются восстановить данные из поврежденных ZIP-архивов, скорее всего, будут сканировать архив на наличие подписей локальных заголовков файлов; это усложняется тем фактом, что сжатый размер фрагмента файла может быть сохранен после фрагмента файла, что затрудняет последовательную обработку.

Большинство подписей оканчиваются коротким целым числом 0x4b50, которое хранится в прямой порядок байтов заказ. В виде строки ASCII читается "PK", инициалы изобретателя Фила Каца. Таким образом, когда ZIP-файл просматривается в текстовом редакторе, первые два байта файла обычно являются «PK». (Самораспаковывающиеся ZIP-файлы для DOS, OS / 2 и Windows имеют исполняемый файл перед ZIP поэтому начинайте с "MZ"; Самораспаковывающимся ZIP-файлам для других операционных систем аналогичным образом может предшествовать исполняемый код для извлечения содержимого архива на этой платформе.)

В .ZIP спецификация также поддерживает распространение архивов по нескольким файлам файловой системы. Первоначально предназначался для хранения больших файлов ZIP на нескольких дискеты, эта функция теперь используется для частичной отправки ZIP-архивов по электронной почте, через другие транспортные средства или съемные носители.

В Файловая система FAT DOS имеет разрешение временной метки всего две секунды; Записи файлов ZIP имитируют это. В результате встроенное разрешение временных меток файлов в ZIP-архиве составляет всего две секунды, хотя дополнительные поля могут использоваться для хранения более точных временных меток. Формат ZIP не имеет понятия часовой пояс, поэтому отметки времени имеют смысл только в том случае, если известно, в каком часовом поясе они были созданы.

В сентябре 2007 года PKWARE выпустила пересмотренную версию спецификации ZIP, предусматривающую хранение имен файлов с использованием UTF-8, наконец, добавление совместимости с Unicode в ZIP.[31]

Заголовки файлов

Все многобайтовые значения в заголовке хранятся в прямой порядок байтов порядок байтов. Все поля длины считают длину в байтах.

Заголовок локального файла

Заголовок локального файла
СмещениеБайтовОписание[31]
04Подпись заголовка локального файла = 0x04034b50 (читается как число с прямым порядком байтов)
42Версия, необходимая для извлечения (минимальная)
62Битовый флаг общего назначения
82Метод сжатия
102Время последнего изменения файла
122Дата последнего изменения файла
144CRC-32 несжатых данных
184Сжатый размер
224Несжатый размер
262Длина имени файла (п)
282Длина дополнительного поля (м)
30пИмя файла
30+пмДополнительное поле

Дополнительное поле содержит множество дополнительных данных, таких как атрибуты ОС. Он разделен на блоки, каждый из которых имеет 16-битный идентификационный код и 16-битную длину.

Сразу же следуют сжатые данные.

Дескриптор данных

Если бит со смещением 3 (0x08) поля флагов общего назначения установлен, тогда CRC-32 и размеры файла неизвестны при записи заголовка. Поля в локальном заголовке заполняются нулями, а CRC-32 и размер добавляются в 12-байтовой структуре (необязательно с предшествующей 4-байтовой подписью) сразу после сжатых данных:

Дескриптор данных
СмещениеБайтовОписание[31]
00/4Необязательный подпись дескриптора данных = 0x08074b50
0/44CRC-32 несжатых данных
4/84Сжатый размер
8/124Несжатый размер

Заголовок файла центрального каталога

Запись центрального каталога - это развернутая форма локального заголовка:

Заголовок файла центрального каталога
СмещениеБайтовОписание[31]
04Подпись заголовка файла центрального каталога = 0x02014b50
42Версия сделана
62Версия, необходимая для извлечения (минимальная)
82Битовый флаг общего назначения
102Метод сжатия
122Время последнего изменения файла
142Дата последнего изменения файла
164CRC-32 несжатых данных
204Сжатый размер
244Несжатый размер
282Длина имени файла (п)
302Длина дополнительного поля (м)
322Длина комментария к файлу (k)
342Номер диска, с которого начинается файл
362Атрибуты внутреннего файла
384Атрибуты внешнего файла
424Относительное смещение заголовка локального файла. Это количество байтов между началом первого диска, на котором находится файл, и началом заголовка локального файла. Это позволяет программному обеспечению, считывающему центральный каталог, определять положение файла внутри ZIP-файла.
46пИмя файла
46+пмДополнительное поле
46+п+мkКомментарий к файлу

Конец записи центрального каталога (EOCD)

После всех записей центрального каталога следует конец записи центрального каталога (EOCD), который отмечает конец ZIP-файла:

Конец записи центрального каталога (EOCD)
СмещениеБайтовОписание[31]
04Конец подписи центрального каталога = 0x06054b50
42Номер этого диска
62Диск, на котором начинается центральный каталог
82Количество записей центрального каталога на этом диске
102Общее количество записей центрального каталога
124Размер центрального каталога (байты)
164Смещение начала центрального каталога относительно начала архива
202Длина комментария (п)
22пКомментарий

Такой порядок позволяет создать ZIP-файл за один проход, но центральный каталог также размещается в конце файла, чтобы облегчить удаление файлов из нескольких частей. (например, "несколько гибких дисков") архивы, как обсуждалось ранее.

Методы сжатия

Спецификация формата файла .ZIP документирует следующие методы сжатия: Store (без сжатия), Shrink (LZW), Reduce (уровни 1-4; RLE + вероятностный), Implode, Deflate, Deflate64, bzip2, LZMA, WavPack, PPMd, и вариант LZ77, предоставленный IBM z / OS Инструкция CMPSC.[32][22] Наиболее часто используемый метод сжатия - ВЫПУСКАТЬ, который описан в IETF RFC  1951.

Другие методы, упомянутые, но подробно не задокументированные в спецификации, включают: PKWARE DCL Implode (старый IBM TERSE), новый IBM TERSE, IBM LZ77 z Architecture (PFS) и вариант JPEG. Метод Tokenize был зарезервирован для третьей стороны, но поддержка так и не была добавлена.[22]

Слово Взорвать PKWARE чрезмерно используется: DCL / TERSE Implode отличается от старого PKZIP Implode, предшественника Deflate. DCL Implode не задокументирован частично из-за того, что его права собственности принадлежат IBM, но Марк Адлер тем не менее, наряду с zlib предоставил декомпрессор под названием "blast".[33]

Шифрование

ZIP поддерживает простой пароль -основан симметричное шифрование система, широко известная как ZipCrypto. Он задокументирован в спецификации ZIP и известен как серьезный изъян. В частности, он уязвим для атаки с использованием известного открытого текста, которые в некоторых случаях усугубляются плохой реализацией генераторы случайных чисел.[5]

Новые функции, включая новые сжатие и шифрование (например. AES ) были задокументированы в Спецификации формата файлов ZIP, начиная с версии 5.2. А WinZip -разработанный открытый стандарт на основе AES ("AE-x" в APPNOTE) также используется 7-молния и Xceed, но некоторые производители используют другие форматы.[34] PKWARE SecureZIP (SES, проприетарный) также поддерживает методы шифрования RC2, RC4, DES, Triple DES, шифрование и аутентификацию на основе цифровых сертификатов (X.509 ) и шифрование заголовка архива. Однако он запатентован (см. § Сильные споры о шифровании ).[35]

Имя файла шифрование представлен в Спецификации формата файла .ZIP 6.2, который шифрует метаданные, хранящиеся в части центрального каталога архива, но разделы локального заголовка остаются незашифрованными. Соответствующий требованиям архиватор может фальсифицировать данные локального заголовка при использовании шифрования центрального каталога. Начиная с версии 6.2 спецификации, поля Compression Method и Compressed Size в локальном заголовке еще не замаскированы.

ZIP64

Оригинал .ZIP формат имел 4 ГиБ (232 байтов) на различные вещи (несжатый размер файла, сжатый размер файла и общий размер архива), а также ограничение в 65 535 (216) записи в ZIP-архиве. В версии 4.5 спецификации (которая не совпадает с версией 4.5 любого конкретного инструмента) PKWARE представила расширения формата «ZIP64», чтобы обойти эти ограничения, увеличив пределы до 16.EiB (264 байтов). По сути, он использует «обычную» запись в центральном каталоге для файла, за которой следует необязательная запись каталога «zip64» с полями большего размера.[36]

Проводник в Windows XP не поддерживает ZIP64, но проводник в Windows Vista и более поздних версиях поддерживает.[нужна цитата ] Аналогичным образом, некоторые библиотеки расширений поддерживают ZIP64, например DotNetZip, QuaZIP.[37] и IO :: Compress :: Zip в Perl. Python Встроенный zip-файл поддерживает его с версии 2.5 и по умолчанию с версии 3.4.[38] Встроенный java.util.zip OpenJDK поддерживает ZIP64 от версии Java 7.[39] Android Java API поддерживает ZIP64 начиная с Android 6.0.[40] Утилита архивирования Mac OS Sierra, в частности, не поддерживает ZIP64 и может создавать поврежденные архивы, когда потребуется ZIP64.[41] Однако команда ditto, поставляемая с Mac OS, распакует файлы ZIP64.[42] Более свежий[когда? ] версии Mac OS поставляются с инструментами командной строки info-zip zip и unzip, которые действительно поддерживают Zip64: чтобы проверить, запустите zip -v и найдите «ZIP64_SUPPORT».

Сочетание с другими форматами файлов

В .ZIP формат файла допускает комментарий, содержащий до 65 535 (216-1) байтов данных, которые должны располагаться в конце файла после центрального каталога.[31] Кроме того, поскольку центральный каталог определяет смещение каждого файла в архиве относительно начала, возможно, что первая запись файла начинается со смещения, отличного от нуля, хотя некоторые инструменты, например gzip, не будет обрабатывать архивные файлы, которые не начинаются с записи файла с нулевым смещением.

Это позволяет произвольным данным находиться в файле как до, так и после данных архива ZIP, а также для чтения архива приложением ZIP. Побочным эффектом этого является то, что можно создать файл, который является одновременно рабочим ZIP-архивом и другим форматом, при условии, что другой формат допускает произвольные данные в его конце, начале или середине. Самораспаковывающиеся архивы (SFX) в форме, поддерживаемой WinZip, воспользуйтесь этим преимуществом, поскольку они являются исполняемыми (.исполняемый файл), которые соответствуют спецификации PKZIP AppNote.txt и могут быть прочитаны совместимыми инструментами или библиотеками zip.

Это свойство .ZIP формат и формат JAR, который является вариантом ZIP, могут быть использованы для сокрытия мошеннического содержимого (например, вредоносных классов Java) внутри, казалось бы, безобидного файла, такого как изображение GIF, загруженное в Интернет. Это так называемое GIFAR exploit был продемонстрирован как эффективная атака на веб-приложения, такие как Facebook.[43]

Пределы

Минимальный размер .ZIP файл имеет размер 22 байта. Такой пустой zip файл содержит только конец записи центрального каталога (EOCD):
[0x50,0x4B, 0x05,0x06,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00]

Максимальный размер архивного файла и отдельных файлов внутри него составляет 4294967295 байт (232-1 байт, или 4 ГиБ минус 1 байт) для стандартного ZIP. Для ZIP64 максимальный размер 18 446 744 073 709 551 615 байт (264-1 байт, или 16 EiB минус 1 байт).[44]

Собственные расширения

Дополнительное поле

.ZIP Формат файла включает в себя дополнительные поля в заголовках файлов, которые можно использовать для хранения дополнительных данных, не определенных существующими спецификациями ZIP, и которые позволяют совместимым архиваторам, не распознающим поля, безопасно пропускать их. Идентификаторы заголовков 0–31 зарезервированы для использования PKWARE. Остальные идентификаторы могут использоваться сторонними поставщиками для собственного использования.

Сильный спор о шифровании

Когда WinZip Публичная бета-версия 9.0 была выпущена в 2003 году, WinZip представил свою собственную AES-256 шифрование с использованием другого формата файла вместе с документацией по новой спецификации.[45] Сами стандарты шифрования не были проприетарный, но PKWARE не обновлял APPNOTE.TXT, чтобы включить в него спецификацию строгого шифрования (SES) с 2001 года, которая использовалась PKZIP версий 5.0 и 6.0. Технический консультант WinZip Кевин Кирни и Набить его Менеджер по продукту Мэтью Ковингтон обвинил PKWARE в удержании SES, но технический директор PKZIP Джим Петерсон заявил, что шифрование на основе сертификатов все еще не завершено.

В другом спорном движении, PKWARE подал заявку на патент на 16 июля 2003 года, описывающим способ объединения ZIP и сильное шифрования для создания защищенного файла.[46]

В конце концов, PKWARE и WinZip согласились поддерживать продукты друг друга. 21 января 2004 года PKWARE объявила о поддержке формата сжатия AES на основе WinZip.[47] В более поздней версии бета-версии WinZip он мог поддерживать файлы ZIP на основе SES.[48] PKWARE в конечном итоге выпустила для общественности версию 5.2 Спецификации формата файла .ZIP, которая документировала SES. В Бесплатно программное обеспечение проект 7-молния также поддерживает AES, но не SES в ZIP-файлах (как и его POSIX порт p7zip ).

При использовании шифрования AES в WinZip для метода сжатия всегда устанавливается значение 99, при этом фактический метод сжатия сохраняется в дополнительном поле данных AES.[49] В отличие от этого, Strong Encryption Specification хранит метод сжатия в сегменте базового заголовка файла в Local Header и Central Directory, если только Central Directory Encryption не используется для маскировки / шифрования метаданных.

Выполнение

Доступно множество инструментов .ZIP и множество библиотек .ZIP для различных сред программирования; используемые лицензии включают проприетарный и бесплатно программное обеспечение. WinZip, WinRAR, Info-ZIP, 7-молния, PeaZip и B1 Бесплатный архиватор - это хорошо известные инструменты .ZIP, доступные на различных платформах. Некоторые из этих инструментов имеют библиотечный или программный интерфейс.

Некоторые библиотеки разработки, лицензированные по соглашению с открытым исходным кодом: libzip, libarchive, и Info-ZIP. Для Java: Платформа Java, стандартная версия содержит пакет java.util.zip для обработки стандартных файлов .ZIP; библиотека Zip64File специально поддерживает файлы большого размера (более 4 ГБ) и обрабатывает файлы .ZIP с использованием произвольного доступа; и Apache Ant инструмент содержит более полную реализацию, выпущенную под Лицензия на программное обеспечение Apache.

В Info-ZIP реализации формата .ZIP добавляют поддержку функций файловой системы Unix, таких как идентификаторы пользователей и групп, права доступа к файлам и поддержка символических ссылок. В Apache Ant реализация знает об этом до такой степени, что может создавать файлы с предопределенными разрешениями Unix. Реализации Info-ZIP также знают, как использовать возможности исправления ошибок, встроенные в формат сжатия .ZIP. Некоторые программы этого не делают и не работают с файлом, в котором есть ошибки.

Инструменты Info-ZIP Windows также поддерживают NTFS файловая система разрешения, и будет пытаться перевести из разрешений NTFS в разрешения Unix или наоборот при извлечении файлов. Это может привести к потенциально непреднамеренным комбинациям, например .исполняемый файл файлы, создаваемые на томах NTFS с отказом в разрешении на выполнение.

Версии Microsoft Windows включают поддержку сжатия .ZIP в проводнике с момента Microsoft Plus! pack был выпущен для Windows 98. Microsoft называет эту функцию «Сжатые папки». Не все функции .ZIP поддерживаются функцией сжатых папок Windows. Например, шифрование не поддерживается в Windows 10 Home edition,[50] хотя может расшифровать. Кодировка записи Unicode не поддерживается до Windows 7, в то время как разделенные и составные архивы недоступны для чтения или записи с помощью функции сжатых папок, а также не поддерживается шифрование AES.[51]

Microsoft Office начал использовать формат zip-архива в 2006 году для своих Office Open XML .docx, .xlsx, .pptx и т. д., которые стали форматом файлов по умолчанию с Microsoft Office 2007.

Наследие

Существует множество других стандартов и форматов, в названии которых используется слово «zip». Например, застежка-молния отличается от gzip, а последний определен в IETF RFC  1952. И zip, и gzip в основном используют ВЫПУСКАТЬ алгоритм сжатия. Точно так же ZLIB формат (IETF RFC  1950 ) также использует алгоритм сжатия DEFLATE, но задает разные заголовки для проверки ошибок и согласованности. Другие распространенные форматы с одинаковыми названиями и программы с разными собственными форматами включают: 7-молния, bzip2, и rzip.

Обеспокоенность

Теоретический максимальный коэффициент сжатия для необработанного потока DEFLATE составляет примерно 1032 к одному,[52] но, используя формат ZIP непреднамеренным образом, можно создавать архивы ZIP с коэффициентами сжатия в миллиарды к одному. Эти молнии разархивировать до чрезвычайно больших размеров, что превышает возможности компьютера, на котором они распаковываются.[53]

Смотрите также

Рекомендации

  1. ^ а б c Регистрация нового MIME Content-Type / Subtype - application / zip, IANA, 20 июля 1993 г., получено 5 января 2012
  2. ^ "Филип Кац, пионер компьютерного программного обеспечения, 37 лет". Нью-Йорк Таймс'. 1 мая 2000 г.. Получено 14 июн 2009.
  3. ^ Мюррей, Мэтт; Танненбаум, Джеффри А. (15 августа 1997 г.). "Взлет и падение звезды программного обеспечения; Фил Кац любил код и алкоголь". Журнал "Уолл Стрит (онлайн-изд.). Архивировано из оригинал 4 марта 2016 г. Альтернативный URL Обновлено 19.06.2000.
  4. ^ а б "Библиотека документальных фильмов BBS". www.bbsdocumentary.com. Получено 25 сентября 2020.
  5. ^ а б Останься, Майкл. «Атаки ZIP с уменьшенным известным открытым текстом» (PDF). Math.ucr.edu. Архивировано из оригинал (PDF) 28 октября 2017 г.. Получено 9 сентября 2017.
  6. ^ Брайан Ливингстон (8 сентября 2003 г.), PKZip должен открыться, получено 5 января 2012, Формат файла ZIP бесплатно предоставляется в общественное достояние и не может быть востребован ни юридически, ни морально любым физическим, юридическим или юридическим лицом.
  7. ^ Откуда вообще взялись Zip-файлы?, Infinity Design Concepts, Inc., получено 5 января 2012
  8. ^ Пресс-релиз, 1989, получено 5 января 2012
  9. ^ Наш основатель - Фил Кац, PKWARE, заархивировано из оригинал 1 октября 2010 г., получено 5 января 2012
  10. ^ Гарет Хортон; Роб Вейр; Алекс Браун (2 ноября 2010 г.), sc34-wg1, получено 5 января 2012
  11. ^ .ZIP Примечание по применению, получено 20 июля 2012
  12. ^ Файл: APPNOTE.TXT - Спецификация формата файла .ZIP Версия: 4.5 Исправлено: 01.11.2001, 3 декабря 2001 г., архивировано из оригинал 3 декабря 2001 г., получено 21 апреля 2012
  13. ^ APPNOTE.TXT - спецификация формата файла .ZIP, версия: 5.2 - Уведомление об изменении, 16 июля 2003 г., получено 5 января 2012
  14. ^ Файл: APPNOTE.TXT - Спецификация формата файла .ZIP Версия: 5.2 - Уведомление об изменении - Пересмотрено: 02.06.2003, 2 июля 2003 г., архивировано из оригинал 2 июля 2003 г., получено 21 апреля 2012
  15. ^ Файл: APPNOTE - Спецификация формата файла .ZIP Версия: 6.1.0 - Уведомление об изменении - Редакция: 20.01.2004, 19 августа 2004 г., архивировано из оригинал 19 августа 2004 г., получено 21 апреля 2012
  16. ^ APPNOTE.TXT - Спецификация формата файла .ZIP, Версия: 6.2.0 - Уведомление об изменении, 26 апреля 2004 г., получено 5 января 2012
  17. ^ APPNOTE.TXT - спецификация формата файла .ZIP, версия: 6.3.0, 29 сентября 2006 г., получено 5 января 2012
  18. ^ APPNOTE.TXT - спецификация формата файла .ZIP, версия: 6.3.1, 11 апреля 2007 г., получено 25 июн 2018
  19. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.2, 28 сентября 2007 г., получено 25 июн 2018
  20. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.3, 1 сентября 2012 г., получено 25 июн 2018
  21. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.4, 1 октября 2014 г., получено 25 июн 2018
  22. ^ а б c APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.5, 20 декабря 2018, получено 3 января 2019
  23. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.6, 26 апреля 2019, получено 3 января 2019
  24. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.7, 1 июня 2020, получено 6 июн 2020
  25. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.8, 15 июнь 2020, получено 7 июля 2020
  26. ^ APPNOTE.TXT - спецификация формата файла .ZIP Версия: 6.3.9, 15 июля 2020, получено 8 августа 2020
  27. ^ «Спецификация дополнительных методов сжатия». WinZip. Мэнсфилд, Коннектикут: WinZip Computing, S.L. 19 мая 2009 года. Получено 24 мая 2009.
  28. ^ "Что такое Zipx-файл?". Winzip: база знаний. Мэнсфилд, Коннектикут: WinZip Computing, S.L. 13 августа 2010 г.. Получено 17 августа 2010.
  29. ^ «ISO / IEC JTC 1 / SC 34 - Описание документов и языки обработки» (PDF). 12 апреля 2010. Архивировано с оригинал (PDF) 12 мая 2014 г.. Получено 10 мая 2014.
  30. ^ «Файл-контейнер документа ISO / IEC 21320-1: 2015 - Часть 1: Ядро». ITTF. 2015 г.
  31. ^ а б c d е ж "Файл: APPNOTE.TXT - Спецификация формата файла .ZIP: Версия: 6.3.4" (ТЕКСТ). Pkware.com. Получено 9 сентября 2017.
  32. ^ Адлер, Марк. «Как связаны zlib, gzip и zip? Что у них общего и чем они отличаются?». Получено 27 ноября 2018.
  33. ^ «Часто задаваемые вопросы о zlib». zlib. PKWare DCL использует совершенно другой формат сжатых данных, чем PKZIP и zlib. Однако вы можете найти возможное решение вашей проблемы в каталоге contrib / blast zlib. (вклад / взрыв )
  34. ^ «Информация о шифровании AES: спецификация шифрования AE-1 и AE-2». Winzip.com. Получено 9 сентября 2017.
  35. ^ «APPNOTE - PKZIP / SecureZIP - Сайт поддержки PKWARE». Pkware.com. Получено 9 сентября 2017.
  36. ^ "Файл: APPNOTE.TXT - Спецификация формата файла .ZIP: Версия: 6.3.4" (ТЕКСТ). Pkware.cachefly.net. Получено 9 сентября 2017.
  37. ^ «Изменения QuaZIP». 22 января 2014 г.. Получено 25 января 2014.
  38. ^ «Улучшение Python: по умолчанию использовать allowZip64 = True (3.4)». Получено 6 мая 2014.
  39. ^ Шен, Сюэмин (17 апреля 2009 г.). «ZIP64, теперь поддерживается формат> 4G Zipfile». Блог Сюэмин Шэнь. Sun Microsystems. Получено 27 сентября 2010.
  40. ^ «Войти - Аккаунты Google». code.google.com. Получено 9 сентября 2017.
  41. ^ «Ошибка: неверная подпись заголовка файла центрального каталога при распаковке больших файлов, заархивированных Mac OS. Проблема № 69 · thejoshwolfe / yauzl». GitHub.
  42. ^ «Извлеките большой zip-файл (50 ГБ) в Mac OS X». Получено 17 декабря 2018.
  43. ^ Макмиллан, Роберт. «Фотография, которая может украсть ваши учетные данные в Интернете». Infoworld.com. Получено 9 сентября 2017.
  44. ^ «ZipArchive: формат Zip64: выход за пределы размеров файлов и количества файлов и сегментов». Artpol-software.com. Получено 9 сентября 2017.
  45. ^ «WinZip - информация о шифровании AES». Winzip.com. Получено 9 сентября 2017.
  46. ^ Макмиллан, Роберт (25 июля 2003 г.). «PKWare подает заявку на патент на формат файла .zip». InfoWorld.com. Архивировано из оригинал 10 августа 2003 г.. Получено 16 июн 2008.
  47. ^ "Разработчики программного обеспечения исправляют Zip tiff". News.com. Получено 9 сентября 2017.
  48. ^ Джон Лейден. "Взломано шифрование Zip-файла". Theregister.co.uk. Получено 9 сентября 2017.
  49. ^ «Информация о шифровании AES: спецификация шифрования AE-1 и AE-2». Winzip.com. Получено 9 сентября 2017.
  50. ^ Махам Мухтар (август 2017 г.). "2 способа исправить" зашифровать содержимое для защиты данных "вариант, выделенный серым цветом в Windows 10". iTechtics. EFS доступна для всех выпусков Windows 10, кроме выпуска Windows 10 Home.
  51. ^ «Почему поддержка сжатых папок Windows (Zip-папок) застряла на рубеже веков?». 15 мая 2018.
  52. ^ "Технические подробности zlib". Получено 10 июля 2019.
  53. ^ Смит, Эрни (10 июля 2019 г.). "Самая умная из когда-либо созданных" Zip Bomb "взрывает файл размером 46 МБ до 4,5 петабайт". Материнская плата. Vice Media. Получено 10 июля 2019.

внешняя ссылка

Технические характеристики формата: