ПРОНОМ - PRONOM

ПРОНОМ (Государственный архив и Nôm 喃 ) [1] это сеть -на основе технического реестра для поддержки цифровое сохранение услуги, разработанные Национальный архив Соединенного Королевства. ПРОНОМ был первым и до сих пор остается единственным действующим публичным формат файла реестр в мире,[2][3] хотя репозиторий "Magic File" Файловая команда исполнял эту роль в менее формальном качестве в течение двух десятилетий. Другие проекты по развитию технических реестров, в том числе в Великобритании Цифровой центр курирования Реестр информации о представительствах и Глобальный реестр цифровых форматов проект в Гарвардский университет, сейчас в процессе.

PRONOM берет свое начало в требовании иметь доступ к надежной технической информации об электронных записях, хранящихся в Национальном архиве. По определению, электронные записи не могут быть прочитаны человеком - форматы файлов кодируют информацию в форму, которая может быть обработана и сделана понятной только в очень специфических технологических средах. Поэтому доступность этой информации очень уязвима для технологическое устаревание. Техническая информация о структуре этих форматов файлов и программного обеспечения и аппаратное обеспечение Таким образом, среда, необходимая для их поддержки, является предпосылкой для любого режима цифрового хранения.[4] PRONOM был разработан для обеспечения этой функции, первоначально как внутренний ресурс для сотрудников Национального архива, а затем как общедоступный сетевой ресурс.


Разработка

Первая версия ПРОНОМ была разработана отделом цифрового хранения Национального архива под руководством Адриан Браун в марте 2002 года. PRONOM 2 был выпущен в декабре 2002 года и обеспечивал поддержку разработки многоязычных версий реестра. Включение PRONOM (PRONOM 3) в Интернет в феврале 2004 г. стало отправной точкой для развития PRONOM как основного онлайн-ресурса для международного сообщества по сохранению цифровых данных.[5][6]

PRONOM 4, выпущенный в октябре 2005 года, включает в себя значительную переработку базовой модели данных, позволяющую собирать подробную техническую информацию о форматах файлов и поддерживать будущую совместимость с другими запланированными системами реестра, а также выпуск программного обеспечения DROID для автоматической идентификации формата файлов. .

Последняя версия PRONOM 5 была относительно небольшим обновлением для поддержки улучшений DROID и была выпущена в 2006 году. На 2007 год запланировано гораздо более существенное обновление, которое будет включать в себя раскрытие основных функций PRONOM через веб-сервисы интерфейсы. Эта работа является частью программы «Бесшовный поток», направленной на то, чтобы Национальный архив мог получать и управлять будущими правительственными документами в электронных форматах.

В будущем ПРОНОМ может участвовать в качестве узла в запланированных Глобальный реестр цифровых форматов проект.

Национальный архив стал победителем конкурса 2007 г. Премия за цифровую сохранность спонсируется Коалиция цифрового сохранения, за работу над PRONOM и DROID.[7]

Услуги

Основной технический реестр поддерживает ряд конкретных услуг:

Реестр PRONOM предоставляет доступную для поиска веб-базу данных технической информации о форматах файлов, программных инструментах, необходимых для доступа к ним, и технических средах, необходимых для доступа к ним. Пользователи могут искать форматы и программное обеспечение, используя множество критериев, таких как формат или название программного обеспечения и расширение файла. PRONOM также хранит информацию о периодах поддержки программных продуктов, и на этой основе их можно запросить. Помимо просмотра на экране, информацию реестра можно экспортировать в XML, CSV и удобные для печати форматы. Веб-сайт PRONOM позволяет пользователям отправлять новую информацию для включения в PRONOM.

Схема постоянного уникального идентификатора (PUID) PRONOM

Постоянный уникальный идентификатор (PUID) PRONOM - это расширяемая схема постоянного, уникального и однозначного идентификаторы для записей в реестре ПРОНОМ. Такие идентификаторы имеют основополагающее значение для обмена цифровыми объектами и управления ими, поскольку позволяют человеческим или автоматизированным пользовательским агентам однозначно идентифицировать и совместно использовать эту идентификацию информации представления, необходимой для поддержки доступа к объекту. Это достоинство как неотъемлемой уникальности идентификатора, так и его привязки к окончательному описанию информации представления в реестре, таком как PRONOM.

В настоящее время схема PUID ограничена одним конкретным классом информации представления: формат в котором закодирован цифровой объект. Форматы считались особым приоритетом для такой схемы, поскольку ни одна из существующих универсально применимых систем не предусматривает этого. Unix магические числа и Macintosh вилки данных действительно предоставляют некоторые из этих функций, но это не так в ДОС или Майкрософт Виндоус среды. Трехзначный расширение файла не является ни стандартизированным, ни уникальным и интерпретируется по-разному в разных средах. В равной степени IANA MIME Схема -type не обеспечивает достаточной детализации или покрытия для удовлетворения требований к уникальным идентификаторам. Схема PUID была разработана с единственной целью - предоставлять такие идентификаторы.

Схема была принята в качестве рекомендуемой схемы кодирования для описания форматов файлов в последней версии Стандарт метаданных электронного правительства Великобритании.[8] Схема разработана с возможностью расширения и может быть расширена в будущем для включения других классов информации представления в PRONOM, таких как методы сжатия, схемы кодировки символов, и операционные системы.

PUID могут быть выражены как Унифицированные идентификаторы ресурсов с использованием информация: pronom / пространство имен, подробности о котором доступны в информация URI реестр. Ни схема PUID, ни ее выражение в виде информационного URI не поддерживает какой-либо внутренний механизм разыменования, то есть PUID не разрешается в Единый указатель ресурсов. Тем не менее, Национальный архив планирует разработать ряд служб для раскрытия содержимого реестра PRONOM, включая службу разрешения для PUID.

ДРОИД

DROID (Digital Record Object Identification) - это программный инструмент, разработанный Национальным архивом для автоматической пакетной идентификации форматов файлов. Это один из запланированных инструментов, использующих PRONOM для предоставления определенных услуг цифрового хранения. DROID использует внутренние (последовательность байтов) и внешние (расширение файла) подписи, чтобы идентифицировать и сообщать о версиях цифровых файлов определенного формата. Эти подписи хранятся в файле подписи XML, созданном на основе информации, записанной в техническом реестре PRONOM. В PRONOM регулярно добавляются новые и обновленные подписи, и DROID можно настроить для автоматической загрузки обновленных файлов подписей с веб-сайта PRONOM через веб-сервисы.

DROID позволяет выбирать файлы и папки из файловой системы для идентификации. После запуска процесса идентификации результаты можно вывести в XML, CSV или удобные для печати форматы.

DROID не зависит от платформы Ява орудие труда. Он включает документированный, общедоступный API, и может быть вызван как из GUI и командная строка интерфейсы.

Будущие услуги

Предлагаемые будущие услуги включают оценку рисков форматов и планирование сохранения, а также автоматическое создание путей миграции для преобразования между форматами.[9]

Смотрите также

Рекомендации

  1. ^ "Комментарий к происхождению имени от @realadrianbrown".
  2. ^ "Простите ... Некоторые заблуждения о сохранении цифровых данных?". ariadne.ac.uk.
  3. ^ Ван Вейнгаарден, Х. (2005) Форматирование реестров, CASHMERE-int Семинар по консервации и DC-инструментам: стандарты и деятельность по стандартизации, Геттинген: 6
  4. ^ «Содержание». clir.org.
  5. ^ «OCLC: Всемирный библиотечный кооператив, принадлежащий членам - Global». rlg.org. Архивировано из оригинал на 2007-09-27. Получено 2006-07-21.
  6. ^ Янсен, Адам (26 апреля 2019 г.), "Адриан Браун (1969–)" в Дуранти, Лучиана; Франкс, Патрисия К. (ред.), Энциклопедия архивных писателей, 1515-2015 гг., Rowman & Littlefield Publishers, ISBN  978-1-5381-2580-9, получено 22 ноября 2020
  7. ^ CyberMedia. «404 - Коалиция цифрового сохранения». dpconline.org. Архивировано из оригинал на 2007-07-04.
  8. ^ Стандарт метаданных электронного правительства Великобритании
  9. ^ «OCLC: Всемирный библиотечный кооператив, принадлежащий членам - Global». rlg.org.

внешняя ссылка