План управления данными - Data management plan

А план управления данными или же DMP официальный документ, в котором описывается, как данные должны обрабатываться как во время исследовательского проекта, так и после его завершения.[1] Цель плана управления данными - учесть многие аспекты управление данными, метаданные генерация, сохранение данных и анализ перед началом проекта;[2] это может привести к правильному управлению данными в настоящее время,[нужна цитата ] и подготовлен к сохранению в будущем.

Первоначально DMP использовались в 1966 году для управления сбором и анализом данных в авиационных и инженерных проектах, а в 1970-х и 1980-х годах расширились на инженерные и научные дисциплины. Вплоть до начала 2000-х годов DMP использовались «для проектов большой технической сложности и для ограниченных целей сбора и обработки данных в середине исследования».[3] В 2000-е годы и позже Электронное исследование а экономическая политика стимулировала разработку и внедрение DMP.[3]

Важность

Подготовка плана управления данными перед сбором данных требуется для обеспечения того, чтобы данные были в правильном формате, хорошо организованы и лучше аннотированы.[4] Возможно, это может сэкономить время в долгосрочной перспективе, потому что нет необходимости реорганизовывать, переформатировать или пытаться запомнить детали о данных. Также утверждается, что это повышает эффективность исследований, поскольку как сборщик данных, так и другие исследователи могут понимать и использовать хорошо аннотированные данные в будущем. Одним из компонентов плана управления данными является архивирование и сохранение данных. Заблаговременно приняв решение об архивировании, сборщик данных может форматировать данные во время сбора, чтобы упростить их последующую отправку в базу данных. Если данные сохраняются, они более актуальны, поскольку могут быть повторно использованы другими исследователями. Это также позволяет сборщику данных направлять запросы данных в базу данных, а не адресовать запросы индивидуально. Частым аргументом в пользу сохранения является то, что сохраняемые данные могут привести к новым, непредвиденным открытиям и предотвратить дублирование уже проведенных научных исследований. Архивирование данных также обеспечивает страховку от потери сборщиком данных.

В 2010-е годы[3] финансирующие агентства все чаще требовали планов управления данными в рамках процесса подачи заявок и оценки,[5] несмотря на небольшое количество доказательств их эффективности или их отсутствие.[3]

Основные компоненты

«Нет общего и окончательного списка тем, которые должны быть охвачены в DMP для исследовательского проекта»,[6] и исследователи часто сами решают, как заполнить DMP.[2]

Информация о данных и формате данных

  • Описание данных, которые будут произведены в рамках проекта.[7] Это может включать (но не ограничивается) следующие данные:
    • Экспериментальный
    • Наблюдательный
    • Сырой или производный
    • Физические коллекции
    • Модели
    • Симуляции
    • Учебные материалы
    • Программного обеспечения
    • Изображений
  • Как будут получены данные? Когда и где они будут приобретены?
  • Как будут обрабатываться данные после сбора? Включите информацию о
  • Форматы файлов, которые будут использоваться, обосновывают эти форматы и описывают используемые соглашения об именах.[8]
  • Меры по обеспечению и контролю качества, которые будут приняты во время сбора, анализа и обработки проб.
  • Если используются существующие данные, каковы их источники? Как собранные данные будут сочетаться с существующими данными? Какая связь между собранными и существующими данными?
  • Как будут управлять данными в краткосрочной перспективе? Учтите следующее:
    • Управление версиями для файлов[9]
    • Резервное копирование данных и продуктов данных
    • Безопасность и защита данных и информационных продуктов
    • Кто будет отвечать за управление

Содержание и формат метаданных

Метаданные контекстные детали, включая любую информацию, важную для использования данных. Это может включать описания временных и пространственных деталей, инструментов, параметров, единиц измерения, файлов и т. Д. Метаданные обычно называют «данными о данных».[10] Следует рассмотреть следующие вопросы:

  • Насколько подробными должны быть метаданные, чтобы сделать данные значимыми?
  • Как будут создаваться и / или фиксироваться метаданные? Примеры включают лабораторные ноутбуки, портативные устройства GPS, автосохранение файлов на приборах и т. Д.
  • Какой формат будет использоваться для метаданных? Какие стандарты метаданных обычно используется в соответствующей научной дисциплине? Должно быть обоснование выбранного формата.

Политики доступа, совместного использования и повторного использования

  • Опишите любые обязательства, которые существуют в отношении обмена собранными данными. Сюда могут входить обязательства финансирующих агентств, институтов, других профессиональных организаций и юридические требования.
  • Включите информацию о том, как данные будут передаваться, в том числе о том, когда данные будут доступны, как долго они будут доступны, как можно получить доступ и какие права, которые сборщик данных оставляет за собой для использования данных.
  • Решайте любые этические проблемы или проблемы конфиденциальности с помощью обмена данными
  • Адрес интеллектуальная собственность & Авторские права вопросы. Кому принадлежат авторские права? Какая политика организации, издателя и / или финансирующего агентства связана с интеллектуальной собственностью? Существуют ли эмбарго по политическим, коммерческим или патентным причинам?
  • Опишите предполагаемое будущее использование / пользователей данных
  • Укажите, как другие должны цитировать данные. Как будет решаться проблема постоянного цитирования? Например, если данные будут помещены в публичный архив, будет ли набор данных иметь идентификатор цифрового объекта (doi) назначено на это?

Долгосрочное хранение и управление данными

  • Исследователи должны найти подходящий архив для долгосрочного хранения своих данных. Идентифицируя архив на ранней стадии проекта, данные могут быть отформатированы, преобразованы и задокументированы соответствующим образом в соответствии с требованиями архива. Исследователи должны проконсультироваться с коллегами и профессиональными сообществами в своей области, чтобы определить наиболее подходящую базу данных, и включить архив резервных копий в свой план управления данными на случай, если их первый выбор перестанет существовать.
  • В начале проекта основной исследователь должен определить, какие данные будут сохранены в архиве. Обычно желательно сохранять данные в их наиболее сыром виде, хотя производные данные и продукты также могут быть сохранены.
  • Физическое лицо должно быть указано в качестве основного контактного лица для архивных данных и обеспечивать постоянное обновление контактной информации в случае запросов данных или информации о данных.

Бюджет

Затраты на управление данными и их хранение могут быть значительными, в зависимости от характера проекта. Заранее предвидя расходы, исследователи гарантируют, что данные будут правильно обрабатываться и архивироваться. Возможные расходы, которые следует учитывать:

  • Время персонала на подготовку, управление, документирование и сохранение данных
  • Аппаратное и / или программное обеспечение, необходимое для управления данными, резервного копирования, безопасности, документирования и сохранения.
  • Затраты, связанные с отправкой данных в архив

План управления данными должен включать в себя способ оплаты этих затрат.

План управления данными NSF

Все заявки на гранты поданы в NSF должен включать план управления данными объемом не более двух страниц.[11] Это дополнение (не является частью 15-страничного предложения) и должно описывать, как предложение будет соответствовать политике присуждения и Руководства администратора (см. Ниже). Он может включать следующее:

  1. Типы данных
  2. Стандарты, которые будут использоваться для формата и содержания данных и метаданных
  3. Политики доступа и совместного использования
  4. Правила и положения для повторного использования
  5. Планы по архивированию данных

Политика кратко из NSF Руководство по награде и администрации, раздел 4 (Распространение и совместное использование результатов исследований):[12]

  1. Оперативно опубликуйте с указанием соответствующего авторства
  2. Делитесь данными, образцами, физическими коллекциями и вспомогательными материалами с другими в разумные сроки
  3. Делитесь программным обеспечением и изобретениями
  4. Следователи могут сохранить свои законные права на свою интеллектуальную собственность, но они все равно должны сделать свои результаты, данные и коллекции доступными для других.
  5. Политики будут реализованы через
    1. Обзор предложения
    2. Премиальные переговоры и условия
    3. Поддержка / стимулы

План управления данными ESRC

С 1995 г. Совет по экономическим и социальным исследованиям (ESRC) разработала политику в отношении данных об исследованиях. В текущей Политике данных исследований ESRC говорится, что данные исследований, созданные в результате исследований, финансируемых ESRC, должны быть в максимально возможной степени открыты для научного сообщества посредством длительного хранения и управления данными высокого качества.[13]

ESRC требует наличия плана управления данными для всех заявок на получение награды за исследования, в которых создаются новые данные. Такие планы предназначены для продвижения структурированного подхода к управлению данными на протяжении всего жизненного цикла данных, что приводит к повышению качества данных, которые готовы к архивированию для совместного использования и повторного использования. В Служба данных Великобритании, флагманская служба данных ESRC, предоставляет практические рекомендации по планированию управления данными исследований, подходящие для исследователей социальных наук в Великобритании и во всем мире.[14][15]

ESRC имеет давние договоренности с Архив данных Великобритании, на основе Университет Эссекса, как место хранения данных исследований, при этом обладатели наград должны предоставлять данные, полученные в результате их грантов на исследования, через Службу данных Великобритании.[16] Архив позволяет повторно использовать данные, сохраняя данные и делая их доступными для исследовательского и преподавательского сообщества.

Преимущества

В литературе выделяются три основные темы с точки зрения преимуществ DMP: профессиональные преимущества, экономические преимущества и институциональные преимущества.[3] Утверждалось, что DMP могут стать катализатором для исследователей в улучшении их информационная грамотность и методы управления данными, часто при поддержке библиотеки.[3]

На практике

Однако на практике DMP часто не достигают поставленных целей. Обзор политик DMP, проведенный в 2012 году спонсорами исследований, показал, что политикам не хватало нескольких элементов из Цифровой центр курирования Список критериев для DMP.[17] Исследователи поделились текстом DMP.[18] DMP часто рассматриваются как «административное мероприятие, а не как неотъемлемая часть» исследовательского процесса.[19] и было признано, что DMP не гарантируют хорошего управление данными практики.[20] Большинству спонсоров не требуется DMP после предоставления грантов, что лишает заинтересованные стороны мощного инструмента, которым может быть активный DMP. Лучшей практикой было бы «требовать ведения плана управления данными после присуждения контракта и во время активной фазы исследования».[6] В настоящее время планы обмена данными для спонсоров более важны, чем планы управления данными.[6]

Смотрите также

Рекомендации

  1. ^ «Управление данными исследований - Служба данных исследований библиотеки Университета Вирджинии + наука». www2.lib.virginia.edu.
  2. ^ а б Бернетт, Маргарет; Уильямс, Сара; Имкер, Хайди (16 сентября 2016 г.). «От плана к действию: успешная реализация плана управления данными в междисциплинарном проекте». Журнал библиотечного дела электронной науки. 5 (1): e1101. Дои:10.7191 / jeslib.2016.1101.
  3. ^ а б c d е ж Смейл, Николас; Ансуорт, Кэтрин; Денайер, Гарет; Барр, Дэниел (17 октября 2018 г.). «История, пропаганда и эффективность планов управления данными». bioRxiv: 443499. Дои:10.1101/443499. S2CID  91931719.
  4. ^ «Зачем управлять данными и делиться ими? - Управление данными». библиотеки.mit.edu.
  5. ^ «Управление данными и обмен часто задаваемыми вопросами (FAQ)». Архивировано из оригинал на 2017-07-11. Получено 2018-04-06.
  6. ^ а б c Уильямс, Мэри; Багвелл, Жаклин; Нахм Зозус, Мередит (июль 2017 г.). «Планы управления данными: упущенная перспектива». Журнал биомедицинской информатики. 71: 130–142. Дои:10.1016 / j.jbi.2017.05.004. ЧВК  6697079. PMID  28499952.
  7. ^ «Элементы плана управления данными». www.icpsr.umich.edu. Получено 2015-09-30.
  8. ^ https://web.archive.org/web/20180504061125/https://libraries.mit.edu/data-management/files/2014/05/file-organization-july2014.pdf
  9. ^ https://www.fosteropenscience.eu/sites/default/files/pdf/1382.pdf
  10. ^ Michener, WK и JW Brunt. 2000 г. Экологические данные: проектирование, управление и обработка. Blackwell Science, 180 стр.
  11. ^ "GPG Глава II". www.nsf.gov.
  12. ^ «Распространение и обмен результатами исследований - NSF - Национальный научный фонд». www.nsf.gov.
  13. ^ Политика ESRC по данным исследований 2010
  14. ^ Подготовка данных и управление ими: рекомендации Службы данных Великобритании
  15. ^ «Управление данными исследований и обмен ими - SAGE Publications Inc». www.sagepub.com.[мертвая ссылка ]
  16. ^ "Архив данных Великобритании - КТО МОЖЕТ ЗАЛОЖИТЬ?". www.data-archive.ac.uk.
  17. ^ Дитрих, Дайанна; Адамус, Триша; Шахтер, Элисон; Стейнхарт, Гейл (2012). «Демистификация требований к управлению данными спонсоров исследований». Проблемы научно-технического библиотечного дела. 70. Дои:10.5062 / F44M92G2.
  18. ^ Пархэм, Сьюзан Уэллс; Доти, Крис (октябрь 2012 г.). «Анализ контента NSF DMP: что говорят исследователи?». Бюллетень Американского общества информационных наук и технологий. 39 (1): 37–38. Дои:10.1002 / bult.2012.1720390113.
  19. ^ Микса, Томаш; Симмс, Стефани; Митчен, Даниэль; Джонс, Сара (28 марта 2019 г.). «Десять принципов для машинных планов управления данными». PLOS вычислительная биология. 15 (3): e1006750. Дои:10.1371 / journal.pcbi.1006750. PMID  30921316. S2CID  85563774.
  20. ^ Донелли, Мартин (2012). «Планы управления данными и планирование». В Прайоре, Грэхеме (ред.). Управление данными исследований. Лондон: Facet Publishing. С. 83–104. ISBN  9781856048910.

дальнейшее чтение

Прайор, Грэм (2014). Предоставление услуг по управлению данными исследований. Facet Publishing. ISBN  9781856049337.

внешняя ссылка