Информатика биоразнообразия - Википедия - Biodiversity informatics

Информатика биоразнообразия это применение информатика методы для информация о биоразнообразии, Такие как таксономия, биогеография или же экология. Современные компьютерные технологии могут дать новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. нишевое моделирование ). Информатика биоразнообразия - это термин, который появился только в 1992 году, но с быстро растущими наборами данных он стал полезен во многих исследованиях и приложениях, таких как построение таксономические базы данных или же географические информационные системы. Информатика биоразнообразия контрастирует с "биоинформатика ", который часто используется как синоним компьютеризированной обработки данных в специализированной области молекулярная биология.

Обзор

Информатика биоразнообразия (другая, но связанная с биоинформатикой) - это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатике биоразнообразия также, возможно, придется справляться с управлением информацией от неназванных таксонов, например, полученной путем отбора проб окружающей среды и определения последовательности смешанных проб. Термин «информатика биоразнообразия» также используется для обозначения вычислительные проблемы специфические для названий биологических объектов, такие как разработка алгоритмов для работы с вариантными представлениями идентификаторов, таких как названия видов и авторитетные источники, а также множественные схемы классификации, в которых эти объекты могут находиться в соответствии с предпочтениями различных специалистов в этой области, а также синтаксис и семантика, с помощью которых контент в таксономических базах данных может быть сделан машинным запросом и совместимым для целей информатики биоразнообразия ...

История дисциплины

Можно считать, что информатика биоразнообразия началась с создания первого компьютеризированного таксономические базы данных в начале 1970-х и прогрессировал за счет последующей разработки инструментов распределенного поиска к концу 1990-х, включая Species Analyst из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN, CONABIO в Мексике и другие,[1] создание Глобальный информационный фонд по биоразнообразию в 2001 году, и параллельное развитие ряда нишевое моделирование и другие инструменты для работы с оцифрованными данными о биоразнообразии с середины 1980-х годов (например, см. [2]). В сентябре 2000 г. журнал США Наука посвятил специальный выпуск «Биоинформатике для биоразнообразия»,[3] журнал «Информатика биоразнообразия» начал публиковаться в 2004 году, а несколько международных конференций 2000-х годов собрали вместе специалистов-практиков в области информатики биоразнообразия, в том числе Лондонский электронная биосфера конференция в июне 2009 года. Приложение к журналу BMC Bioinformatics (Том 10 Приложение 14[4]), опубликованная в ноябре 2009 г., также посвящена информатике биоразнообразия.

История термина

Согласно переписке, воспроизведенной Уолтером Берендсоном,[5] термин «информатика биоразнообразия» был введен Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум информатики биоразнообразия, группы, занимающейся объединением основных биоразнообразие информация с экономика окружающей среды и геопространственной информации в виде GPS и ГИС. Впоследствии он, по-видимому, потерял всякую обязательную связь с миром GPS / ГИС и был связан с компьютеризированным управлением любыми аспектами информации о биоразнообразии (например, см. [6])

Цифровая таксономия (систематика)

Глобальный список всех видов

Одной из основных проблем в области информатики биоразнообразия в глобальном масштабе является отсутствие в настоящее время полного основного списка признанные в настоящее время виды мира, хотя это цель Каталог Жизни проект, имеющий ок. 1,65 миллиона видов из примерно 1,9 миллиона описанных видов в его Ежегодный контрольный список на 2016 год. Аналогичная попытка для таксонов ископаемых, База данных палеобиологии[7] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.

Научные названия родов и видов как уникальные идентификаторы

Применение Линнеевский система биномиальной номенклатуры для разновидность, и одночлены для роды и более высокие ранги, дало много преимуществ, но также и проблемы с омонимы (одно и то же имя используется для нескольких таксонов, случайно или законно в нескольких царствах), синонимы (несколько названий для одного и того же таксона), а также варианты представления одного и того же имени из-за орфографических различий, незначительных орфографических ошибок, вариаций в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться с течением времени из-за изменения таксономических мнений (например, правильного родового положения вида или повышения подвида до ранга вида или наоборот), а также ограниченность таксона может меняться в зависимости от к таксономическим концепциям разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни (LSID ) для машинно-машинной коммуникации, хотя у этого подхода есть как сторонники, так и противники.

Консенсусная классификация организмов

Организмы можно классифицировать множеством способов (см. Главную страницу Биологическая классификация ), которые могут создавать проблемы проектирования систем информатики биоразнообразия, нацеленных на включение единой или множественной классификации в соответствии с потребностями пользователей или на направление их к единой «предпочтительной» системе. Может ли когда-либо быть достигнута единая консенсусная система классификации, вероятно, открытый вопрос, однако Каталог жизни инициировал деятельность в этой области.[8] на смену которой пришла опубликованная система, предложенная в 2015 году М. Руджеро и его коллегами.[9]

Мобилизация первичной информации о биоразнообразии

«Первичную» информацию о биоразнообразии можно рассматривать как базовые данные о встречаемости и разнообразии видов (или, действительно, любых распознаваемых таксонов), обычно в сочетании с информацией об их распространении в пространстве, времени или в обоих случаях. Такая информация может быть в форме сохраненных образцов и связанной информации, например, собранной в коллекциях естествознания музеи и гербарии или в виде записей наблюдений, например, либо из официальных фаунистических или флористических исследований, проводимых профессиональными биологами и студентами, либо в качестве любительских и других запланированных или незапланированных наблюдений, включая те, которые все чаще попадают в сферу охвата гражданская наука. Обеспечение согласованного цифрового доступа в режиме онлайн к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примеры последних включают ОБИС и GBIF.

В качестве вторичного источника данных о биоразнообразии актуальные научная литература могут быть проанализированы либо людьми, либо (потенциально) специализированными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая сообщается в них, иногда в агрегированной / сводной форме, но часто в виде первичных наблюдений в описательной или табличной форме. Элементы такой деятельности (например, извлечение ключевых таксономических идентификаторов, ключевые слова / условия индекса и т. д.) многие годы практикуются на более высоком уровне избранными академические базы данных и поисковые системы. Однако для максимальной ценности информатики биоразнообразия в идеале следует извлечь фактические данные о первичных встречах, а затем сделать их доступными в стандартизированной форме или формах; например, как Plazi и ИНОТАКСА проекты превращают таксономическую литературу в XML форматы, которые затем могут быть прочитаны клиентскими приложениями, первые используют ТаксонX-XML а последний - в формате taXMLit. В Библиотека наследия биоразнообразия также добивается значительного прогресса в своей цели по оцифровке значительной части таксономической литературы, не защищенной авторским правом, которая затем подвергается OCR (оптическое распознавание символов) для дальнейшей обработки с использованием инструментов информатики биоразнообразия.

Стандарты и протоколы

Как и другие дисциплины, связанные с данными, информатика биоразнообразия выигрывает от принятия соответствующих стандарты и протоколы для поддержки машинно-машинной передачи и взаимодействия информации в пределах своей конкретной области. Примеры соответствующих стандартов включают Ядро Дарвина XML схема для данных о биоразнообразии на основе образцов и наблюдений, разработанных с 1998 года и далее, а также их расширений, Схема передачи таксономических понятий, плюс стандарты для Структурированные описательные данные и Доступ к данным биологической коллекции (ABCD); в то время как протоколы поиска и передачи данных включают DiGIR (сейчас в основном заменено) и ТАПИР (Протокол доступа TDWG для поиска информации). Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Рабочая группа по таксономическим базам данных (TDWG).

Текущая деятельность

На конференции «Электронная биосфера» в Великобритании в 2009 г.[10] были приняты следующие темы, что свидетельствует о широком спектре текущих мероприятий в области информатики биоразнообразия и о том, как их можно разделить на категории:

  • Применение: сохранение / сельское хозяйство / рыболовство / промышленность / лесное хозяйство
  • Применение: инвазивные чужеродные виды
  • Применение: систематическая и эволюционная биология
  • Применение: системы таксономии и идентификации
  • Новые инструменты, услуги и стандарты для управления данными и доступа к ним
    • Новые инструменты моделирования
    • Новые инструменты для интеграции данных
    • Новые подходы к инфраструктуре биоразнообразия
    • Новые подходы к определению видов
    • Новые подходы к картированию биоразнообразия
  • Национальные и региональные базы данных и сети по биоразнообразию

Послеконференционный семинар с участием ключевых лиц, играющих важную роль в области информатики биоразнообразия, также привел Решение семинара это подчеркнуло, среди прочего, необходимость создания устойчивых глобальных реестров ресурсов, которые являются основными для информатики биоразнообразия (например, репозитариев, коллекций); завершить создание прочной таксономической инфраструктуры; и создавать онтологии для данных о биоразнообразии.

Примеры проектов в области информатики биоразнообразия

Глобальный:

Региональные / национальные проекты:

  • LifeWatch предлагается ESFRI в качестве общеевропейской исследовательской (электронной) инфраструктуры для поддержки исследований и разработки политики в области биоразнообразия.

Список более 600 текущих мероприятий, связанных с информатикой биоразнообразия, можно найти на База данных TDWG "Мировые информационные проекты по биоразнообразию".

Смотрите также

Рекомендации

  1. ^ Кришталка Л., Хамфри П.С. (2000). "Могут ли музеи естествознания запечатлеть будущее?". Бионаука. 50 (7): 611–617. Дои:10.1641 / 0006-3568 (2000) 050 [0611: CNHMCT] 2.0.CO; 2.
  2. ^ Петерсон А. Т., Вьегле Д. (2001). "Прогнозирование вторжений видов с помощью моделирования экологической ниши: новые подходы биоинформатики решают насущную проблему" (PDF). Бионаука. 51 (5): 363–371. Дои:10.1641 / 0006-3568 (2001) 051 [0363: PSIUEN] 2.0.CO; 2.
  3. ^ "Биоинформатика для биоразнообразия?". Наука. 289: 2229–2440. 2000.
  4. ^ «Информатика биоразнообразия». BMC Bioinformatics. 10 Приложение 14. 2009. Архивировано с оригинал на 2010-01-27. Получено 2009-11-15.
  5. ^ ""Информатика биоразнообразия », Термин». Получено 2009-08-06.
  6. ^ Бисби FA; и другие. (2000). «Тихая революция: информатика биоразнообразия и Интернет». Наука. 289 (5488): 2309–2312. Bibcode:2000Sci ... 289.2309B. Дои:10.1126 / science.289.5488.2309. PMID  11009408. S2CID  31852825.
  7. ^ «База данных палеобиологии». Получено 2009-08-06.
  8. ^ «На пути к иерархии управления (классификации) Каталога жизни. Проект документа для обсуждения, доктор Деннис П. Гордон, май 2009 г.». Архивировано из оригинал на 2008-08-08. Получено 2009-08-06.
  9. ^ Ruggiero, M.A .; Гордон, Д.П .; Оррелл, Т.М.; Байи, Н .; Bourgoin, T .; Brusca, R.C .; и другие. (2015). «Классификация всех живых организмов более высокого уровня». PLOS ONE. 10 (4): e0119248. Bibcode:2015PLoSO..1019248R. Дои:10.1371 / journal.pone.0119248. ЧВК  4418965. PMID  25923521.
  10. ^ http://www.e-biosphere09.org/

дальнейшее чтение

внешняя ссылка