Информатика биоразнообразия - Википедия - Biodiversity informatics
Информатика биоразнообразия это применение информатика методы для информация о биоразнообразии, Такие как таксономия, биогеография или же экология. Современные компьютерные технологии могут дать новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. нишевое моделирование ). Информатика биоразнообразия - это термин, который появился только в 1992 году, но с быстро растущими наборами данных он стал полезен во многих исследованиях и приложениях, таких как построение таксономические базы данных или же географические информационные системы. Информатика биоразнообразия контрастирует с "биоинформатика ", который часто используется как синоним компьютеризированной обработки данных в специализированной области молекулярная биология.
Обзор
Информатика биоразнообразия (другая, но связанная с биоинформатикой) - это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатике биоразнообразия также, возможно, придется справляться с управлением информацией от неназванных таксонов, например, полученной путем отбора проб окружающей среды и определения последовательности смешанных проб. Термин «информатика биоразнообразия» также используется для обозначения вычислительные проблемы специфические для названий биологических объектов, такие как разработка алгоритмов для работы с вариантными представлениями идентификаторов, таких как названия видов и авторитетные источники, а также множественные схемы классификации, в которых эти объекты могут находиться в соответствии с предпочтениями различных специалистов в этой области, а также синтаксис и семантика, с помощью которых контент в таксономических базах данных может быть сделан машинным запросом и совместимым для целей информатики биоразнообразия ...
История дисциплины
Можно считать, что информатика биоразнообразия началась с создания первого компьютеризированного таксономические базы данных в начале 1970-х и прогрессировал за счет последующей разработки инструментов распределенного поиска к концу 1990-х, включая Species Analyst из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN, CONABIO в Мексике и другие,[1] создание Глобальный информационный фонд по биоразнообразию в 2001 году, и параллельное развитие ряда нишевое моделирование и другие инструменты для работы с оцифрованными данными о биоразнообразии с середины 1980-х годов (например, см. [2]). В сентябре 2000 г. журнал США Наука посвятил специальный выпуск «Биоинформатике для биоразнообразия»,[3] журнал «Информатика биоразнообразия» начал публиковаться в 2004 году, а несколько международных конференций 2000-х годов собрали вместе специалистов-практиков в области информатики биоразнообразия, в том числе Лондонский электронная биосфера конференция в июне 2009 года. Приложение к журналу BMC Bioinformatics (Том 10 Приложение 14[4]), опубликованная в ноябре 2009 г., также посвящена информатике биоразнообразия.
История термина
Согласно переписке, воспроизведенной Уолтером Берендсоном,[5] термин «информатика биоразнообразия» был введен Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум информатики биоразнообразия, группы, занимающейся объединением основных биоразнообразие информация с экономика окружающей среды и геопространственной информации в виде GPS и ГИС. Впоследствии он, по-видимому, потерял всякую обязательную связь с миром GPS / ГИС и был связан с компьютеризированным управлением любыми аспектами информации о биоразнообразии (например, см. [6])
Цифровая таксономия (систематика)
Глобальный список всех видов
Одной из основных проблем в области информатики биоразнообразия в глобальном масштабе является отсутствие в настоящее время полного основного списка признанные в настоящее время виды мира, хотя это цель Каталог Жизни проект, имеющий ок. 1,65 миллиона видов из примерно 1,9 миллиона описанных видов в его Ежегодный контрольный список на 2016 год. Аналогичная попытка для таксонов ископаемых, База данных палеобиологии[7] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.
Научные названия родов и видов как уникальные идентификаторы
Применение Линнеевский система биномиальной номенклатуры для разновидность, и одночлены для роды и более высокие ранги, дало много преимуществ, но также и проблемы с омонимы (одно и то же имя используется для нескольких таксонов, случайно или законно в нескольких царствах), синонимы (несколько названий для одного и того же таксона), а также варианты представления одного и того же имени из-за орфографических различий, незначительных орфографических ошибок, вариаций в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться с течением времени из-за изменения таксономических мнений (например, правильного родового положения вида или повышения подвида до ранга вида или наоборот), а также ограниченность таксона может меняться в зависимости от к таксономическим концепциям разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни (LSID ) для машинно-машинной коммуникации, хотя у этого подхода есть как сторонники, так и противники.
Консенсусная классификация организмов
Организмы можно классифицировать множеством способов (см. Главную страницу Биологическая классификация ), которые могут создавать проблемы проектирования систем информатики биоразнообразия, нацеленных на включение единой или множественной классификации в соответствии с потребностями пользователей или на направление их к единой «предпочтительной» системе. Может ли когда-либо быть достигнута единая консенсусная система классификации, вероятно, открытый вопрос, однако Каталог жизни инициировал деятельность в этой области.[8] на смену которой пришла опубликованная система, предложенная в 2015 году М. Руджеро и его коллегами.[9]
Мобилизация первичной информации о биоразнообразии
«Первичную» информацию о биоразнообразии можно рассматривать как базовые данные о встречаемости и разнообразии видов (или, действительно, любых распознаваемых таксонов), обычно в сочетании с информацией об их распространении в пространстве, времени или в обоих случаях. Такая информация может быть в форме сохраненных образцов и связанной информации, например, собранной в коллекциях естествознания музеи и гербарии или в виде записей наблюдений, например, либо из официальных фаунистических или флористических исследований, проводимых профессиональными биологами и студентами, либо в качестве любительских и других запланированных или незапланированных наблюдений, включая те, которые все чаще попадают в сферу охвата гражданская наука. Обеспечение согласованного цифрового доступа в режиме онлайн к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примеры последних включают ОБИС и GBIF.
В качестве вторичного источника данных о биоразнообразии актуальные научная литература могут быть проанализированы либо людьми, либо (потенциально) специализированными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая сообщается в них, иногда в агрегированной / сводной форме, но часто в виде первичных наблюдений в описательной или табличной форме. Элементы такой деятельности (например, извлечение ключевых таксономических идентификаторов, ключевые слова / условия индекса и т. д.) многие годы практикуются на более высоком уровне избранными академические базы данных и поисковые системы. Однако для максимальной ценности информатики биоразнообразия в идеале следует извлечь фактические данные о первичных встречах, а затем сделать их доступными в стандартизированной форме или формах; например, как Plazi и ИНОТАКСА проекты превращают таксономическую литературу в XML форматы, которые затем могут быть прочитаны клиентскими приложениями, первые используют ТаксонX-XML а последний - в формате taXMLit. В Библиотека наследия биоразнообразия также добивается значительного прогресса в своей цели по оцифровке значительной части таксономической литературы, не защищенной авторским правом, которая затем подвергается OCR (оптическое распознавание символов) для дальнейшей обработки с использованием инструментов информатики биоразнообразия.
Стандарты и протоколы
Как и другие дисциплины, связанные с данными, информатика биоразнообразия выигрывает от принятия соответствующих стандарты и протоколы для поддержки машинно-машинной передачи и взаимодействия информации в пределах своей конкретной области. Примеры соответствующих стандартов включают Ядро Дарвина XML схема для данных о биоразнообразии на основе образцов и наблюдений, разработанных с 1998 года и далее, а также их расширений, Схема передачи таксономических понятий, плюс стандарты для Структурированные описательные данные и Доступ к данным биологической коллекции (ABCD); в то время как протоколы поиска и передачи данных включают DiGIR (сейчас в основном заменено) и ТАПИР (Протокол доступа TDWG для поиска информации). Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Рабочая группа по таксономическим базам данных (TDWG).
Текущая деятельность
На конференции «Электронная биосфера» в Великобритании в 2009 г.[10] были приняты следующие темы, что свидетельствует о широком спектре текущих мероприятий в области информатики биоразнообразия и о том, как их можно разделить на категории:
- Применение: сохранение / сельское хозяйство / рыболовство / промышленность / лесное хозяйство
- Применение: инвазивные чужеродные виды
- Применение: систематическая и эволюционная биология
- Применение: системы таксономии и идентификации
- Новые инструменты, услуги и стандарты для управления данными и доступа к ним
- Новые инструменты моделирования
- Новые инструменты для интеграции данных
- Новые подходы к инфраструктуре биоразнообразия
- Новые подходы к определению видов
- Новые подходы к картированию биоразнообразия
- Национальные и региональные базы данных и сети по биоразнообразию
Послеконференционный семинар с участием ключевых лиц, играющих важную роль в области информатики биоразнообразия, также привел Решение семинара это подчеркнуло, среди прочего, необходимость создания устойчивых глобальных реестров ресурсов, которые являются основными для информатики биоразнообразия (например, репозитариев, коллекций); завершить создание прочной таксономической инфраструктуры; и создавать онтологии для данных о биоразнообразии.
Примеры проектов в области информатики биоразнообразия
Глобальный:
- В Глобальный информационный фонд по биоразнообразию (GBIF), а Биогеографическая информационная система океана (OBIS) (для морских видов)
- В Виды 2000, ЭТО (Интегрированная система таксономической информации) и Каталог Жизни проекты
- Глобальные имена
- EOL, Проект "Энциклопедия жизни"
- В Консорциум штрих-кода жизни проект
- В Карта жизни проект
- В База данных рептилий проект
- В uBio Универсальный биологический индексатор и органайзер из Woods Hole Морская биологическая лаборатория
- В Указатель названий организмов (ION) от Clarivate Analytics, предоставляя доступ к научным названиям таксонов из многочисленных журналов, индексируемых в Зоологические записи
- В Временный реестр морских и неморских родов (IRMNG)
- ЗооБанк, реестр номенклатурных актов и соответствующую систематическую литературу в зоология
- В Index Nominum Genericorum, сборник опубликованных родовых названий организмов, охватываемых Международный кодекс ботанической номенклатуры, хранится в Смитсоновский институт в США.
- В Международный указатель названий растений
- MycoBank, документируя новые имена и комбинации для грибы
- В Список названий прокариот, стоящих в номенклатуре (LPSN ) - Официальный реестр действительных имен для бактерии и археи, как регулируется Международный кодекс номенклатуры бактерий
- В Библиотека наследия биоразнообразия проект - оцифровка литературы по биоразнообразию
- Викивиды, открытый исходный код (редактируемый сообществом) сборник таксономической информации, сопутствующий проект для Википедии
- TaxonConcept.org, а Связанные данные проект, объединяющий разрозненные базы данных видов
- Instituto de Ciencias Naturales. Национальный университет Колумбии. Отдел виртуальных коллекций и информатики биоразнообразия
- АНТАБИФ. Информационный фонд по биоразнообразию Антарктики предоставляет свободный и открытый доступ к данным о биоразнообразии Антарктики в духе Договора об Антарктике.
- Genesys (сайт), база данных генетических ресурсов растений, поддерживаемая на национальном, региональном и международном генные банки
- VertNet, Доступ к первичным данным о встречаемости позвоночных из наборов данных по всему миру.
Региональные / национальные проекты:
- Фауна Европы
- Атлас живой Австралии
- Панъевропейская инфраструктура каталогов видов (PESI)
- Симбиота
- iDigBio, Integrated Digitized Biocollections (США)
- i4Life проект
- Sistema de Información sobre Biodiversidad de Colombia
- Портал по биоразнообразию Индии (IBP)
- Портал по биоразнообразию Бутана (BBP)
- Идентификация сорняков и знания в западной части Индийского океана (WIKWIO)
Эта секция нуждается в расширении. Вы можете помочь добавляя к этому. (Май 2010 г.) |
- LifeWatch предлагается ESFRI в качестве общеевропейской исследовательской (электронной) инфраструктуры для поддержки исследований и разработки политики в области биоразнообразия.
Список более 600 текущих мероприятий, связанных с информатикой биоразнообразия, можно найти на База данных TDWG "Мировые информационные проекты по биоразнообразию".
Смотрите также
- Биоразнообразие
- Глобальное биоразнообразие
- Таксономическая база данных
- Веб-таксономия
- Список баз данных по биоразнообразию
Рекомендации
- ^ Кришталка Л., Хамфри П.С. (2000). "Могут ли музеи естествознания запечатлеть будущее?". Бионаука. 50 (7): 611–617. Дои:10.1641 / 0006-3568 (2000) 050 [0611: CNHMCT] 2.0.CO; 2.
- ^ Петерсон А. Т., Вьегле Д. (2001). "Прогнозирование вторжений видов с помощью моделирования экологической ниши: новые подходы биоинформатики решают насущную проблему" (PDF). Бионаука. 51 (5): 363–371. Дои:10.1641 / 0006-3568 (2001) 051 [0363: PSIUEN] 2.0.CO; 2.
- ^ "Биоинформатика для биоразнообразия?". Наука. 289: 2229–2440. 2000.
- ^ «Информатика биоразнообразия». BMC Bioinformatics. 10 Приложение 14. 2009. Архивировано с оригинал на 2010-01-27. Получено 2009-11-15.
- ^ ""Информатика биоразнообразия », Термин». Получено 2009-08-06.
- ^ Бисби FA; и другие. (2000). «Тихая революция: информатика биоразнообразия и Интернет». Наука. 289 (5488): 2309–2312. Bibcode:2000Sci ... 289.2309B. Дои:10.1126 / science.289.5488.2309. PMID 11009408. S2CID 31852825.
- ^ «База данных палеобиологии». Получено 2009-08-06.
- ^ «На пути к иерархии управления (классификации) Каталога жизни. Проект документа для обсуждения, доктор Деннис П. Гордон, май 2009 г.». Архивировано из оригинал на 2008-08-08. Получено 2009-08-06.
- ^ Ruggiero, M.A .; Гордон, Д.П .; Оррелл, Т.М.; Байи, Н .; Bourgoin, T .; Brusca, R.C .; и другие. (2015). «Классификация всех живых организмов более высокого уровня». PLOS ONE. 10 (4): e0119248. Bibcode:2015PLoSO..1019248R. Дои:10.1371 / journal.pone.0119248. ЧВК 4418965. PMID 25923521.
- ^ http://www.e-biosphere09.org/
дальнейшее чтение
- Рабочая группа Форума меганауки ОЭСР по биологической информатике (1999). Заключительный отчет Рабочей группы Форума ОЭСР по биологической информатике, январь 1999 г.. С. 1–74. Архивировано из оригинал на 2009-03-05. Получено 2018-03-21.
- Canhos, V.P .; Souza, S .; Джованни, Р., Канос, Д.А.Л. (2004). «Глобальная информатика биоразнообразия: условия для« нового мира »экологического моделирования». Информатика биоразнообразия. 1: 1–13. Дои:10.17161 / bi.v1i0.3.
- Соберон, Дж. И Петерсон, А.Т. (2004). «Информатика биоразнообразия: управление и применение первичных данных о биоразнообразии». Фил. Пер. R. Soc. Лондон. B359 (1444): 689–698. Дои:10.1098 / rstb.2003.1439. ЧВК 1693343. PMID 15253354.[постоянная мертвая ссылка ]
- Чепмен, А.Д. (2005). Использование данных о первичных видах (PDF). Копенгаген: Глобальный информационный фонд по биоразнообразию. С. 1–106. Архивировано из оригинал (PDF) на 2010-02-16. Получено 2009-08-12.
- Джонсон, Н.Ф. (2007). «Информатика биоразнообразия». Ежегодный обзор энтомологии. 52: 421–438. Дои:10.1146 / annurev.ento.52.110405.091259. PMID 16956323.
- Саркар, И. (2007). «Информатика биоразнообразия: организация и связывание информации по всему спектру жизни». Брифинги по биоинформатике. 8 (5): 347–357. Дои:10.1093 / bib / bbm037. PMID 17704120.
- Guralnick, R.P .; Хилл, А (2009). «Информатика биоразнообразия: автоматизированные подходы к документированию глобальных структур и процессов биоразнообразия». Биоинформатика. 25 (4): 421–428. Дои:10.1093 / биоинформатика / btn659. PMID 19129210.