Биокондуктор - Википедия - Bioconductor

Биокондуктор
Bioconductor logo.svg
Стабильный выпуск
3.12 / 28 октября 2020; 41 дней назад (2020-10-28)
Операционная системаLinux, macOS, Windows
ПлатформаЯзык программирования R
ТипБиоинформатика
ЛицензияХудожественная лицензия 2.0
Интернет сайтwww.bioconductor.org

Биокондуктор это свободный, Открытый исходный код и открытая разработка программный проект для анализа и понимания геномный данные, созданные мокрая лаборатория эксперименты в молекулярная биология.

Биокондуктор основан прежде всего на статистический Язык программирования R, но содержит материалы на других языках программирования. Имеет два релизы каждый год, следующий за полугодовыми выпусками R. В любое время версия выпуска, что соответствует выпущенной версии R, и версия разработки, который соответствует разрабатываемой версии R. Большинство пользователей сочтут версию выпуска подходящей для своих нужд. Вдобавок есть много аннотация генома доступные пакеты, которые в основном, но не исключительно, ориентированы на различные типы микрочипы.

В то время как вычислительные методы продолжают развиваться для интерпретации биологических данных, проект Bioconductor представляет собой репозиторий программного обеспечения с открытым исходным кодом, в котором размещается широкий спектр статистических инструментов, разработанных в среде программирования R. Используя богатый набор статистических и графических функций в R, многие пакеты Bioconductor были разработаны для удовлетворения различных потребностей в анализе данных. Использование этих пакетов обеспечивает базовое понимание языка программирования / команд R. В результате, пакеты R и Bioconductor, имеющие большой опыт в области вычислительной техники, используются большинством биологов, которые значительно выиграют от своей способности анализировать наборы данных. Все эти результаты предоставляют биологам легкий доступ к анализу геномных данных без необходимости программирования. экспертиза.

Проект был начат осенью 2001 года и находится под контролем основной группы Bioconductor, базирующейся в основном в Онкологический исследовательский центр Фреда Хатчинсона, с другими членами из международных организаций.

Пакеты

Большинство компонентов Bioconductor распространяются как Пакеты R, которые являются дополнительными модулями для R. Изначально большинство программных пакетов Bioconductor были ориентированы на анализ одноканальных Affymetrix и два или более каналов кДНК /Олиго микрочипы. По мере развития проекта функциональные возможности программных пакетов расширились и стали включать анализ всех типов геномных данных, таких как SAGE, последовательность, или же SNP данные.

Цели

Основные цели проектов:

Основные особенности

  • Документация и воспроизводимые исследования. Каждый пакет Bioconductor содержит по крайней мере одну виньетку, которая представляет собой документ, содержащий текстовое, ориентированное на задачу описание функциональности пакета. Эти виньетки бывают нескольких форм. Многие просты "Как "s, которые предназначены для демонстрации того, как конкретная задача может быть выполнена с помощью программного обеспечения этого пакета. Другие предоставляют более подробный обзор пакета или могут даже обсуждать общие вопросы, связанные с пакетом. В будущем проект Bioconductor стремится предоставить виньетки, которые специально не привязаны к пакету, а скорее демонстрируют более сложные концепции.Как и во всех аспектах проекта Bioconductor, пользователям рекомендуется участвовать в этой работе.
  • Статистические и графические методы. Проект Bioconductor направлен на обеспечение доступа к широкому спектру мощных статистических и графических методов анализа геномных данных. Доступны пакеты анализа для: предварительной обработки Affymetrix и Иллюмина, кДНК данные массива; идентификация дифференциально экспрессируемые гены; теоретический анализ графов; построение геномных данных. Кроме того, сама система пакетов R предоставляет реализации для широкого спектра современных статистический и графический методы, в том числе линейный и нелинейный моделирование кластерный анализ, прогноз, повторная выборка, анализ выживаемости, и Временные ряды анализ.
  • Аннотации генома. Проект Bioconductor предоставляет программное обеспечение для связывания микрочипов и других геномных данных в реальном времени с биологическими метаданными из веб-баз данных, таких как GenBank, LocusLink и PubMed (аннотировать пакет). Также предусмотрены функции для включения результатов статистического анализа в отчеты HTML со ссылками на аннотационные ресурсы WWW. Доступны программные инструменты для сборки и обработки данных геномной аннотации из таких баз данных, как GenBank, то Консорциум генных онтологий, LocusLink, UniGene, то Проект "Геном человека" UCSC и другие с пакетом AnnotationDbi. Пакеты данных распространяются для обеспечения сопоставлений между различными идентификаторами зонда (например, Affy ID, LocusLink, PubMed ). Также могут быть собраны индивидуальные библиотеки аннотаций.
  • Открытый исходный код. Проект Bioconductor полностью привержен принципам открытого исходного кода с распространением через SourceForge.net -подобная платформа. Ожидается, что все взносы будут существовать в лицензия с открытым исходным кодом Такие как Художественный 2.0, GPL2, или же BSD. Существует множество различных причин, по которым программное обеспечение с открытым исходным кодом полезно для анализа данных микрочипов и вычислительной биологии в целом. Причины включают:
  • Открытая разработка. Пользователи поощряются стать Разработчики либо путем предоставления пакетов или документации, совместимых с Bioconductor. Кроме того, Bioconductor обеспечивает механизм для соединения различных групп с общие цели способствовать сотрудничество по программному обеспечению, возможно, на уровне совместной разработки.

Вехи

Каждый выпуск Bioconductor разработан для наилучшей работы с выбранной версией R.[1] Помимо исправлений ошибок и обновлений, в новый выпуск обычно добавляются пакеты. В таблице ниже сопоставляется выпуск Bioconductor с версией R и показано количество доступных пакетов программного обеспечения Bioconductor для этого выпуска.

ВерсияДата выходаКоличество пакетовЗависимость от R
3.1228 октября 2020 г.19744,0 рэнд
3.1128 апреля 202019034,0 рэнд
3.1030 октября 2019 г.18233,6 рэнд
3.831 октября 2018 г.16493.5 рэнд
3.631 октября 2017 г.14733,4 рэнд
3.418 октября 2016 г.12963,3 рэнд
3.214 октября 2015 г.11043,2 рэнд
3.014 октября 2014 г.934R 3.1
2.1315 октября 2013 г.7493,0 рэнд
2.113 октября 2012 г.6102,15 рэнд
2.91 ноя 20115172,14 рэнд
2.814 апреля 2011 г.4662,13 рэнд
2.718 ноя 20104182,12 рэнд
2.623 апреля 2010 г.3892,11 рэнд
2.528 октября 2009 г.3522,10 рэнд
2.421 апреля 2009 г.3202.9 рэнд
2.322 октября 2008 г.2942.8 рэнд
2.21 мая 2008 г.2602,7 рэнд
2.18 октября 2007 г.2332.6 рэнд
2.026 апреля 2007 г.2142,5 рэнд
1.94 октября 2006 г.1882,4 р
1.827 апреля 2006 г.1722.3 рэнд
1.714 октября 2005 г.1412,2 рэнд
1.618 мая 2005 г.123R 2.1
1.525 октября 2004 г.1002,0 р.
1.417 мая 2004 г.811.9 рэнд
1.330 октября 2003 г.491,8 рэнд
1.229 мая 2003 г.301,7 рэнд
1.119 октября 2002 г.201.6 рэнд
1.01 мая 2002 г.151.5 рэнд

Ресурсы

  • Джентльмен, Р .; Кэри, В .; Huber, W .; Irizarry, R .; Дудуа, С. (2005). Решения для биоинформатики и вычислительной биологии с использованием R и биокондуктора. Springer. ISBN  978-0-387-25146-2.
  • Джентльмен, Р. (2008). R Программирование для биоинформатики. Чепмен и Холл / CRC. ISBN  978-1-4200-6367-7.
  • Hahne, F .; Huber, W .; Джентльмен, Р .; Сокол, С. (2008). Примеры использования биокондукторов. Springer. ISBN  978-0-387-77239-4.
  • Джентльмен, Роберт С.; Кэри, Винсент Дж .; Бейтс, Дуглас М .; Болстад, Бен; Деттлинг, Марсель; Дудуа, Сандрин; Эллис, Байрон; Готье, Лоран; Ге, Юнчао; Джентри, Джефф; Хорник, Курт; Хорн, Торстен; Хубер, Вольфганг; Иак, Стефано; Иризарри, Рафаэль; Лейш, Фридрих; Ли, Ченг; Maechler, Мартин; Россини, Энтони Дж .; Савицки, Гюнтер; Смит, Колин; Смит, Гордон; Тирни, Люк; Ян, Жан Ю. Х.; Чжан, Цзяньхуа (2004). «Биокондуктор: открытая разработка программного обеспечения для вычислительной биологии и биоинформатики». Геномная биология. 5 (10): R80. Дои:10.1186 / gb-2004-5-10-r80. ЧВК  545600. PMID  15461798.

Смотрите также

Рекомендации


  1. ^ "Биокондуктор - анонсы выпуска". bioconductor.org. Биокондуктор. Получено 28 мая 2019.

внешняя ссылка