Система управления рабочим процессом биоинформатики - Bioinformatics workflow management system
Эта статья может содержать неизбирательный, излишний, или же не имеющий отношения Примеры.Февраль 2012 г.) ( |
А система управления рабочим процессом биоинформатики это специализированная форма система управления рабочим процессом разработан специально для составления и выполнения серии этапов вычислений или обработки данных, или рабочий процесс, которые относятся к биоинформатика.
В настоящее время существует множество различных систем рабочего процесса. Некоторые были разработаны в более общем виде как системы научного документооборота для использования учеными из разных дисциплин, например астрономия и науки о Земле. Все такие системы основаны на абстрактном представлении того, как выполняются вычисления, в форме ориентированного графа, где каждый узел представляет задачу, которая должна быть выполнена, а ребра представляют либо поток данных, либо зависимости выполнения между различными задачами. Каждая система обычно предоставляет визуальный интерфейс, позволяющий пользователю создавать и изменять сложные приложения с минимальными знаниями программирования или без них.[1][2][3]
Примеры
В алфавитном порядке некоторые примеры систем управления рабочим процессом биоинформатики включают:
- Андурил биоинформатика и анализ изображений[4][5]
- БИОБАЙК: веб-программируемая интегрированная база биологических знаний[6]
- CLC биография, платформа для биоинформатического анализа и управления рабочими процессами от QIAGEN Digital Insights.
- Клинопись: Функциональный язык рабочего процесса для крупномасштабного анализа данных.[7]
- Discovery Net: один из самых ранних примеров системы научного документооборота, позже коммерциализированный как InforSense, который затем был приобретен IDBS.[нужна цитата ]
- Галактика: изначально нацелен на геномика[8]
- GenePattern: Мощная научная система рабочего процесса, обеспечивающая доступ к сотням инструментов геномного анализа.[9]
- KNIME Konstanz Information Miner[10]
- ОнлайнHPC Онлайн-дизайнер рабочего процесса на основе Таверна[нужна цитата ]
- UGENE предоставляет систему управления рабочим процессом, которая устанавливается на локальном компьютере[11]
- VisTrails[12]
Сравнение систем рабочего процесса
Благодаря большому количеству систем рабочего процесса биоинформатики на выбор,[13] становится трудно понять и сравнить особенности различных систем рабочего процесса. Было проведено мало работы по оценке и сравнению систем с точки зрения биоинформатика, особенно когда дело доходит до сравнения типов данных, с которыми они могут иметь дело, встроенных функций, которые предоставляются пользователю, или даже их производительности или удобства использования. Примеры существующих сравнений включают:
- Статья «Системы научного документооборота - может ли всех подойти один размер?»,[3] который обеспечивает высокоуровневую структуру для сравнения систем рабочих процессов на основе их потоков управления и свойств потока данных. Сравниваемые системы включают Discovery Net, Таверна, Триана, Кеплер а также Ял и BPEL.
- Статья «Мета-рабочие процессы: взаимодействие Galaxy и Taverna на основе шаблонов».[14] который обеспечивает более ориентированное на пользователя сравнение между Таверна и Галактика в контексте обеспечения взаимодействия между обеими системами.
- Документ по инфраструктуре «Обеспечение инфраструктуры ИКТ для биомедицинских исследований»[15] сравнивает две системы рабочего процесса, Андурил и Chipster,[16] с точки зрения требований к инфраструктуре в модели облачной доставки.
- Статья «Обзор биоинформатических конвейерных фреймворков».[17] пытается классифицировать системы управления рабочими процессами на основе трех измерений: «использование неявного или явного синтаксиса, использование конфигурации, соглашения или парадигмы проектирования на основе классов и предложение командной строки или интерфейса рабочей среды».
Рекомендации
- ^ Oinn, T .; Greenwood, M .; Аддис, М .; Альпдемир, М. Н .; Ferris, J .; Glover, K .; Гобл, К.; Годерис, А .; Hull, D .; Марвин, Д .; Li, P .; Лорд, П .; Pocock, M. R .; Сенгер, М .; Stevens, R .; Wipat, A .; Рое, К. (2006). «Таверна: уроки по созданию рабочей среды для наук о жизни» (PDF). Параллелизм и вычисления: практика и опыт. 18 (10): 1067–1100. Дои:10.1002 / cpe.993. S2CID 10219281.
- ^ Yu, J .; Буя, Р. (2005). «Таксономия научных систем рабочего процесса для грид-вычислений». Запись ACM SIGMOD. 34 (3): 44. CiteSeerX 10.1.1.63.3176. Дои:10.1145/1084805.1084814. S2CID 538714.
- ^ а б Curcin, V .; Ганем, М. (2008). Системы научного документооборота - всех ли подойдет один размер?. 2008 Каирская международная конференция по биомедицинской инженерии. С. 1–9. Дои:10.1109 / CIBEC.2008.4786077. ISBN 978-1-4244-2694-2. S2CID 1885579.
- ^ «Сайт рабочего процесса Anduril».
- ^ Оваска, Кристиан; Лааксо, Марко; Хаапа-Паананен, Сайджа; Лоухимо, Рику; Чен, Пинг; Айттомяки, Вильями; Вало, Эркка; Нуньес-Фонтарнау, Хавьер; Рантанен, Вилле (07.09.2010). «Фреймворк для крупномасштабной интеграции данных дает исчерпывающий обзор мультиформной глиобластомы». Геномная медицина. 2 (9): 65. Дои:10,1186 / г 186. ISSN 1756-994X. ЧВК 3092116. PMID 20822536.
- ^ Elhai, J .; Taton, A .; Massar, J .; Myers, J. K .; Трэверс, М .; Кейси, Дж .; Слупески, М .; Шрагер, Дж. (2009). «BioBIKE: веб-программируемая интегрированная база биологических знаний». Исследования нуклеиновых кислот. 37 (Проблема с веб-сервером): W28 – W32. Дои:10.1093 / нар / gkp354. ЧВК 2703918. PMID 19433511.
- ^ Брандт, Йорген; Bux, Marc N .; Лезер, Ульф (2015). «Клинопись: функциональный язык для крупномасштабного анализа научных данных» (PDF). Материалы семинаров EDBT / ICDT. 1330: 17–26.
- ^ Goecks, J .; Некрутенко, А .; Taylor, J .; Команда Галактики, Т. (2010). «Galaxy: комплексный подход к поддержке доступных, воспроизводимых и прозрачных вычислительных исследований в науках о жизни». Геномная биология. 11 (8): R86. Дои:10.1186 / gb-2010-11-8-r86. ЧВК 2945788. PMID 20738864.
- ^ Райх, Майкл; и другие. (2006). «GenePattern 2.0». Природа Генетика. 38 (1): 500–5001. Дои:10.1038 / ng0506-500. PMID 16642009. S2CID 5503897.
- ^ Тивари, Абхишек; Сехар, Арвинд К. (2007). «Основа рабочего процесса для информатики наук о жизни». Вычислительная биология и химия. 31 (5–6): 305–319. Дои:10.1016 / j.compbiolchem.2007.08.009. PMID 17931570.
- ^ Оконечников, К; Голосова, О; Фурсов, М; Угене, Команда (2012). «Unipro UGENE: единый инструментарий биоинформатики». Биоинформатика. 28 (8): 1166–7. Дои:10.1093 / биоинформатика / bts091. PMID 22368248.
- ^ Bavoil, L .; Callahan, S.P .; Crossno, P.J .; Freire, J .; Scheidegger, C.E .; Silva, C.T .; Во, Х. (2005). VisTrails: возможность интерактивной визуализации с несколькими представлениями. VIS 05. Визуализация IEEE, 2005 г.. С. 135–142. Дои:10.1109 / VISUAL.2005.1532788. ISBN 978-0-7803-9462-9.
- ^ «Существующие системы документооборота». Вики по Common Workflow Language. В архиве из оригинала на 2019-10-17. Получено 2019-10-17.
- ^ Abouelhoda, M .; Alaa, S .; Ганем, М. (2010). «Мета-рабочие процессы». Труды 1-го международного семинара по рабочим процессам в новой науке, ориентированной на данные - Wands '10. п. 1. Дои:10.1145/1833398.1833400. ISBN 9781450301886. S2CID 17343728.
- ^ Nyrönen, TH; Laitinen, J; и другие. (2012), Предоставление инфраструктуры ИКТ для биомедицинских исследований, Материалы сопутствующего тома WICSA / ECSA 2012 (WICSA / ECSA '12), ACM, стр. 37–44, Дои:10.1145/2361999.2362006, ISBN 9781450315685, S2CID 18199745
- ^ Каллио, М. А .; Tuimala, J. T .; Хуппонен, Т; Klemelä, P; Gentile, M; Шейнин, I; Коски, М; Каки, Дж; Корпелайнен, Э. И. (2011). «Chipster: удобное программное обеспечение для анализа микрочипов и других высокопроизводительных данных». BMC Genomics. 12: 507. Дои:10.1186/1471-2164-12-507. ЧВК 3215701. PMID 21999641.
- ^ Лейпциг J (2016). «Обзор биоинформатических конвейерных структур». Брифинги по биоинформатике. 18 (3): 530–536. Дои:10.1093 / нагрудник / bbw020. ЧВК 5429012. PMID 27013646. Получено 23 марта 2016.