GeneNetwork - GeneNetwork
Разработчики) | Группа разработчиков GeneNetwork, Университет Теннесси |
---|---|
Стабильный выпуск | 2.0 / 15 января 1994 |
Репозиторий | github |
Написано в | JavaScript, HTML, Python, CSS, CoffeeScript, PHP |
Лицензия | Стандартная общественная лицензия Affero |
Интернет сайт | www |
GeneNetwork это комбинированная база данных и Открытый исходный код биоинформатика программный ресурс для анализа данных для системная генетика.[1] Этот ресурс используется для изучения сети регуляции генов которые связывают различия в последовательностях ДНК с соответствующими различиями в экспрессии генов и белков, а также с вариациями в таких характеристиках, как здоровье и риск заболевания. Наборы данных в GeneNetwork обычно состоят из больших наборов генотипов (например, SNP ) и фенотипы групп людей, включая людей, линии мышей и крыс, а также такие разнообразные организмы, как Drosophila melanogaster, Arabidopsis thaliana, и ячмень.[2] Включение генотипов делает практичным проведение веб- генное картирование чтобы обнаружить те области генома, которые вносят вклад в различия между людьми в уровнях мРНК, белка и метаболитов, а также в различия в функции клеток, анатомии, физиологии и поведении.
История
Разработка GeneNetwork началась в Медицинском научном центре Университета Теннесси в 1994 году как веб-версия Переносной словарь генома мыши (1994).[3] GeneNetwork - это первая и самая продолжительная непрерывно работающая веб-служба в области биомедицинских исследований [см. https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995 ]. В 1999 г. Portable Gene Dictionary был объединен с изданием Kenneth F. Manly. Менеджер карты Программа картирования QT для создания онлайн-системы для генетического анализа в реальном времени.[4] В начале 2003 г. состоялся первый крупный Affymetrix наборы данных экспрессии генов (целые мозг мыши мРНК и гемопоэтические стволовые клетки), и система была переименована в WebQTL.[5][6] GeneNetwork теперь разрабатывается международной группой разработчиков и имеет зеркала и сайты разработки в Европе, Азии и Австралии. Производственные услуги размещены в системах по адресу Научный центр здоровья Университета Теннесси с резервным экземпляром в Европе.
Текущая производственная версия GeneNetwork (также известная как GN2) была выпущена в 2016 году.[7] Текущая версия GeneNetwork использует ту же базу данных, что и ее предшественник, GN1, но имеет гораздо более модульный и поддерживаемый открытый исходный код (доступен на GitHub ). GeneNetwork теперь также имеет важные новые функции, включая поддержку:
- Генетически сложные популяции с использованием линейной смешанной модели, реализованной с помощью обновленной версии GEMMA ,[8]
- R / qtl модули с множеством вариантов отображения, включая отображение 4-сторонних перекрестков и разнородных запасов
- Взвешенный корреляционный сетевой анализ, также известная как WGCNA
- Cytoscape сетевой дисплей
- Коррелированное картирование локусов признаков[9]
- Браузер генома для отображения генетических и геномных данных, основанный на Biodalliance
- Связанные модули с Веб-сервер байесовской сети ,[10] для причинного моделирования
Организация и использование
GeneNetwork состоит из двух основных компонентов:
- Огромные коллекции генетических, геномных и фенотипических данных для больших когорт людей
- Сложное программное обеспечение для статистического анализа и картирования генов, которое позволяет анализировать молекулярные и клеточные сети и отношения генотип-фенотип
Для каждой семьи или группы населения обычно получают четыре уровня данных:
- Последовательности ДНК и генотипы
- Данные молекулярной экспрессии часто генерируются с использованием массивы, РНК-последовательность, эпигеномный, протеомный, метаболомный и метагеномный методы (молекулярные фенотипы)
- Стандартный количественный фенотипы которые часто являются частью типичной медицинской карты (например, химический анализ крови, масса тела)
- Файлы аннотаций и метаданные для признаков и наборов данных
Комбинированные типы данных размещаются вместе в реляционной базе данных и на файловом сервере IPSF и концептуально организованы и сгруппированы по видам, когортам и семействам. Система реализована как ЛАМПА (комплект ПО) куча. Код и упрощенная версия MariaDB базы данных доступны на GitHub.
GeneNetwork в основном используется исследователями, но также была успешно принята для студентов и аспирантов в области генетики и биоинформатики (см. Пример YouTube ), биоинформатики, физиологии и психологии.[11] Исследователи и студенты обычно извлекают наборы генотипов и фенотипов из одной или нескольких семей и используют встроенные статистические и картографические функции, чтобы исследовать отношения между переменными и создавать сети ассоциаций. Ключевые шаги включают анализ этих факторов:
- Диапазон варьирования черт
- Ковариация между признаками (диаграммы рассеяния и корреляции, анализ главных компонент)
- Архитектура больших сетей черт
- Локус количественного признака картирование и причинно-следственные модели связи между различиями последовательностей и различиями фенотипа
Источники данных
Наборы данных по признакам и молекулярной экспрессии отправляются исследователями напрямую или извлекаются из таких репозиториев, как Национальный центр биотехнологической информации Омнибус экспрессии генов. Данные охватывают множество клеток и тканей - от одноклеточных популяций иммунной системы, конкретных тканей (сетчатка, префронтальная кора) до целых систем (весь мозг, легкие, мышцы, сердце, жир, почки, цветы, зародыши целых растений) . Типичный набор данных охватывает сотни полностью генотипированных людей и может также включать технические и биологические копии. Генотипы и фенотипы обычно берутся из рецензируемых статей. GeneNetwork включает файлы аннотаций для нескольких платформ профилирования РНК (Affymetrix, Illumina и Agilent). RNA-seq и количественные протеомные, метаболомные, эпигенетические и метагеномные данные также доступны для нескольких видов, включая мыши и человека.
Инструменты и особенности
На сайте есть инструменты для широкого спектра функций, которые варьируются от простых графических отображений вариаций в экспрессии генов или других фенотипов до диаграмм разброса пар признаков (Пирсона или порядок ранжирования), построения простых и сложных сетевых графиков, анализа основных компонентов и синтетических признаков, картирование QTL с использованием маркерной регрессии, интервальное картирование и парное сканирование для эпистатических взаимодействий. Большинство функций работают со 100 признаками, а несколько функций работают с целым транскриптом.
Базу данных можно просматривать и искать на главном поиск страница. Он-лайн руководство доступен. Пользователи также могут скачать первичные наборы данных в виде текстовых файлов, Excel или, в случае сетевых графиков, как SBML. По состоянию на 2017 год GN2 доступна в виде бета-версии.
Код
GeneNetwork - это проект с открытым исходным кодом, выпущенный под Стандартная общественная лицензия Affero (AGPLv3). Большая часть кода написана на Python, но включает модули и другой код, написанный на C, R и JavaScript. Код в основном Python 2.4. GN2 в основном написан на Python 2.7 в Колба рамки с Джиндзя 2 HTML-шаблона), но с переходом на Python 3.X, запланированным в ближайшие несколько лет. GN2 вызывает множество статистических процедур, написанных в Язык программирования R. Оригинальный исходный код 2010 года вместе с компактной базой данных доступен на SourceForge. Пока GN1 активно поддерживался в течение 2019 г. GitHub, по состоянию на 2020 год вся работа сосредоточена на GN2.
Смотрите также
- Вычислительная геномика
- Cytoscape
- КЕГГ (Киотская энциклопедия генов и геномов)
- Reactome
- WikiPathways
Рекомендации
- ^ Morahan, G; Уильямс, RW (2007). «Системная генетика: следующее поколение генетических исследований?». Симпозиум фонда Novartis. 281: 181–8, обсуждение 188–91, 208–9. Дои:10.1002 / 9780470062128.ch15. PMID 17534074.
- ^ Друка, А; Друка, я; Сентено, АГ; Ли, Н; Солнце, Z; Томас, WT; Bonar, N; Стеффенсон, Б. Дж.; Ullrich, SE; Кляйнхофс, Андрис; Мудрый, Роджер П.; Близко, Тимоти Дж; Потокина, Елена; Луо, Зевей; Вагнер, Карола; Schweizer, Günther F; Маршалл, Дэвид Ф; Кирси, Майкл Дж; Уильямс, Роберт В; Во, Робби (2008). «На пути к системному генетическому анализу ячменя: интеграция фенотипических, экспрессионных и генотипических данных в GeneNetwork». BMC Genetics. 9: 73. Дои:10.1186/1471-2156-9-73. ЧВК 2630324. PMID 19017390.
- ^ Уильямс, RW (1994). «Портативный словарь генома мыши: персональная база данных для картирования генов и молекулярной биологии». Геном млекопитающих. 5 (6): 372–5. Дои:10.1007 / bf00356557. PMID 8043953.
- ^ Chesler, EJ; Лу, Л; Ван, Дж; Уильямс, RW; Мэнли, KF (2004). «WebQTL: быстрый исследовательский анализ экспрессии генов и генетических сетей для мозга и поведения». Природа Неврология. 7 (5): 485–6. Дои:10.1038 / nn0504-485. PMID 15114364.
- ^ Chesler, EJ; Лу, Л; Шоу, S; Qu, Y; Гу, Дж; Ван, Дж; Hsu, HC; Mountz, JD; и другие. (2005). «Комплексный анализ признаков экспрессии генов раскрывает полигенные и плейотропные сети, которые модулируют функцию нервной системы». Природа Генетика. 37 (3): 233–42. Дои:10,1038 / ng1518. PMID 15711545.
- ^ Быстрых, Л; Weersing, E; Dontje, B; Саттон, S; Плетчер, МП; Уилтшир, Т; Су, AI; Велленга, Э; и другие. (2005). «Выявление регуляторных путей, которые влияют на функцию гемопоэтических стволовых клеток, с использованием генетической геномики.'". Природа Генетика. 37 (3): 225–32. Дои:10,1038 / ng1497. PMID 15711547.
- ^ Sloan, Z (2016). «GeneNetwork: структура для веб-генетики». Журнал программного обеспечения с открытым исходным кодом. 1 (2): 25. Дои:10.21105 / joss.00025.
- ^ Чжоу, X (2014). «Эффективные многомерные алгоритмы линейной смешанной модели для полногеномных ассоциаций». Природные методы. 11 (2): 407–9. Дои:10.1038 / nmeth.2848. ЧВК 4211878. PMID 24531419.
- ^ Арендс, Д. (2016). «Картирование локусов корреляционных признаков (CTL): вывод сети фенотипа в зависимости от генотипа». Журнал программного обеспечения с открытым исходным кодом. 1 (6): 87. Дои:10.21105 / joss.00087.
- ^ Зибарт, JD (2013). «Веб-сервер байесовской сети: комплексный инструмент для моделирования биологических сетей». Биоинформатика. 29 (2 1): 2803–3. Дои:10.1093 / биоинформатика / btt472. PMID 23969134.
- ^ Гришэм, Вт; Schottler, NA; Валли-Марилл, Дж .; Бек, L; Битти, Дж (2010). «Обучение биоинформатике и нейроинформатике с использованием бесплатных веб-инструментов». CBE: Образование в области естественных наук. 9 (2): 98–107. Дои:10.1187 / cbe.09-11-0079. ЧВК 2879386. PMID 20516355.
внешняя ссылка
- Связанные ресурсы
Другая системная генетика и сетевые базы данных