Вычислительная геномика - Computational genomics
Вычислительная геномика (часто называемая вычислительной генетикой) относится к использованию вычислительного и статистического анализа для расшифровки биологии из последовательности генома и связанные данные,[1] включая оба ДНК и РНК последовательность, а также другие "постгеномные" данные (т. е. экспериментальные данные, полученные с помощью технологий, требующих последовательности генома, например, геномных ДНК-микрочипы ). В сочетании с вычислительными и статистическими подходами к пониманию функции генов и статистическим ассоциативным анализом это поле также часто называют Вычислительная и статистическая генетика / геномика. Таким образом, вычислительную геномику можно рассматривать как подмножество биоинформатика и вычислительная биология, но с акцентом на использование целых геномов (а не отдельных генов), чтобы понять принципы того, как ДНК вида контролирует его биологию на молекулярном уровне и за его пределами. При нынешнем изобилии массивных наборов биологических данных компьютерные исследования стали одним из важнейших средств биологического открытия.[2]
История
Корни вычислительной геномики совпадают с корнями биоинформатика. В 1960-е гг. Маргарет Дейхофф и другие сотрудники Национального фонда биомедицинских исследований собрали базы данных гомологичных белковых последовательностей для эволюционного исследования.[3] Их исследования позволили филогенетическое дерево которые определяли эволюционные изменения, которые требовались для того, чтобы конкретный белок превратился в другой белок на основе лежащих в основе аминокислота последовательности. Это привело их к созданию оценочной матрицы, которая оценивала вероятность связи одного белка с другим.
Начиная с 1980-х годов, начали регистрироваться базы данных последовательностей генома, но это создало новые проблемы в форме поиска и сравнения баз данных с информацией о генах. В отличие от алгоритмов текстового поиска, которые используются на таких веб-сайтах, как Google или Wikipedia, для поиска участков генетического сходства требуется найти строки, которые не просто идентичны, а похожи. Это привело к развитию Алгоритм Нидлмана-Вунша, что является динамическое программирование алгоритм для сравнения наборов аминокислотных последовательностей друг с другом с использованием скоринговых матриц, полученных из более раннего исследования Dayhoff. Позже ВЗРЫВ алгоритм был разработан для выполнения быстрого и оптимизированного поиска в базах данных последовательностей генов. BLAST и его производные, вероятно, являются наиболее широко используемыми алгоритмами для этой цели.[4]
Появление термина «вычислительная геномика» совпадает с появлением полных секвенированных геномов в середине-конце 1990-х годов. Первое заседание Ежегодной конференции по вычислительной геномике было организовано учеными из Институт геномных исследований (ТИГР) в 1998 году, предоставив форум для этой специальности и эффективно отделяя эту область науки от более общих областей науки. Геномика или же Вычислительная биология.[нужна цитата ] Первое использование этого термина в научной литературе, по мнению MEDLINE рефераты, всего годом ранее в Исследования нуклеиновых кислот.[5] Заключительная конференция по вычислительной геномике состоялась в 2006 г., на ней выступил лауреат Нобелевской премии. Барри Маршалл, один из первооткрывателей связи между Helicobacter pylori и язвы желудка. По состоянию на 2014 год ведущие конференции в данной области включают Интеллектуальные системы для молекулярной биологии (ISMB) и Исследования в области вычислительной молекулярной биологии (РЕКОМБ).
Развитие компьютерной математики (с использованием таких продуктов, как Mathematica или же Matlab ) помог инженерам, математикам и компьютерным специалистам начать работу в этой области, и все больше и больше публикуется тематических исследований и демонстраций, начиная от сравнений полных геномов и кончая экспрессия гена анализ.[6] Это увеличило внедрение различных идей, включая концепции систем и управления, теории информации, анализа строк и интеллектуального анализа данных. Ожидается, что вычислительные подходы станут и останутся стандартной темой для исследований и преподавания, в то время как студенты, свободно владеющие обеими темами, начнут формироваться в нескольких курсах, созданных за последние несколько лет.
Вклад исследований компьютерной геномики в биологию
Вклад исследований компьютерной геномики в биологию включает:[2]
- предлагая сотовая сигнализация сети
- предлагая механизмы эволюции генома
- предсказывать точное местонахождение всех людей гены с помощью сравнительная геномика техники с несколькими млекопитающими и позвоночными разновидность
- предсказывать консервированный области генома, относящиеся к ранним эмбриональное развитие
- обнаружить потенциальные связи между повторяющимися последовательностями мотивов и тканеспецифичными экспрессия гена
- измерить области геномов, которые претерпели необычайно быструю эволюцию
Смотрите также
Рекомендации
- ^ Кунин Е.В. (март 2001 г.). «Вычислительная геномика». Текущая биология. 11 (5): R155–8. Дои:10.1016 / S0960-9822 (01) 00081-1. PMID 11267880. S2CID 17202180.
- ^ а б Вычислительная геномика и протеомика в MIT
- ^ Гора D (2000). Биоинформатика, анализ последовательностей и генома. Лабораторный пресс Колд-Спринг-Харбор. С. 2–3. ISBN 978-0-87969-597-2.
- ^ Браун Т.А. (1999). Геномы. Вайли. ISBN 978-0-471-31618-3.
- ^ Вагнер А. (сентябрь 1997 г.). «Подход компьютерной геномики к идентификации генных сетей». Исследования нуклеиновых кислот. 25 (18): 3594–604. Дои:10.1093 / nar / 25.18.3594. ЧВК 146952. PMID 9278479.
- ^ Кристианини Н., Хан М. (2006). Введение в вычислительную геномику. Издательство Кембриджского университета. ISBN 978-0-521-67191-0.
внешняя ссылка
- Гарвардская школа по биофизике 101, геномика и вычислительная биология, http://www.courses.fas.harvard.edu/~bphys101/info/syllabus.html
- Курс вычислительной геномики Бристольского университета, http://www.computational-genomics.net/