Вычислительная геномика - Computational genomics

Вычислительная геномика (часто называемая вычислительной генетикой) относится к использованию вычислительного и статистического анализа для расшифровки биологии из последовательности генома и связанные данные,[1] включая оба ДНК и РНК последовательность, а также другие "постгеномные" данные (т. е. экспериментальные данные, полученные с помощью технологий, требующих последовательности генома, например, геномных ДНК-микрочипы ). В сочетании с вычислительными и статистическими подходами к пониманию функции генов и статистическим ассоциативным анализом это поле также часто называют Вычислительная и статистическая генетика / геномика. Таким образом, вычислительную геномику можно рассматривать как подмножество биоинформатика и вычислительная биология, но с акцентом на использование целых геномов (а не отдельных генов), чтобы понять принципы того, как ДНК вида контролирует его биологию на молекулярном уровне и за его пределами. При нынешнем изобилии массивных наборов биологических данных компьютерные исследования стали одним из важнейших средств биологического открытия.[2]

История

Корни вычислительной геномики совпадают с корнями биоинформатика. В 1960-е гг. Маргарет Дейхофф и другие сотрудники Национального фонда биомедицинских исследований собрали базы данных гомологичных белковых последовательностей для эволюционного исследования.[3] Их исследования позволили филогенетическое дерево которые определяли эволюционные изменения, которые требовались для того, чтобы конкретный белок превратился в другой белок на основе лежащих в основе аминокислота последовательности. Это привело их к созданию оценочной матрицы, которая оценивала вероятность связи одного белка с другим.

Начиная с 1980-х годов, начали регистрироваться базы данных последовательностей генома, но это создало новые проблемы в форме поиска и сравнения баз данных с информацией о генах. В отличие от алгоритмов текстового поиска, которые используются на таких веб-сайтах, как Google или Wikipedia, для поиска участков генетического сходства требуется найти строки, которые не просто идентичны, а похожи. Это привело к развитию Алгоритм Нидлмана-Вунша, что является динамическое программирование алгоритм для сравнения наборов аминокислотных последовательностей друг с другом с использованием скоринговых матриц, полученных из более раннего исследования Dayhoff. Позже ВЗРЫВ алгоритм был разработан для выполнения быстрого и оптимизированного поиска в базах данных последовательностей генов. BLAST и его производные, вероятно, являются наиболее широко используемыми алгоритмами для этой цели.[4]

Появление термина «вычислительная геномика» совпадает с появлением полных секвенированных геномов в середине-конце 1990-х годов. Первое заседание Ежегодной конференции по вычислительной геномике было организовано учеными из Институт геномных исследований (ТИГР) в 1998 году, предоставив форум для этой специальности и эффективно отделяя эту область науки от более общих областей науки. Геномика или же Вычислительная биология.[нужна цитата ] Первое использование этого термина в научной литературе, по мнению MEDLINE рефераты, всего годом ранее в Исследования нуклеиновых кислот.[5] Заключительная конференция по вычислительной геномике состоялась в 2006 г., на ней выступил лауреат Нобелевской премии. Барри Маршалл, один из первооткрывателей связи между Helicobacter pylori и язвы желудка. По состоянию на 2014 год ведущие конференции в данной области включают Интеллектуальные системы для молекулярной биологии (ISMB) и Исследования в области вычислительной молекулярной биологии (РЕКОМБ).

Развитие компьютерной математики (с использованием таких продуктов, как Mathematica или же Matlab ) помог инженерам, математикам и компьютерным специалистам начать работу в этой области, и все больше и больше публикуется тематических исследований и демонстраций, начиная от сравнений полных геномов и кончая экспрессия гена анализ.[6] Это увеличило внедрение различных идей, включая концепции систем и управления, теории информации, анализа строк и интеллектуального анализа данных. Ожидается, что вычислительные подходы станут и останутся стандартной темой для исследований и преподавания, в то время как студенты, свободно владеющие обеими темами, начнут формироваться в нескольких курсах, созданных за последние несколько лет.

Вклад исследований компьютерной геномики в биологию

Вклад исследований компьютерной геномики в биологию включает:[2]

Смотрите также

Рекомендации

  1. ^ Кунин Е.В. (март 2001 г.). «Вычислительная геномика». Текущая биология. 11 (5): R155–8. Дои:10.1016 / S0960-9822 (01) 00081-1. PMID  11267880. S2CID  17202180.
  2. ^ а б Вычислительная геномика и протеомика в MIT
  3. ^ Гора D (2000). Биоинформатика, анализ последовательностей и генома. Лабораторный пресс Колд-Спринг-Харбор. С. 2–3. ISBN  978-0-87969-597-2.
  4. ^ Браун Т.А. (1999). Геномы. Вайли. ISBN  978-0-471-31618-3.
  5. ^ Вагнер А. (сентябрь 1997 г.). «Подход компьютерной геномики к идентификации генных сетей». Исследования нуклеиновых кислот. 25 (18): 3594–604. Дои:10.1093 / nar / 25.18.3594. ЧВК  146952. PMID  9278479.
  6. ^ Кристианини Н., Хан М. (2006). Введение в вычислительную геномику. Издательство Кембриджского университета. ISBN  978-0-521-67191-0.

внешняя ссылка