GC-контент - GC-content

Нуклеотидные связи, показывающие пары AT и GC. Стрелки указывают на водородные связи.

В молекулярная биология и генетика, GC-контент (или же содержание гуанин-цитозина) - процент азотистые основания в ДНК или РНК молекулы, которые либо гуанин (G) или цитозин (С).[1] Этот показатель показывает долю оснований G и C от подразумеваемых четырех оснований, включая аденин и тимин в ДНК и аденине и урацил в РНК.

GC-содержание может быть дано для определенного фрагмента ДНК или РНК или для всего геном. Когда он относится к фрагменту, он может обозначать GC-контент отдельного человека. ген или часть гена (домена), группа генов или кластеры генов, некодирующая область, или синтетический олигонуклеотид например, грунтовка.

Структура

Качественно гуанин (G) и цитозин (C) подвергаются специфической водородная связь друг с другом, тогда как аденин (A) специфически связывается с тимином (T) в ДНК и с урацилом (U) в РНК. Количественно каждый GC базовая пара удерживается вместе тремя водородными связями, в то время как пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть эту разницу, пары оснований часто представлены как «G≡C» по сравнению с «A = T» или «A = U».

ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако сами водородные связи не оказывают особенно значительного влияния на молекулярную стабильность, которая вместо этого вызывается в основном молекулярными взаимодействиями при укладке оснований.[2] Несмотря на более высокий термостойкость придается нуклеиновой кислоте с высоким содержанием GC, было замечено, что по крайней мере некоторые виды бактерии с ДНК с высоким содержанием GC проходят автолиз легче, тем самым снижая долговечность клетки как таковой.[3] Из-за термостабильности пар GC когда-то считалось, что высокое содержание GC было необходимым приспособление к высоким температурам, но эта гипотеза была опровергнута в 2001 году.[4] Тем не менее, было показано, что существует сильная корреляция между оптимальным ростом прокариоты при более высоких температурах и GC-содержании структурных РНК, таких как рибосомальная РНК, переносить РНК, и многие другие некодирующие РНК.[4][5] Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.

Совсем недавно было продемонстрировано, что наиболее важный фактор, способствующий термостабильности двухцепочечных нуклеиновых кислот, на самом деле связан с укладкой оснований соседних оснований, а не с количеством водородных связей между основаниями. Энергия стэкинга для пар GC более благоприятна, чем для пар AT или AU из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком укладки оснований и термической стабильностью молекулы в целом.[6]

определение

GC-контент обычно выражается в процентах, но иногда в виде отношения (так называемого Соотношение G + C или GC-коэффициент). Процент содержания ГХ рассчитывается как[7]

тогда как отношение AT / GC рассчитывается как[8]

.

Процентное содержание GC, а также GC-соотношение можно измерить несколькими способами, но один из самых простых методов - это измерение температура плавления ДНК двойная спираль с помощью спектрофотометрия. В поглощение ДНК на длина волны из 260 нм возрастает довольно резко, когда двухцепочечная молекула ДНК разделяется на две одноцепочечные цепи при достаточном нагревании.[9] Наиболее часто используемый протокол для определения GC-соотношений использует проточной цитометрии для большого количества образцов.[10]

В качестве альтернативы, если исследуемая молекула ДНК или РНК была надежно последовательный, то GC-контент можно точно рассчитать с помощью простой арифметики или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор GC.

Геномное содержание

Вариация внутри генома

Было обнаружено, что GC-соотношение в геноме заметно варьируется. Эти вариации в GC-соотношении в геномах более сложных организмов приводят к мозаичному образованию с островными областями, называемыми изохоры.[11] Это приводит к вариациям интенсивности окрашивания в хромосомы.[12] GC-богатые изохоры обычно включают в себя множество генов, кодирующих белок, и, таким образом, определение GC-соотношений этих специфических областей способствует отображение богатые генами области генома.[13][14]

Кодирующие последовательности

В длинном участке геномной последовательности гены часто характеризуются более высоким содержанием GC по сравнению с фоновым содержанием GC для всего генома. Свидетельство соотношения GC и длины кодирующая область из ген показал, что длина кодирующей последовательности прямо пропорциональна более высокому содержанию G + C.[15] Это было указано на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов A и T, и, таким образом, чем короче последовательность, тем выше смещение AT.[16]

Сравнение более 1000 ортологичный гены у млекопитающих показали заметные внутригеномные вариации позиция третьего кодона Содержание ГХ в диапазоне от менее 30% до более 80%.[17]

Вариация между геномами

Было обнаружено, что содержание ГК варьируется у разных организмов, и предполагается, что этому процессу будет способствовать изменение в отбор, мутационная предвзятость и предвзятость, связанная с рекомбинацией Ремонт ДНК.[18]

Среднее содержание GC в геномах человека колеблется от 35% до 60% по 100-килобайтным фрагментам, в среднем 41%.[19] GC-содержание Дрожжи (Saccharomyces cerevisiae ) составляет 38%,[20] и еще один общий модельный организм, тале кресс (Arabidopsis thaliana ), составляет 36%.[21] Из-за характера генетический код, для организма практически невозможно иметь геном с содержанием GC, приближающимся к 0% или 100%. Однако виды с чрезвычайно низким содержанием GC Плазмодий falciparum (GC% = ~ 20%),[22] и обычно принято называть такие примеры богатыми AT, а не бедными GC.[23]

Несколько видов млекопитающих (например, землеройка, микробат, Tenrec, кролик ) независимо подверглись заметному увеличению содержания GC в своих генах. Эти изменения содержания GC коррелируют с видами жизненно важные черты (например, масса тела или продолжительность жизни) и размер генома,[17] и может быть связано с молекулярным феноменом, называемым GC-biased преобразование гена.[24]

Приложения

Молекулярная биология

В полимеразной цепной реакции (ПЦР), GC-содержание коротких олигонуклеотидов, известных как грунтовки часто используется для прогнозирования их температура отжига к матричной ДНК. Более высокий уровень содержания ГХ указывает на относительно более высокую температуру плавления.

Систематика

В проблема вида в неэукариотической таксономии привело к различным предложениям по классификации бактерий, и специальный комитет по согласованию подходов к бактериальной систематике рекомендовал использовать GC-коэффициенты в иерархической классификации более высокого уровня.[25] Например, Актинобактерии характеризуются как "высокое содержание GC бактерии ".[26] В Streptomyces coelicolor A3 (2), GC-содержание 72%.[27]

Программные инструменты

GCSpeciesSorter[28] и TopSort[29] представляют собой программные инструменты для классификации видов на основе их GC-содержимого.

Смотрите также

Рекомендации

  1. ^ Определение GC - контент на CancerWeb из Ньюкаслский университет,ВЕЛИКОБРИТАНИЯ
  2. ^ Яковчук П., Протозанова Е., Франк-Каменецкий М.Д. (2006). «Вклады укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Нуклеиновые кислоты Res. 34 (2): 564–74. Дои:10.1093 / нар / gkj454. ЧВК  1360284. PMID  16449200.
  3. ^ Левин Р.Э., Ван Сикл С. (1976). «Автолиз изолятов Pseudomonas putrefaciens с высоким уровнем GC». Антони ван Левенгук. 42 (1–2): 145–55. Дои:10.1007 / BF00399459. PMID  7999.
  4. ^ а б Hurst LD, Merchant AR (март 2001 г.). «Высокое содержание гуанин-цитозина не является адаптацией к высокой температуре: сравнительный анализ среди прокариот». Proc. Биол. Наука. 268 (1466): 493–7. Дои:10.1098 / rspb.2000.1397. ЧВК  1088632. PMID  11296861.
  5. ^ Galtier, N .; Лобри, Дж. Р. (1997). «Взаимосвязь между содержанием G + C в геноме, вторичными структурами РНК и оптимальной температурой роста прокариот». Журнал молекулярной эволюции. 44 (6): 632–636. Bibcode:1997JMolE..44..632G. Дои:10.1007 / PL00006186. PMID  9169555.
  6. ^ Яковчук, Петр; Протозанова, Екатерина; Франк-Каменецкий, Максим Д. (2006). «Вклады укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Исследования нуклеиновых кислот. 34 (2): 564–574. Дои:10.1093 / нар / gkj454. ISSN  0305-1048. ЧВК  1360284. PMID  16449200.
  7. ^ Мэдиган, MT. и Мартинко JM. (2003). Брок биология микроорганизмов (10-е изд.). Пирсон-Прентис Холл. ISBN  978-84-205-3679-8.
  8. ^ Определение GC-ratio в Северо-Западном университете, Иллинойс, США
  9. ^ Вильгельм Дж., Пингоуд А., Хан М. (май 2003 г.). «Метод ПЦР в реальном времени для оценки размеров генома». Нуклеиновые кислоты Res. 31 (10): e56. Дои:10.1093 / nar / gng056. ЧВК  156059. PMID  12736322.
  10. ^ Виноградов А.Е. (май 1994 г.). «Измерение с помощью проточной цитометрии геномного отношения AT / GC и размера генома». Цитометрия. 16 (1): 34–40. Дои:10.1002 / cyto.990160106. PMID  7518377.
  11. ^ Бернарди Г (январь 2000 г.). «Изохоры и эволюционная геномика позвоночных». Ген. 241 (1): 3–17. Дои:10.1016 / S0378-1119 (99) 00485-0. PMID  10607893.
  12. ^ Фьюри Т.С., Хаусслер Д. (май 2003 г.). «Интеграция цитогенетической карты с проектом последовательности генома человека». Гм. Мол. Genet. 12 (9): 1037–44. Дои:10.1093 / hmg / ddg113. PMID  12700172.
  13. ^ Самнер А. Т., де ла Торре Дж., Ступпиа Л. (август 1993 г.). «Распределение генов по хромосомам: цитологический подход». J. Mol. Evol. 37 (2): 117–22. Bibcode:1993JMolE..37..117S. Дои:10.1007 / BF02407346. PMID  8411200.
  14. ^ Айссани Б., Бернарди Г. (октябрь 1991 г.). «Острова CpG, гены и изохоры в геномах позвоночных». Ген. 106 (2): 185–95. Дои:10.1016 / 0378-1119 (91) 90198-К. PMID  1937049.
  15. ^ Поццоли У., Меноцци Дж., Фумагалли М. и др. (2008). «Как селективные, так и нейтральные процессы определяют эволюцию содержания GC в геноме человека». BMC Evol. Биол. 8: 99. Дои:10.1186/1471-2148-8-99. ЧВК  2292697. PMID  18371205.
  16. ^ Wuitschick JD, Karrer KM (1999). "Анализ геномного содержания G + C, использования кодонов, контекста кодонов инициатора и сайтов терминации трансляции в Tetrahymena thermophila". J. Eukaryot. Микробиол. 46 (3): 239–47. Дои:10.1111 / j.1550-7408.1999.tb05120.x. PMID  10377985.
  17. ^ а б Ромигье, Джонатан; Ранвез, Винсент; Douzery, Emmanuel J.P .; Гальтье, Николя (1 августа 2010 г.). «Противопоставление динамики содержания GC в 33 геномах млекопитающих: взаимосвязь с особенностями жизненного цикла и размерами хромосом». Геномные исследования. 20 (8): 1001–1009. Дои:10.1101 / гр.104372.109. ISSN  1088-9051. ЧВК  2909565. PMID  20530252.
  18. ^ Birdsell JA (1 июля 2002 г.). «Интеграция геномики, биоинформатики и классической генетики для изучения влияния рекомбинации на эволюцию генома». Мол. Биол. Evol. 19 (7): 1181–97. CiteSeerX  10.1.1.337.1535. Дои:10.1093 / oxfordjournals.molbev.a004176. PMID  12082137.
  19. ^ Международный консорциум по секвенированию генома человека (февраль 2001 г.). "Начальная последовательность и анализ человеческого генома". Природа. 409 (6822): 860–921. Bibcode:2001Натура.409..860л. Дои:10.1038/35057062. PMID  11237011.CS1 maint: использует параметр авторов (ссылка на сайт) (стр. 876)
  20. ^ Данные полного генома Saccharomyces cerevisiae на NCBI
  21. ^ Данные полного генома Arabidopsis thaliana на NCBI
  22. ^ Данные полного генома Плазмодий falciparum на NCBI
  23. ^ Мусто Х., Каччио С., Родригес-Маседа Х., Бернарди Дж. (1997). "Композиционные ограничения в геноме с чрезвычайно низким уровнем GC Плазмодий falciparum" (PDF). Mem. Inst. Освальдо Крус. 92 (6): 835–41. Дои:10.1590 / S0074-02761997000600020. PMID  9566216.
  24. ^ Дюре Л., Галтье Н. (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геном Хум Генет. 10: 285–311. Дои:10.1146 / annurev-genom-082908-150001. PMID  19630562. S2CID  9126286.
  25. ^ Уэйн LG; и другие. (1987). «Отчет специальной комиссии по согласованию подходов к бактериальной систематике». Международный журнал систематической бактериологии. 37 (4): 463–4. Дои:10.1099/00207713-37-4-463.
  26. ^ Браузер таксономии в NCBI
  27. ^ Данные полного генома Streptomyces coelicolor A3 (2) в NCBI
  28. ^ Карими К., Вуйчик Д., Олдах М., Визе П. (2018). «Выделение видов с использованием содержания GC в смешанных последовательностях ДНК или РНК». Evol Bioinform Online. 14 (1 января 2018 г.): 1176934318788866. Дои:10.1177/1176934318788866. ЧВК  6052495. PMID  30038485.
  29. ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). «Обширные различия в экспрессии генов между симбиотическими и апосимбиотическими книдариями». G3 (Bethesda). 4 (2): 277–95. Дои:10.1534 / g3.113.009084. ЧВК  3931562. PMID  24368779.

внешняя ссылка

  1. Таблица с GC-содержанием всех секвенированных прокариот
  2. Таксономический браузер бактерий на основе соотношения GC на сайте NCBI.
  3. Соотношение GC у разных видов.