GC-контент - GC-content
В молекулярная биология и генетика, GC-контент (или же содержание гуанин-цитозина) - процент азотистые основания в ДНК или РНК молекулы, которые либо гуанин (G) или цитозин (С).[1] Этот показатель показывает долю оснований G и C от подразумеваемых четырех оснований, включая аденин и тимин в ДНК и аденине и урацил в РНК.
GC-содержание может быть дано для определенного фрагмента ДНК или РНК или для всего геном. Когда он относится к фрагменту, он может обозначать GC-контент отдельного человека. ген или часть гена (домена), группа генов или кластеры генов, некодирующая область, или синтетический олигонуклеотид например, грунтовка.
Структура
Качественно гуанин (G) и цитозин (C) подвергаются специфической водородная связь друг с другом, тогда как аденин (A) специфически связывается с тимином (T) в ДНК и с урацилом (U) в РНК. Количественно каждый GC базовая пара удерживается вместе тремя водородными связями, в то время как пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть эту разницу, пары оснований часто представлены как «G≡C» по сравнению с «A = T» или «A = U».
ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако сами водородные связи не оказывают особенно значительного влияния на молекулярную стабильность, которая вместо этого вызывается в основном молекулярными взаимодействиями при укладке оснований.[2] Несмотря на более высокий термостойкость придается нуклеиновой кислоте с высоким содержанием GC, было замечено, что по крайней мере некоторые виды бактерии с ДНК с высоким содержанием GC проходят автолиз легче, тем самым снижая долговечность клетки как таковой.[3] Из-за термостабильности пар GC когда-то считалось, что высокое содержание GC было необходимым приспособление к высоким температурам, но эта гипотеза была опровергнута в 2001 году.[4] Тем не менее, было показано, что существует сильная корреляция между оптимальным ростом прокариоты при более высоких температурах и GC-содержании структурных РНК, таких как рибосомальная РНК, переносить РНК, и многие другие некодирующие РНК.[4][5] Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.
Совсем недавно было продемонстрировано, что наиболее важный фактор, способствующий термостабильности двухцепочечных нуклеиновых кислот, на самом деле связан с укладкой оснований соседних оснований, а не с количеством водородных связей между основаниями. Энергия стэкинга для пар GC более благоприятна, чем для пар AT или AU из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком укладки оснований и термической стабильностью молекулы в целом.[6]
определение
GC-контент обычно выражается в процентах, но иногда в виде отношения (так называемого Соотношение G + C или GC-коэффициент). Процент содержания ГХ рассчитывается как[7]
тогда как отношение AT / GC рассчитывается как[8]
- .
Процентное содержание GC, а также GC-соотношение можно измерить несколькими способами, но один из самых простых методов - это измерение температура плавления ДНК двойная спираль с помощью спектрофотометрия. В поглощение ДНК на длина волны из 260 нм возрастает довольно резко, когда двухцепочечная молекула ДНК разделяется на две одноцепочечные цепи при достаточном нагревании.[9] Наиболее часто используемый протокол для определения GC-соотношений использует проточной цитометрии для большого количества образцов.[10]
В качестве альтернативы, если исследуемая молекула ДНК или РНК была надежно последовательный, то GC-контент можно точно рассчитать с помощью простой арифметики или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор GC.
Геномное содержание
Вариация внутри генома
Было обнаружено, что GC-соотношение в геноме заметно варьируется. Эти вариации в GC-соотношении в геномах более сложных организмов приводят к мозаичному образованию с островными областями, называемыми изохоры.[11] Это приводит к вариациям интенсивности окрашивания в хромосомы.[12] GC-богатые изохоры обычно включают в себя множество генов, кодирующих белок, и, таким образом, определение GC-соотношений этих специфических областей способствует отображение богатые генами области генома.[13][14]
Кодирующие последовательности
В длинном участке геномной последовательности гены часто характеризуются более высоким содержанием GC по сравнению с фоновым содержанием GC для всего генома. Свидетельство соотношения GC и длины кодирующая область из ген показал, что длина кодирующей последовательности прямо пропорциональна более высокому содержанию G + C.[15] Это было указано на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов A и T, и, таким образом, чем короче последовательность, тем выше смещение AT.[16]
Сравнение более 1000 ортологичный гены у млекопитающих показали заметные внутригеномные вариации позиция третьего кодона Содержание ГХ в диапазоне от менее 30% до более 80%.[17]
Вариация между геномами
Было обнаружено, что содержание ГК варьируется у разных организмов, и предполагается, что этому процессу будет способствовать изменение в отбор, мутационная предвзятость и предвзятость, связанная с рекомбинацией Ремонт ДНК.[18]
Среднее содержание GC в геномах человека колеблется от 35% до 60% по 100-килобайтным фрагментам, в среднем 41%.[19] GC-содержание Дрожжи (Saccharomyces cerevisiae ) составляет 38%,[20] и еще один общий модельный организм, тале кресс (Arabidopsis thaliana ), составляет 36%.[21] Из-за характера генетический код, для организма практически невозможно иметь геном с содержанием GC, приближающимся к 0% или 100%. Однако виды с чрезвычайно низким содержанием GC Плазмодий falciparum (GC% = ~ 20%),[22] и обычно принято называть такие примеры богатыми AT, а не бедными GC.[23]
Несколько видов млекопитающих (например, землеройка, микробат, Tenrec, кролик ) независимо подверглись заметному увеличению содержания GC в своих генах. Эти изменения содержания GC коррелируют с видами жизненно важные черты (например, масса тела или продолжительность жизни) и размер генома,[17] и может быть связано с молекулярным феноменом, называемым GC-biased преобразование гена.[24]
Приложения
Молекулярная биология
В полимеразной цепной реакции (ПЦР), GC-содержание коротких олигонуклеотидов, известных как грунтовки часто используется для прогнозирования их температура отжига к матричной ДНК. Более высокий уровень содержания ГХ указывает на относительно более высокую температуру плавления.
Систематика
В проблема вида в неэукариотической таксономии привело к различным предложениям по классификации бактерий, и специальный комитет по согласованию подходов к бактериальной систематике рекомендовал использовать GC-коэффициенты в иерархической классификации более высокого уровня.[25] Например, Актинобактерии характеризуются как "высокое содержание GC бактерии ".[26] В Streptomyces coelicolor A3 (2), GC-содержание 72%.[27]
Программные инструменты
GCSpeciesSorter[28] и TopSort[29] представляют собой программные инструменты для классификации видов на основе их GC-содержимого.
Смотрите также
Рекомендации
- ^ Определение GC - контент на CancerWeb из Ньюкаслский университет,ВЕЛИКОБРИТАНИЯ
- ^ Яковчук П., Протозанова Е., Франк-Каменецкий М.Д. (2006). «Вклады укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Нуклеиновые кислоты Res. 34 (2): 564–74. Дои:10.1093 / нар / gkj454. ЧВК 1360284. PMID 16449200.
- ^ Левин Р.Э., Ван Сикл С. (1976). «Автолиз изолятов Pseudomonas putrefaciens с высоким уровнем GC». Антони ван Левенгук. 42 (1–2): 145–55. Дои:10.1007 / BF00399459. PMID 7999.
- ^ а б Hurst LD, Merchant AR (март 2001 г.). «Высокое содержание гуанин-цитозина не является адаптацией к высокой температуре: сравнительный анализ среди прокариот». Proc. Биол. Наука. 268 (1466): 493–7. Дои:10.1098 / rspb.2000.1397. ЧВК 1088632. PMID 11296861.
- ^ Galtier, N .; Лобри, Дж. Р. (1997). «Взаимосвязь между содержанием G + C в геноме, вторичными структурами РНК и оптимальной температурой роста прокариот». Журнал молекулярной эволюции. 44 (6): 632–636. Bibcode:1997JMolE..44..632G. Дои:10.1007 / PL00006186. PMID 9169555.
- ^ Яковчук, Петр; Протозанова, Екатерина; Франк-Каменецкий, Максим Д. (2006). «Вклады укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Исследования нуклеиновых кислот. 34 (2): 564–574. Дои:10.1093 / нар / gkj454. ISSN 0305-1048. ЧВК 1360284. PMID 16449200.
- ^ Мэдиган, MT. и Мартинко JM. (2003). Брок биология микроорганизмов (10-е изд.). Пирсон-Прентис Холл. ISBN 978-84-205-3679-8.
- ^ Определение GC-ratio в Северо-Западном университете, Иллинойс, США
- ^ Вильгельм Дж., Пингоуд А., Хан М. (май 2003 г.). «Метод ПЦР в реальном времени для оценки размеров генома». Нуклеиновые кислоты Res. 31 (10): e56. Дои:10.1093 / nar / gng056. ЧВК 156059. PMID 12736322.
- ^ Виноградов А.Е. (май 1994 г.). «Измерение с помощью проточной цитометрии геномного отношения AT / GC и размера генома». Цитометрия. 16 (1): 34–40. Дои:10.1002 / cyto.990160106. PMID 7518377.
- ^ Бернарди Г (январь 2000 г.). «Изохоры и эволюционная геномика позвоночных». Ген. 241 (1): 3–17. Дои:10.1016 / S0378-1119 (99) 00485-0. PMID 10607893.
- ^ Фьюри Т.С., Хаусслер Д. (май 2003 г.). «Интеграция цитогенетической карты с проектом последовательности генома человека». Гм. Мол. Genet. 12 (9): 1037–44. Дои:10.1093 / hmg / ddg113. PMID 12700172.
- ^ Самнер А. Т., де ла Торре Дж., Ступпиа Л. (август 1993 г.). «Распределение генов по хромосомам: цитологический подход». J. Mol. Evol. 37 (2): 117–22. Bibcode:1993JMolE..37..117S. Дои:10.1007 / BF02407346. PMID 8411200.
- ^ Айссани Б., Бернарди Г. (октябрь 1991 г.). «Острова CpG, гены и изохоры в геномах позвоночных». Ген. 106 (2): 185–95. Дои:10.1016 / 0378-1119 (91) 90198-К. PMID 1937049.
- ^ Поццоли У., Меноцци Дж., Фумагалли М. и др. (2008). «Как селективные, так и нейтральные процессы определяют эволюцию содержания GC в геноме человека». BMC Evol. Биол. 8: 99. Дои:10.1186/1471-2148-8-99. ЧВК 2292697. PMID 18371205.
- ^ Wuitschick JD, Karrer KM (1999). "Анализ геномного содержания G + C, использования кодонов, контекста кодонов инициатора и сайтов терминации трансляции в Tetrahymena thermophila". J. Eukaryot. Микробиол. 46 (3): 239–47. Дои:10.1111 / j.1550-7408.1999.tb05120.x. PMID 10377985.
- ^ а б Ромигье, Джонатан; Ранвез, Винсент; Douzery, Emmanuel J.P .; Гальтье, Николя (1 августа 2010 г.). «Противопоставление динамики содержания GC в 33 геномах млекопитающих: взаимосвязь с особенностями жизненного цикла и размерами хромосом». Геномные исследования. 20 (8): 1001–1009. Дои:10.1101 / гр.104372.109. ISSN 1088-9051. ЧВК 2909565. PMID 20530252.
- ^ Birdsell JA (1 июля 2002 г.). «Интеграция геномики, биоинформатики и классической генетики для изучения влияния рекомбинации на эволюцию генома». Мол. Биол. Evol. 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535. Дои:10.1093 / oxfordjournals.molbev.a004176. PMID 12082137.
- ^ Международный консорциум по секвенированию генома человека (февраль 2001 г.). "Начальная последовательность и анализ человеческого генома". Природа. 409 (6822): 860–921. Bibcode:2001Натура.409..860л. Дои:10.1038/35057062. PMID 11237011.CS1 maint: использует параметр авторов (ссылка на сайт) (стр. 876)
- ^ Данные полного генома Saccharomyces cerevisiae на NCBI
- ^ Данные полного генома Arabidopsis thaliana на NCBI
- ^ Данные полного генома Плазмодий falciparum на NCBI
- ^ Мусто Х., Каччио С., Родригес-Маседа Х., Бернарди Дж. (1997). "Композиционные ограничения в геноме с чрезвычайно низким уровнем GC Плазмодий falciparum" (PDF). Mem. Inst. Освальдо Крус. 92 (6): 835–41. Дои:10.1590 / S0074-02761997000600020. PMID 9566216.
- ^ Дюре Л., Галтье Н. (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геном Хум Генет. 10: 285–311. Дои:10.1146 / annurev-genom-082908-150001. PMID 19630562. S2CID 9126286.
- ^ Уэйн LG; и другие. (1987). «Отчет специальной комиссии по согласованию подходов к бактериальной систематике». Международный журнал систематической бактериологии. 37 (4): 463–4. Дои:10.1099/00207713-37-4-463.
- ^ Браузер таксономии в NCBI
- ^ Данные полного генома Streptomyces coelicolor A3 (2) в NCBI
- ^ Карими К., Вуйчик Д., Олдах М., Визе П. (2018). «Выделение видов с использованием содержания GC в смешанных последовательностях ДНК или РНК». Evol Bioinform Online. 14 (1 января 2018 г.): 1176934318788866. Дои:10.1177/1176934318788866. ЧВК 6052495. PMID 30038485.
- ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). «Обширные различия в экспрессии генов между симбиотическими и апосимбиотическими книдариями». G3 (Bethesda). 4 (2): 277–95. Дои:10.1534 / g3.113.009084. ЧВК 3931562. PMID 24368779.