Ридж (биология) - Ridge (biology)
Хребты (рэлиты яувеличениеd граммene еxpression) - это домены геном с высоким экспрессия гена; противоположность хребтов противомости. Этот термин впервые был использован Caron et al. в 2001.[1] Характеристики гребней:[1]
- Джин плотный
- Содержать много C и грамм азотистые основания
- У генов короткие интроны
- Высоко SINE повторение плотность
- Низкий LINE повтор плотность
Открытие
Кластеризация генов в прокариоты был известен давно. Их гены сгруппированы в опероны, гены в оперонах имеют общую промоторную единицу. Эти гены в основном функционально связаны. Геном прокариот относительно очень простой и компактный. В эукариоты геном огромен, и лишь небольшая его часть является функционально генами, кроме того, гены не организованы в опероны. Кроме нематоды и трипаносомы; хотя их опероны отличаются от оперонов прокариот. У эукариот каждый ген имеет собственный сайт регуляции транскрипции. Следовательно, гены не обязательно должны находиться в непосредственной близости для совместной экспрессии. Поэтому долгое время считалось, что эукариотические гены случайным образом распределяются по геному из-за высокой скорости хромосомных перестроек. Но благодаря тому, что стала доступна полная последовательность геномов, стало возможным абсолютно определить местонахождение гена и измерить его расстояние до других генов.
Первым секвенированным геномом эукариот был геном Saccharomyces cerevisiae, или зародышевые дрожжи, в 1996 году. Через полгода после этого Velculescu et al. (1997) опубликовали исследование, в котором они интегрировали МУДРЕЦ данные с доступной сейчас картой генома. Во время клеточного цикла в клетке активны разные гены. Поэтому они использовали данные SAGE из трех моментов клеточного цикла (лог-фаза, S фаза - арестован и G2 /M -фазные арестованные клетки). Поскольку в дрожжах у всех генов есть собственная промоторная единица, не предполагалось, что гены будут кластеризоваться рядом друг с другом, но это было так. Кластеры присутствовали на всех 16 хромосомах дрожжей.[2]Год спустя Cho et al. также сообщили (хотя и более подробно), что определенные гены у дрожжей расположены рядом друг с другом.[3]
Характеристики и функции
Совместное выражение
Cho et al. были первыми, кто определил, что кластерные гены имеют одинаковые уровни экспрессии. Они идентифицировали транскрипты, которые показывают периодичность, зависящую от клеточного цикла. Из этих генов 25% были расположены в непосредственной близости от других генов, которые были транскриптами в том же клеточном цикле. Cohen et al. (2000) также идентифицировали кластеры коэкспрессируемых генов.
Caron et al. (2001) составили карту транскриптома человека 12 различных тканей (раковых клеток) и пришли к выводу, что гены не распределены случайным образом по хромосомам. Вместо этого гены имеют тенденцию группироваться в группы, иногда по 39 генов в непосредственной близости. Кластеры были не только генными. Они идентифицировали 27 кластеров генов с очень высоким уровнем экспрессии и назвали их RIDGE. Обычный RIDGE насчитывает от 6 до 30 генов на сантиметр. Однако были большие исключения: от 40 до 50% RIDGE не имели такой генной плотности; как и в дрожжах, эти гребни располагались в теломер регионы.[1]
Lercher et al. (2002) указали на некоторые слабые стороны подхода Кэрон. Кластеры генов в непосредственной близости и с высоким уровнем транскрипции могут быть легко созданы тандемными дубликатами. Гены могут генерировать свои дубликаты, которые включаются в их окрестности. Эти дубликаты могут либо стать функциональной частью пути их родительского гена, либо (поскольку естественный отбор больше не поддерживает их) получить вредные мутации и превратиться в псевдогены. Поскольку эти дубликаты являются ложноположительными при поиске кластеров генов, их нужно исключить. Леркер исключил соседние гены с большим сходством друг с другом, после чего он поискал с помощью скользящего окна области с 15 соседними генами.[4]
Было ясно, что существуют генные плотные области. Обнаружилась поразительная корреляция между плотностью генов и высоким содержанием CG. Некоторые кластеры действительно имели высокие уровни экспрессии. Но большинство высокоэкспрессированных регионов состояли из генов домашнего хозяйства; гены, которые высоко экспрессируются во всех тканях, потому что они кодируют базальные механизмы. Только меньшая часть кластеров содержала гены, которые были ограничены конкретными тканями.
Versteeg et al. (2003) попытались с помощью более точной карты генома человека и более точных данных SAGE определить характеристики RIDGEs более специфическими. Перекрывающиеся гены рассматривались как один ген, а гены без интронов отвергались как псевдогены. Они определили, что RIDGE очень гены, имеют высокую экспрессию генов, короткие интроны, высокую плотность повторений SINE и низкую плотность повторений LINE. Кластеры, содержащие гены с очень низкими уровнями транскрипции, имели характеристики, противоположные RIDGE, поэтому эти кластеры были названы анти-мостиками.[5] Повторы LINE представляют собой мусорную ДНК, которая содержит сайт расщепления эндонуклеазой (TTTTA). Их нехватка в RIDGEs может быть объяснена тем фактом, что естественный отбор способствует недостатку LINE-повторов в ORF, потому что их эндонуклеазные сайты могут вызывать вредные мутации в генах. Почему так много SINE-повторов, пока не понятно.
Versteeg et al. также пришли к выводу, что, в отличие от анализа Леркерса, уровни транскрипции многих генов в RIDGE (например, кластер на хромосоме 9) могут сильно различаться в разных тканях. Ли и др. (2003) проанализировали тенденцию кластеризации генов между разными видами. Они сравнили Saccharomyces cerevisiae, Homo sapiens, Caenorhabditis elegans, Arabidopsis thaliana и Drosophila melanogaster, и обнаружил степень кластеризации как долю генов в рыхлых кластерах соответственно (37%), (50%), (74%), (52%) и (68%). Они пришли к выводу, что пути, по которым гены являются кластерами у многих видов, редки. Они обнаружили семь универсально сгруппированных путей: гликолиз, биосинтез аминоацил-тРНК, АТФ-синтаза, ДНК-полимераза, разложение гексахлорциклогексана, метаболизм цианоаминокислоты, и фотосинтез (АТФ синтез в нерастительных видах). Неудивительно, что это основные клеточные пути.[6]
Ли и др. использовались очень разнообразные группы животных. Внутри этих групп кластеризация сохраняется, например, кластерные мотивы у Homo sapiens и Mus musculus более или менее одинаковы.[7]
Спеллман и Рубин (2002) составили карту транскриптома Дрозофила. Из всех проанализированных генов 20% были сгруппированы. Кластеры состояли из 10-30 генов, размер группы составлял около 100 килобаз. Члены кластеров не были функционально связаны, и расположение кластеров не коррелировало с известными структурами хроматина.[8]
Это исследование также показало, что внутри кластеров уровни экспрессии в среднем 15 генов были примерно одинаковыми во многих использованных экспериментальных условиях. Это сходство было настолько поразительным, что авторы пришли к выводу, что гены в кластерах не регулируются индивидуально с помощью их личного промотора, но что здесь участвуют изменения в структуре хроматина. Похожая модель совместной регуляции была опубликована в том же году Roy et al. (2002) у C. elegans.[9]
Многие гены, сгруппированные в кластеры, демонстрируют одинаковые профили экспрессии в инвазивных протоковых карциномах молочной железы человека. Примерно 20% генов коррелируют со своими соседями. Кластеры коэкспрессируемых генов были разделены по областям с меньшей корреляцией между генами. Эти кластеры могут охватывать целое плечо хромосомы.
В отличие от ранее обсуждавшихся отчетов Johnidis et al. (2005) обнаружили, что (по крайней мере, некоторые) гены в кластерах не регулируются совместно. Aire - это фактор транскрипции, который оказывает повышающее и понижающее влияние на различные гены. Он действует при отрицательном отборе тимоцитов, которые реагируют на собственные эпитопы организма медуллярными клетками.[10]
Гены, которые контролировались воздухом, сгруппировались. 53 из генов, наиболее активируемых aire, имели соседа, активированного воздухом, в пределах 200 кбайт или меньше, а 32 гена, наиболее репрессированных с помощью aire, имели соседа, репрессированного воздухом, в пределах 200 кбайт; это меньше, чем ожидалось из-за изменений. Они провели такой же скрининг на регулятор транскрипции CIITA.
Эти регуляторы транскрипции не оказывали одинакового действия на все гены в одном кластере. Гены, которые были активированы, репрессированы или не затронуты, иногда присутствовали в одном кластере. В этом случае невозможно, чтобы гены, регулируемые воздухом, были сгруппированы, потому что все они совместно регулируются.
Так что не очень ясно, совместно регулируются домены или нет. Очень эффективный способ проверить это - вставить синтетические гены в RIDGE, анти-мостики и / или случайные места в геноме и определить их экспрессию. Эти уровни экспрессии необходимо сравнивать друг с другом. Gierman et al. (2007) были первыми, кто доказал совместное регулирование с использованием этого подхода. В качестве вставной конструкции использовали флуоресцентный GFP ген, управляемый повсеместно экспрессируемым промотором фосфоглицераткиназы человека (PGK). Они интегрировали эту конструкцию в 90 различных позиций в геноме человека. HEK293 клетки. Они обнаружили, что экспрессия конструкции в Ridges действительно была выше, чем экспрессия конструкции, встроенной в антисвязи (в то время как все конструкции имеют одинаковый промотор).[11]
Они исследовали, были ли эти различия в экспрессии следствием генов, находящихся в непосредственном соседстве с конструкциями, или всего домена в целом. Они обнаружили, что конструкции, расположенные рядом с высокоэкспрессируемыми генами, были немного более выражены, чем другие. Но когда увеличили размер окна до окружающих 49 генов (уровень домена), они увидели, что конструкции, расположенные в доменах с общей высокой экспрессией, имеют более чем в 2 раза более высокую экспрессию, чем конструкции, расположенные в доменах с низким уровнем экспрессии.
Они также проверили, экспрессируется ли конструкция на том же уровне, что и соседние гены, и присутствует ли эта тесная коэкспрессия только в пределах RIDGE. Они обнаружили, что выражения сильно коррелировали внутри хребтов и почти отсутствовали ближе к концу и за пределами хребтов.
Предыдущие наблюдения и исследования Gierman et al. доказали, что активность домена имеет большое влияние на экспрессию расположенных в нем генов. И гены в RIDGE коэкспрессируются. Однако конструкции, использованные Gierman et al. регулировались всеми постоянно активными промоторами. Гены исследования Johnidis et al. зависели от присутствия фактора транскрипции воздуха. Странная экспрессия генов, регулируемых aire, могла частично быть вызвана различиями в экспрессии и конформации самого фактора транскрипции aire.
Функциональное отношение
Еще до эры генома было известно, что сгруппированные гены имеют тенденцию быть функционально связанными. Abderrahim et al. (1994) показали, что все гены главного комплекса гистосовместимости сгруппированы на хромосоме 6p21. Рой и др. (2002) показали, что у нематоды C. elegans гены, которые экспрессируются исключительно в мышечной ткани во время личиночной стадии, имеют тенденцию группироваться в небольшие группы из 2–5 генов. Они выделили 13 кластеров.
Ямашита и др. (2004) показали, что гены, связанные со специфическими функциями органов, имеют тенденцию к кластеризации. Шесть доменов, связанных с печенью, содержали гены метаболизма ксенобиотиков, липидов и алкоголя. Пять доменов, связанных с толстой кишкой, имели гены апоптоза, пролиферации клеток, переносчика ионов и продукции муцина. Эти кластеры были очень маленькими, а уровни экспрессии были низкими. Гены, связанные с мозгом и грудью, не сгруппировались.[12]
Это показывает, что по крайней мере некоторые кластеры состоят из функционально связанных генов. Однако бывают большие исключения. Спеллман и Рубин показали, что существуют кластеры коэкспрессируемых генов, которые функционально не связаны. Кажется, что кластеры появляются в самых разных формах.
Регулирование
Cohen et al. обнаружили, что из пары коэкспрессируемых генов только один промотор имеет Последовательность активации восходящего потока (UAS), связанный с этим шаблоном выражения. Они предположили, что UAS могут активировать гены, которые не находятся в непосредственном соседстве с ними. Это объяснение могло бы объяснить коэкспрессию небольших кластеров, но многие кластеры содержат множество генов, которые должны регулироваться одним UAS.
Хроматин изменения являются правдоподобным объяснением совместной регуляции, наблюдаемой в кластерах. Хроматин состоит из нити ДНК и гистоны которые прикреплены к ДНК. Области, в которых хроматин очень плотно упакован, называются гетерохроматином. Гетерохроматин очень часто состоит из остатков вирусных геномов, транспозоны и прочая мусорная ДНК. Из-за плотной упаковки ДНК почти недоступна для механизма транскрипции, покрытие вредоносной ДНК белками - это способ, которым клетка может защитить себя. Хроматин, который состоит из функциональных генов, часто представляет собой открытую структуру, в которой ДНК доступна. Однако нет необходимости постоянно экспрессировать большинство генов.
ДНК с ненужными генами может быть покрыта гистонами. Когда ген должен быть экспрессирован, особые белки могут изменять химические соединения, прикрепленные к гистонам (модификации гистонов), которые заставляют гистоны открывать структуру. Когда хроматин одного гена открывается, хроматин соседних генов также остается, пока эта модификация не встретит граничный элемент. Таким образом, гены в непосредственной близости экспрессируются в одно и то же время. Итак, гены сгруппированы в «центры экспрессии». По сравнению с этой моделью Gilbert et al. (2004) показали, что RIDGEs в основном присутствуют в структурах открытого хроматина.[13][14]
Однако Johnidis et al. (2005) показали, что гены в одном кластере могут выражаться по-разному. Как именно работает регуляция эукариотических генов и связанные с ними изменения хроматина, все еще очень неясно, и по этому поводу нет единого мнения. Чтобы получить четкое представление о механизме кластеров генов, сначала необходимо осветить работу хроматина и регуляцию генов. Кроме того, большинство работ, в которых идентифицированы кластеры совместно регулируемых генов, сосредоточены на уровнях транскрипции, тогда как немногие сосредоточены на кластерах, регулируемых одними и теми же транскрипционные факторы. Johnides et al. открыли странные явления, когда они это сделали.
Происхождение
Первые модели, которые пытались объяснить кластеризацию генов, были, конечно, сосредоточены на оперонах, потому что они были открыты до того, как были обнаружены кластеры генов эукариот. В 1999 году Лоуренс предложил модель оперонов происхождения. Этот эгоистичная модель оперона предполагает, что отдельные гены были сгруппированы вместе путем вертикального и горизонтального переноса и сохранены как единое целое, потому что это было полезно для генов, а не для организма как такового. Эта модель предсказывает, что кластеры генов должны сохраняться между видами. Это не так для многих оперонов и кластеров генов, наблюдаемых у эукариот.[15]
Согласно Эйхлеру и Санкофф, двумя средними процессами в эволюции хромосом эукариот являются 1) перестройки хромосомных сегментов и 2) локализованная дупликация генов. Кластеризацию можно объяснить тем, что все гены в кластере произошли от тандемных дубликатов общего предка. Если бы все коэкспрессируемые гены в кластере произошли от общего предкового гена, можно было бы ожидать, что они коэкспрессируются, потому что все они имеют сопоставимые промоторы. Однако кластеризация генов - очень распространенный шаг в геномах, и неясно, как эта модель дупликации может объяснить всю кластеризацию. Более того, многие гены, которые присутствуют в кластерах, не гомологичны.
Как вообще эволюционно не связанные гены оказались в непосредственной близости? Либо существует сила, которая сближает функционально связанные гены друг с другом, либо гены приблизились благодаря изменению. Сингер и др. предположили, что гены оказались в непосредственной близости от случайной рекомбинации сегментов генома. Когда функционально связанные гены находились в непосредственной близости друг от друга, эта близость сохранялась. Они определили все возможные сайты рекомбинации между генами человека и мыши. После этого они сравнили кластеризацию генома мыши и человека и посмотрели, произошла ли рекомбинация в потенциально рекомбинационных сайтах. Оказалось, что рекомбинация между генами одного кластера происходит очень редко. Итак, как только функциональный кластер образуется, рекомбинация подавляется клеткой. На половых хромосомах количество кластеров очень мало как у человека, так и у мыши. По мнению авторов, это связано с низкой скоростью хромосомных перестроек половых хромосом.
Области открытого хроматина являются активными областями. Более вероятно, что гены будут перенесены в эти регионы. В эти области чаще вставляются гены органелл и генома вируса. Таким образом негомологичные гены могут быть спрессованы в небольшой домен.[16]
Возможно, что некоторые участки генома лучше подходят для важных генов. Для клетки важно, чтобы гены, отвечающие за базовые функции, были защищены от рекомбинации. У дрожжей и червей было замечено, что основные гены имеют тенденцию группироваться в регионах с небольшой скоростью репликации.[17]
Возможно, в результате изменения гены оказались в непосредственной близости. Были предложены другие модели, но ни одна из них не может объяснить все наблюдаемые явления. Ясно, что как только кластеры образуются, они сохраняются естественным отбором. Однако точной модели того, как гены оказались в непосредственной близости, до сих пор нет.
Большая часть нынешних кластеров, должно быть, сформировалась относительно недавно, потому что только семь кластеров функционально связанных генов сохраняются между типами. Некоторые из этих различий можно объяснить тем фактом, что экспрессия генов очень по-разному регулируется разными типами. Например, у позвоночных и растений метилирование ДНК используется, тогда как у дрожжей и мух оно отсутствует.[18]
Смотрите также
Примечания
- ^ а б c Карон Х., ван Шайк Б., ван дер Ми М. и др. (Февраль 2001 г.). «Карта транскриптома человека: кластеризация высокоэкспрессированных генов в хромосомных доменах». Наука. 291 (5507): 1289–92. Дои:10.1126 / science.1056794. PMID 11181992.
- ^ Велкулеску В.Е., Чжан Л., Чжоу В. и др. (Январь 1997 г.). «Характеристика дрожжевого транскриптома». Клетка. 88 (2): 243–51. Дои:10.1016 / S0092-8674 (00) 81845-0. PMID 9008165.
- ^ Чо Р.Дж., Кэмпбелл М.Дж., Винзелер Е.А. и др. (Июль 1998 г.). «Полногеномный транскрипционный анализ митотического клеточного цикла». Мол. Клетка. 2 (1): 65–73. Дои:10.1016 / S1097-2765 (00) 80114-8. PMID 9702192.
- ^ Леркер М.Дж., Уррутия А.О., Херст Л.Д. (июнь 2002 г.). «Кластеризация генов домашнего хозяйства обеспечивает единую модель порядка генов в геноме человека». Nat. Genet. 31 (2): 180–3. Дои:10.1038 / ng887. PMID 11992122.
- ^ Верстег Р., ван Шайк Б.Д., ван Батенбург М.Ф. и др. (Сентябрь 2003 г.). «Карта транскриптома человека выявляет крайние значения плотности генов, длины интронов, содержания GC и паттерна повторов для доменов сильно и слабо экспрессируемых генов». Genome Res. 13 (9): 1998–2004. Дои:10.1101 / гр.1649303. ЧВК 403669. PMID 12915492.
- ^ Ли Дж. М., Зоннхаммер Э.Л. (май 2003 г.). «Геномный кластерный анализ путей у эукариот». Genome Res. 13 (5): 875–82. Дои:10.1101 / гр.737703. ЧВК 430880. PMID 12695325.
- ^ Певица Г. А., Ллойд А. Т., Гуминецкий Л. Б., Вольф К. Х. (март 2005 г.). «Кластеры коэкспрессируемых генов в геномах млекопитающих законсервированы естественным отбором». Мол. Биол. Evol. 22 (3): 767–75. Дои:10.1093 / molbev / msi062. PMID 15574806.
- ^ Спеллман П.Т., Рубин Г.М. (2002). "Доказательства наличия больших доменов одинаково экспрессируемых генов в Дрозофила геном ". J. Biol. 1 (1): 5. Дои:10.1186/1475-4924-1-5. ЧВК 117248. PMID 12144710.
- ^ Рой П.Дж., Стюарт Дж. М., Лунд Дж., Ким С. К. (август 2002 г.). "Хромосомная кластеризация генов, экспрессируемых мышцами в Caenorhabditis elegans". Природа. 418 (6901): 975–9. Дои:10.1038 / природа01012. PMID 12214599.
- ^ Johnnidis JB, Venanzi ES, Taxman DJ, Ting JP, Benoist CO, Mathis DJ (май 2005 г.). «Хромосомная кластеризация генов, контролируемых фактором транскрипции воздуха». Proc. Natl. Акад. Sci. СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ. 102 (20): 7233–8. Дои:10.1073 / pnas.0502670102. ЧВК 1129145. PMID 15883360.
- ^ Гирман Х. Дж., Индеманс М. Х., Костер Дж. И др. (Сентябрь 2007 г.). «Общедоменная регуляция экспрессии генов в геноме человека». Genome Res. 17 (9): 1286–95. Дои:10.1101 / гр.6276007. ЧВК 1950897. PMID 17693573.
- ^ Ямасита Т., Хонда М., Такатори Х., Нишино Р., Хосино Н., Канеко С. (ноябрь 2004 г.). «Полногеномный анализ картирования транскриптомов позволяет идентифицировать органоспецифические паттерны экспрессии генов вдоль хромосом человека». Геномика. 84 (5): 867–75. Дои:10.1016 / j.ygeno.2004.08.008. PMID 15475266.
- ^ Kosak ST, Groudine M (октябрь 2004 г.). «Порядок генов и динамические домены». Наука. 306 (5696): 644–7. Дои:10.1126 / science.1103864. PMID 15499009.
- ^ Гилберт Н., Бойл С., Фиглер Х, Вудфайн К., Картер Н. П., Бикмор В. А. (сентябрь 2004 г.). «Хроматиновая архитектура генома человека: богатые генами домены обогащены открытыми волокнами хроматина». Клетка. 118 (5): 555–66. Дои:10.1016 / j.cell.2004.08.011. PMID 15339661.
- ^ Лоуренс Дж. Г. (сентябрь 1997 г.). «Эгоистичные опероны и видообразование путем переноса генов». Тенденции Microbiol. 5 (9): 355–9. Дои:10.1016 / S0966-842X (97) 01110-4. PMID 9294891.
- ^ Лефай Э., Фернандес-Морено М.А., Кагуни Л.С., Гарес Р. (июнь 2000 г.). "Очень компактная структура геномной области митохондриальной ДНК-полимеразы Drosophila melanogaster: функциональные и эволюционные последствия ». Насекомое Mol. Биол. 9 (3): 315–22. Дои:10.1046 / j.1365-2583.2000.00191.x. PMID 10886416.
- ^ Пал С., Херст Л.Д. (март 2003 г.). «Доказательства совместной эволюции порядка генов и скорости рекомбинации». Nat. Genet. 33 (3): 392–5. Дои:10.1038 / ng1111. PMID 12577060.
- ^ Регев А., Лэмб М.Дж., Яблонька Е. (июль 1998 г.). «Роль метилирования ДНК у беспозвоночных: регуляция развития или защита генома?» (PDF). Мол Биол Эвол. 15 (7): 880–891. Дои:10.1093 / oxfordjournals.molbev.a025992.