Эпитранскриптомное секвенирование - Epitranscriptomic sequencing

В эпитранскриптомное секвенирование, большинство методов сосредоточены на (1) обогащении и очистке модифицированных молекул РНК перед запуском на Секвенсор РНК, или (2) улучшение или изменение биоинформатика конвейеры анализа для вызова пиков модификации. Большинство методов были адаптированы и оптимизированы для мРНК молекулы, кроме модифицированных бисульфитное секвенирование для профилирования 5-метилцитидин который был оптимизирован для тРНК и рРНК.

Принципиальная схема рабочих процессов эпитранскриптомического секвенирования.

В молекулах РНК обнаруживаются шесть основных классов химических модификаций: N⁶-метиладенозин, N6,2'-O-диметиладенозин, 5-метилцитидин, 5-гидроксилметилцитидин, инозин, и псевдоуридин.^[1]^[2] Для профилирования каждого типа модификации были разработаны различные методы секвенирования. Будут обсуждены масштаб, разрешение, чувствительность и ограничения, связанные с каждым методом и соответствующими используемыми инструментами биоинформатики.

Основные классы модификаций РНК.

Методы профилирования N⁶-метиладенозин

Метилирование аденозин не влияет на его способность образовывать пары оснований с тимидин или же урацил, так N⁶-метиладенозин (м⁶A) не может быть обнаружен с помощью стандартного секвенирования или гибридизация методы.^[3] Эта модификация отмечена метилированием основания аденозина в положении азота-6. Он в изобилии встречается в полиА + мРНК; также содержится в тРНК, рРНК, мяРНК и долго нкРНК.

Методы, разработанные для профиля N⁶-метиладенозин.

m6A-seq и MeRIP-seq

В 2012 году появились первые два метода секвенирования m6A, которые позволили транскриптом -широкий профиль m6A в клетках млекопитающих.^[1] Эти два метода, называемые m6A-seq и MeRIP-seq (m6A-специфичный метилированный Иммунопреципитация РНК ), также являются первыми методами, позволяющими осуществлять любой тип секвенирования модификации РНК. Эти методы позволили обнаружить 10 000 пиков m6A в транскриптоме млекопитающих; пики, как было обнаружено, обогащены областями 3’UTR, рядом с кодонами STOP и в длинных экзонах.^[4]^[3]

Эти два метода были оптимизированы для обнаружения пиков метилирования в поли (A) + мРНК, но протокол можно было адаптировать для профилирования любого типа РНК. Собранный образец РНК фрагментируется на олигонуклеотиды длиной ~ 100 нуклеотидов с использованием буфера для фрагментации, иммунопреципитации с очищенным антителом против m6A, элюции и сбора меченных антителами молекул РНК. Процедура иммунопреципитации в MeRIP-Seq способна производить> 130-кратное обогащение последовательностей m6A.^[3] Было выполнено создание библиотеки кДНК с произвольным праймированием с последующим лигированием адаптера и секвенированием Illumina. Поскольку нити РНК разрываются случайным образом, сайт m6A, в принципе, должен находиться где-то в центре областей, с которыми выравниваются считывания последовательности. В крайнем случае, область будет примерно 200 нм в ширину (100 нм вверх и вниз по течению от сайта m6A).^[3]

Когда первый нуклеотид транскрипта представляет собой аденозин, помимо 2’-O-метилирования рибозы, это основание может быть дополнительно метилировано в положении N6.^[1]Было подтверждено, что m6A-seq может обнаруживать пики m6Am в сайтах начала транскрипции.^[5]^[4] Лигирование адаптера на обоих концах фрагмента РНК приводит к тому, что чтения имеют тенденцию накапливаться на 5 ’конце транскрипта. Schwartz et al. (2015) использовали эти знания для обнаружения сайтов mTSS, выбрав сайты с высоким соотношением размера pileups в выборках IP по сравнению с входной выборкой.^[4] Подтверждением тому является то, что> 80% высокообогащенных сайтов pileup содержали аденозин.

Разрешение этих методов составляет 100-200nt, что соответствует размеру фрагмента. У этих двух методов было несколько недостатков: (1) требовался значительный исходный материал, (2) низкое разрешение, что затрудняло точное определение фактического места с помощью метки m6A, и (3) не могли напрямую оценивать ложноположительные результаты.^[6]

В частности, в MeRIP-Seq инструменты биоинформатики, доступные в настоящее время, могут вызывать только 1 сайт на пик шириной ~ 100-200 тонн, поэтому значительная часть кластеризованных m6A (~ 64nt между каждым отдельным сайтом в кластере) пропускается.^[7]^[8] Каждый кластер может содержать до 15 остатков m6A.^[7]^[8]

В 2013 году вышла модифицированная версия m6A-seq на основе двух предыдущих методов m6A-seq и MeRIP-seq, направленная на увеличение разрешения, и продемонстрировала это на дрожжевом транскриптоме. Они достигли этого за счет уменьшения размера фрагмента и использования протокола подготовки библиотеки, специфичной для цепи, на основе лигирования, захватывающей оба конца фрагментированной РНК, гарантируя, что метилированное положение находится внутри секвенированного фрагмента.^[6] Путем дополнительной ссылки на консенсусный мотив m6A и исключения ложноположительных пиков m6A с использованием образцов отрицательного контроля профилирование m6A в дрожжах может быть выполнено с разрешением по одному основанию.

УФ-методы

PA-m6A-seq

УФ-индуцированное сшивание РНК-антитело был добавлен поверх m6A-seq для получения PA-m6A-seq (m6A-seq с помощью фото-кросслинкинга), который увеличивает разрешение до ~ 23nt. Первый, 4-тиуродин (4SU) включается в РНК путем добавления 4SU в ростовые среды, некоторые инкорпорационные площадки предположительно находятся рядом с местом расположения m6A. Затем проводится иммунопреципитация полноразмерной РНК с использованием m6A-специфического антитела [36]. Затем УФ-свет с длиной волны 365 нм направляется на РНК, чтобы активировать перекрестное связывание с антителом с 4SU. Сшитую РНК выделяли через элюирование конкуренции и фрагментирован дальше до ~ 25-30nt; протеиназа К был использован для разобщения Ковалентная связь между сайтом сшивки и антителом.^[6] Пептидные фрагменты, которые остаются после удаления антитела из РНК, заставляют основание считываться как C, а не как T во время обратной транскрипции, эффективно вызывая точечную мутацию в сайте перекрестного связывания 4SU.^[6] Короткие фрагменты подвергаются построению библиотеки и Секвенирование Illumina с последующим поиском согласованной последовательности метилирования. Наличие мутации T в C помогает увеличить отношение сигнал / шум при обнаружении сайта метилирования. ^[1] а также обеспечение большего разрешения последовательности метилирования. Одним из недостатков этого метода является то, что сайты m6A, которые не включали 4SU, не могут быть обнаружены. Еще одно предостережение заключается в том, что положение включения 4SU может варьироваться относительно любого отдельного остатка m6A, поэтому все еще остается сложной задачей точно определить местонахождение сайта m6A с помощью мутации T в C.

m6A-CLIP и miCLIP

m6A-CLIP ^[7] (перекрестная иммунопреципитация) и miCLIP ^[8] (Сшивание с индивидуальным разрешением нуклеотидов и иммунопреципитация m6A) представляют собой методы секвенирования на основе УФ-излучения. Эти два метода активируют сшивание при 254 нм, фрагментируют молекулы РНК перед иммунопреципитацией с антителом и не зависят от включения фотоактивируемых рибонуклеозидов - антитело напрямую сшивается с основанием, близким (очень предсказуемое расположение) к сайту m6A. Эти стратегии, основанные на УФ-излучении, используют антитела, которые индуцируют последовательные и предсказуемые паттерны мутаций и усечений в цепи кДНК во время обратной транскрипции, которые могут быть использованы для более точного определения местоположения сайта m6A.^[7]^[8] Хотя и m6A-CLIP, и miCLIP отвечают на УФ-индуцированные мутации, m6A-CLIP ^[7] отличается тем, что использует то преимущество, что только m6A может индуцировать усечение кДНК во время обратной транскрипции и генерировать однонуклеотидное картирование более чем в десять раз более точных сайтов m6A (MITS, сайты усечения, индуцированные m6A), что обеспечивает полное и объективное точное картирование m6A.^[7] Напротив, UV-картированные сайты m6A с помощью miCLIP - это лишь небольшая часть точных сайтов m6A. Точное расположение десятков тысяч сайтов m6A в мРНК человека и мыши с помощью m6A-CLIP показывает, что m6A обогащается на последнем экзоне, но не вокруг стоп-кодона.^[7]

В m6A-CLIP ^[7] и miCLIP,^[8] Сначала РНК фрагментируется до ~ 20-80 нт, затем во фрагментах, содержащих m6A, образовывался индуцированный УФ-излучением комплекс ковалентной РНК / m6A с длиной волны 254 нм. Антитело удаляли протеиназой К перед обратной транскрипцией, конструированием библиотеки и секвенированием. Остатки пептиды на сайте сшивания на РНК после удаления антитела приводит к вставкам, усечению и Мутации C в T в течение обратная транскрипция к кДНК, особенно в положении +1 к сайту m6A (5 ’к сайту m6A) в последовательности чтения.^[7]^[8] Положительные сайты, обнаруженные с помощью m6A-CLIP и miCLIP, имели высокий процент совпадений с сайтами, обнаруженными с помощью АЛЫЙ, который имеет более высокое локальное разрешение вокруг определенного сайта (см. ниже), подразумевая, что m6A-CLIP и miCLIP имеют высокое пространственное разрешение и низкий уровень ложного обнаружения.^[7]^[8] miCLIP был использован для обнаружения m6Am путем изучения сайтов усечения, индуцированных перекрестными связями, в 5’UTR.^[8]

Методы количественной оценки статуса модификации m6A

Хотя сайты m6A могут быть профилированы с высоким разрешением с использованием УФ-методов, стехиометрия сайтов m6A - статус метилирования или соотношение m6A + к m6A- для каждого отдельного сайта в пределах типа РНК - все еще неизвестна. АЛЫЙ (2013) и m6A-LAIC-seq (2016) позволяет количественно оценить стехиометрию в конкретном локусе и в масштабе транскриптома, соответственно.^[1]

Методы биоинформатики, используемые для анализа пиков m6A, не делают никаких предварительных предположений относительно последовательность мотивов в которых обычно находятся сайты m6A, и учитывают все возможные мотивы. Таким образом, вероятность пропуска сайтов снижается.^[8]

АЛЫЙ

SCARLET (сайт-специфическое расщепление и радиоактивное мечение с последующей экстракцией с помощью лигирования и тонкослойной хроматографией) используется для определения доли РНК в образце, которая несет метилированный аденин в определенном месте. Можно начать с общей РНК без необходимости обогащения целевой молекулой РНК. Следовательно, это особенно подходящий метод для количественной оценки статуса метилирования в РНК с низким содержанием, таких как тРНК. Однако это не подходит и нецелесообразно для крупномасштабного обнаружения сайтов m6A.^[8]^[9]

Процедура начинается с химерная ДНК олигонуклеотид отжиг к целевой РНК вокруг сайта модификации кандидата. Химерный оцДНК имеет модификации 2’OMe / 2’H и комплементарен целевой последовательности. Химерный олигонуклеотид служит ориентиром, позволяющим РНКаза H для расщепления цепи РНК именно на 5’-конце сайта-кандидата. Затем на место среза наносят радиоактивную метку фосфором-32 и перевязанный к олигонуклеотиду оцДНК 116nt с использованием ДНК-лигаза.^[10] РНКаза T1 / A вводится в образец для переваривания всей РНК, за исключением молекул РНК с прикрепленной 116-членной ДНК. Затем этот радиоактивно меченый продукт выделяют и расщепляют нуклеазой с образованием смеси модифицированных и немодифицированных аденозинов (5’P-m6A и 5’-P-A), которую разделяют с помощью тонкослойной хроматографии. Относительные пропорции двух групп можно определить с помощью уровней поглощения УФ-излучения.^[9]

m6A-LAIC-seq

m6A-LAIC-seq (секвенирование на уровне m6A и характеризации изоформ) - это высокопроизводительный подход для количественной оценки статуса метилирования по шкале полного транскриптома. В этом методе используются образцы полноразмерной РНК. РНК сначала подвергают иммунопреципитации с помощью антитела против m6A. К смеси добавляют избыточное количество антител, чтобы гарантировать удаление всех m6A-содержащих РНК. Смесь разделяют на пулы элюата (m6A + РНК) и супернатанта (m6A-РНК). Консорциум внешнего контроля РНК (ERCC) всплески добавляются к элюату и супернатанту, а также в независимую контрольную группу, состоящую только из пикового ERCC. После расщепления антител в пуле элюата каждую из трех смесей секвенируют на платформе секвенирования следующего поколения. Уровни m6A на сайт или ген можно количественно оценить с помощью ERCC-нормализованного содержания РНК в различных пулах.^[1]^[11] Поскольку используется полноразмерная РНК, можно напрямую сравнивать альтернативно сплайсированные изоформы между фракциями m6A + и m6A-, а также сравнивать распространенность изоформ в части m6A +.

Несмотря на успехи в секвенировании m6A, несколько проблем все еще остаются: (1) еще предстоит разработать метод, который характеризует стехиометрию между разными сайтами в одном и том же транскрипте; (2) Результаты анализа сильно зависят от алгоритм биоинформатики используется для вызова вершин; (3) Все современные методы используют m6A-специфические антитела для маркировки сайтов m6A, но сообщалось, что эти антитела содержат внутреннее смещение для последовательностей РНК.

Методы профилирования N6,2'-O-диметиладенозина (m6Am)

N6,2'-O-диметиладенозин, в изобилии полиА + мРНК, встречается на первом нуклеотиде после 5 ’крышка, когда дополнительная метильная группа добавляется к 2ʹ-O-метиладенозин остаток на «закрытом» 5 конце мРНК.^[1]

Поскольку m6Am можно распознать по антитела против m6A в сайты начала транскрипции, методы, используемые для профилирования m6A, могут быть адаптированы для профилирования m6Am, а именно m6A-seq и miCLIP (см. описания m6A-seq и miCLIP выше).

Методы профилирования 5-метилцитидина

Разработаны методы профилирования 5-метилцитидина.

5-метилцитидин, m5C, в изобилии содержится в мРНК и нкРНК, особенно в тРНК и рРНК. В тРНК эта модификация стабилизирует вторичная структура и влияет конформация стебель-петля антикодона.^[1] В рРНК m5C влияет на переводческая верность.^[1]

При разработке методов секвенирования m5C были использованы два принципа. Первый - подход на основе антител (бисуфитное секвенирование и m5C-RIP ), аналогично секвенированию m6C. Второй - обнаружение мишеней метилтрансфераз m5C РНК путем ковалентного связывания фермента с его мишенью, а затем использование IP, специфичного для целевого фермента, для обогащения молекулами РНК, содержащими метку (Aza-IP и miCLIP).

Модифицированное бисульфитное секвенирование

Секвенирование модифицированного бисульфита было оптимизировано для молекул рРНК, тРНК и миРНК из Дрозофила.^[12]Обработка бисульфитом наиболее широко использовалась для обнаружения dm5C (ДНК m5C ). Лечение существенно преобразует цитозин к уридин, но метилированные цитозины Обработка не повлияет на предыдущие попытки разработать протоколы секвенирования m5C с использованием бисульфитной обработки, но не могут эффективно решить проблему жесткой обработки РНК, которая вызывает значительную деградацию молекул. В частности, дезаминирование бисульфита обработка (высокий pH) РНК пагубно сказывается на стабильности фосфодиэфирные связи. В результате сложно предварительно обогатить молекулы РНК или получить достаточно продукта ПЦР правильного размера для глубокое секвенирование.

Модифицированная версия бисульфитного секвенирования была разработана Schaefer et al. (2009), которые снизили температуру обработки РНК бисульфитом с 95 ° C до 60 ° C.^[12] Обоснование модификации заключалось в том, что, поскольку РНК, в отличие от ДНК, не является двухцепочечной, а скорее состоит из областей одноцепочечной структуры, двухцепочечных стволовых структур и петель, можно было бы раскрутить РНК при гораздо более низкой температуре. . Действительно, РНК можно было обрабатывать в течение 180 минут при 60 ° C без значительной потери ПЦР ампликоны ожидаемого размера.^[12] Было установлено, что степень дезаминирования составляет 99% через 180 минут обработки.

После обработки фрагментированной РНК бисульфитом выполняется обратная транскрипция с последующей ПЦР-амплификация продуктов кДНК, и, наконец, было выполнено глубокое секвенирование с использованием Рош 454 Платформа.^[12]

Поскольку разработчики метода использовали платформу Roche, они также использовали Анализатор вариантов GS Amplicon (Roche) за анализ данных глубокого секвенирования для количественной оценки содержания цитозина, специфичного для последовательности. Однако в недавних работах было высказано предположение, что этот метод имеет несколько недостатков: (1) Неполное преобразование обычных цитозинов в двухцепочечных областях РНК; (2) области, содержащие другие модификации, которые привели к устойчивости к бисульфитной обработке; и (3) сайты, содержащие потенциально ложноположительные результаты из-за (1) и (2) ^[13]^[14]^[15] Кроме того, возможно, что глубина секвенирования все еще недостаточно высока для правильного обнаружения всех метилированных сайтов.^[1]

Аза-ИП

Аза-ИП 5-азацитидин-опосредованная иммунопреципитация РНК оптимизирован и используется для обнаружения целей метилтрансферазы, особенно NSUN2 и DNMT2 ^[16] - два основных фермента, ответственных за нанесение метки m5C.

Во-первых, ячейку заставляют сверхэкспрессировать ан эпитоп - меченое производное метитрансферазы m5C-РНК, чтобы антитело, используемое позже для иммунопреципитации, могло распознавать фермент. Второй, 5-аза-С вводится в клетки так, чтобы его можно было включить в формирующуюся РНК вместо цитозина. Обычно метилтрансферазы высвобождаются (т.е. ковалентная связь между цитозином и метилтрансферазой разрывается) после метилирования остатка. Для 5-аза-C из-за замещения азота в положении C5 цитозина фермент РНК-метитрансфераза остается ковалентно связанным с молекулой РНК-мишени в положении C6.^[16]

В-третьих, ячейка лизированный и представляющая интерес m5C-РНК-метилтрансфераза иммунопреципитируется вместе с молекулами РНК, которые ковалентно связаны с белком. Этап IP обеспечил более 200-кратное обогащение РНК-мишеней, которые в основном были тРНК. Затем обогащенные молекулы фрагментировали и очищали. Затем создается библиотека кДНК и выполняется секвенирование.^[16]

Важной дополнительной особенностью является то, что ковалентное связывание РНК-метилтрансферазы с C5 m-аза-C вызывает перестройку и открытие кольца. Это раскрытие кольца приводит к предпочтительному спариванию с цитозином и, следовательно, при секвенировании читается как гуанозин. Эта трансверсия C в G позволяет обнаруживать сайты m5C с базовым разрешением.^[1] Одно предостережение заключается в том, что сайты m5C, не замещенные 5-азацитозином, будут упущены.

miCLIP

miCLIP (Иммунопреципитация сшивания, индуцированная метилированием ) использовался для обнаружения NSUN2 целей, которые оказались в основном некодирующие РНК такие как тРНК. Индуцированная мутация C271A в NSUN2 ингибирует высвобождение фермента из РНК-мишени. Эта мутация была сверхэкспрессирована в интересующих клетках, и мутировавший NSUN2 также был помечен Эпитоп Myc. Ковалентно связанные комплексы РНК-белок выделяют иммунопреципитацией Myc-специфического антитела. Эти комплексы подтверждены и обнаружены радиоактивная маркировка с фосфор-32. Затем РНК извлекается из комплекса, подвергается обратной транскрипции, амплифицируется с помощью ПЦР и секвенируется с использованием платформ следующего поколения.

И miCLIP, и Aza-IP, хотя и ограничены специфическим воздействием на ферменты, могут позволить обнаруживать метилированные РНК с низким содержанием без глубокого секвенирования.^[1]

Методы профилирования инозина

Инозин создается ферментативно при модификации остатка аденозина.

Метод идентификации инозина: пары оснований инозина с цитидином, а аденозин - с урацилом.

Анализ свойств пары оснований

Поскольку химический состав инозина представляет собой дезаминированный аденозин, это одно из немногих изменений метилирования, которое сопровождается изменением спаривания оснований, на котором можно извлечь выгоду. Исходный аденозиновый нуклеотид будет соединяться с тимином, а метилированный инозин будет соединяться с цитозином. кДНК последовательности, полученные rtPCR поэтому можно сравнить с соответствующими геномными последовательностями; в сайтах, где остатки A повторно интерпретируются как G, можно предположить событие метилирования. С достаточно высокой точностью возможно, что количество молекул мРНК в популяции, которые были метилированы, можно рассчитать в процентах. Этот метод потенциально имеет разрешение одного нуклеотида. Фактически, обилие данных по РНК-секвенированию, которые в настоящее время общедоступны, можно использовать для исследования G (в кДНК) по сравнению с A (в геноме). Один конкретный конвейер, называемый различиями РНК и ДНК (RDD), утверждает, что исключает ложноположительные результаты, но только 56,8% его сайтов A-to-I были признаны действительными ICE-seq.^[17] (Смотри ниже).

Ограничения

Фоновый шум, вызванный однонуклеотидными полиморфизмами (SNP), соматическими мутациями, псевдогенами и ошибками секвенирования, снижает надежность сигнала, особенно в контексте одиночной клетки.^[18]

Химические методы

Инозин-специфическое расщепление

Первым методом обнаружения модификаций РНК A-to-I, разработанным в 1997 г., было инозин-специфическое расщепление. Образцы РНК обрабатывают глиоксалем и боратом для специфической модификации всех оснований G, а затем ферментативно расщепляют до РНКазой T1, которая расщепляет после I сайтов. Затем амплификация этих фрагментов позволяет анализировать сайты расщепления и делать вывод о модификации A-to-I.^[19] Его использовали для доказательства положения инозина в определенных сайтах, а не для идентификации новых сайтов или профилей транскриптома.

Ограничения

Существование двух модификаций A-to-I в относительно непосредственной близости, что является обычным для элементов Alu, означает, что нижележащий мод с меньшей вероятностью будет обнаружен, поскольку синтез кДНК будет усечен на предыдущем нуклеотиде. Производительность низкая, и для первоначального метода требовались специфические праймеры; протокол сложный и трудоемкий.

ICE и ICE-seq

Химическое стирание инозина (ICE) относится к процессу, в котором акрилонитрил реагирует с инозином с образованием N1-цианоэтилинозина (ce1I). Это останавливает обратную транскриптазу и приводит к укороченным молекулам кДНК. Это было объединено с глубоким секвенированием в разработанном методе под названием ICE-seq. Доступны вычислительные методы для автоматического анализа данных, основная предпосылка заключается в сравнении обработанных и необработанных образцов для выявления усеченных транскриптов и, таким образом, для определения модификации инозина по количеству считываний с шагом для уменьшения количества ложноположительных результатов по сравнению с онлайн-базой данных dbSNP.^[20]

Ограничения

Исходный протокол ICE включал ОТ-ПЦР амплификация шаг и, следовательно, требуются праймеры и знания о месте или регионах, которые необходимо исследовать,^[21] наряду с максимальной длиной кДНК 300–500 пар оснований. Метод ICE-seq сложен, а также требует больших затрат труда, реагентов и времени. Один протокол от 2015 года занял 22 дня.^[21]^[20]^[17] Это разделяет ограничение с инозин-специфическим расщеплением в том смысле, что если есть две модификации A-to-I в относительно близкой близости, нижележащий мод с меньшей вероятностью будет обнаружен, поскольку синтез кДНК будет усечен на предыдущем нуклеотиде.^[22]И ICE, и ICE-seq страдают недостаточной чувствительностью к редко редактируемым местоположениям: становится трудно отличить модификацию с частотой <10% от ложного срабатывания. Увеличение глубины считывания и качества может повысить чувствительность, но также страдает от дальнейшего смещения усиления.

Биологические методы

Нокдаун ADAR

Модификация A в I осуществляется аденозиндезаминазами, которые действуют на РНК (ADAR), которых у мышей три. Нокдаун их в клетке, следовательно, и последующее межклеточное сравнение содержания ADAR + и ADAR-РНК, как ожидается, обеспечат основу для профилирования модификаций A-to-I. Однако есть и другие функции ферментов ADAR внутри клетки - например, они играют дополнительную роль в процессинге РНК и в биогенезе миРНК, - которые также могут изменить ландшафт клеточной мРНК. Недавно была создана карта редактирования A-to-I у мышей с использованием мышей с дефицитом редактирования ADAR1 и ADAR2 с двойным нокаутом в качестве отрицательного контроля. Таким образом, редактирование от A до I было обнаружено с высокой степенью уверенности.^[23]

Методы профилирования метилирования псевдоуридина

Определение инозина и псевдоуридина на основе ICE и CMC. В обоих случаях образуется усеченная молекула кДНК.

Псевдоуридин, или Ψ, самый распространенный посттрансляционная модификация РНК,^[24] образуется при изомеризации уридинового основания. В эукариоты, это может происходить по одному из двух различных механизмов;^[25]^[26] его иногда называют «пятым нуклеотидом РНК». Он встроен в конюшню некодирующие РНК такие как тРНК, рРНК и мяРНК,^[27] с ролями в рибосомальный связывание лиганда и точность трансляции в тРНК,^[28]^[29] и в тонкой настройке событий ветвления и сращивание события в мяРНК.^[30] Псевдоуридин имеет еще один донор водородной связи из иминогруппы и более стабильную связь C – C, поскольку C-гликозидная связь заменила N-гликозидную связь, обнаруженную в его аналоге (обычный уридин).^[31] Поскольку ни одно из этих изменений не влияет на его свойства спаривания оснований, оба будут иметь одинаковый результат при прямом секвенировании; поэтому методы его обнаружения включают предварительную биохимическую модификацию.^[32]

Биохимические методы

Методы CMCT

Существует несколько методов обнаружения псевдоуридина, начиная с добавления мето-п-толуолсульфоната N-циклогексил-N'-b- (4-метилморфолиния) этилкарбодиимида (CMCT; также известный как CMC), поскольку его реакция с псевдоуридином дает CMC- Ψ. CMC-Ψ заставляет обратную транскриптазу задерживать один нуклеотид в 3’-направлении.^[33] Эти методы имеют однонуклеотидное разрешение. На этапе оптимизации азидо-КМЦ может дать возможность добавлять биотинилирование; последующее раскрытие биотина обогатит β-содержащие транскрипты, позволяя идентифицировать транскрипты даже с низким содержанием.

Ограничения

Как и в случае с другими процедурами, основанными на биохимических изменениях с последующим секвенированием, развитие высокопроизводительное секвенирование снял ограничения, требующие предварительного знания интересующих сайтов и грунтовка дизайн. Метод вызывает сильную деградацию РНК, поэтому необходимо начинать с большого количества образца или использовать эффективные нормализация методы для учета смещения усиления. Одним из последних ограничений является то, что для специфической маркировки псевдоуридина КМЦ оно не является полным и, следовательно, не является количественным.^[34] Был бы полезен новый реагент, который мог бы достичь более высокой чувствительности и специфичности.

Методы профилирования 5-гидроксилметилцитидина

Остатки цитидина, модифицированные один раз до m5C (обсуждалось выше), могут быть дополнительно модифицированы: либо окисленный один раз для 5-гидроксилметилцитидина (hm5C) или дважды окислили для 5-формилцитидина (f5C). Возникающий в результате окислительной обработки m5C в млекопитающие транслокацией десять-одиннадцать (TET ) ферментов семейства hm5C, как известно, встречается во всех трех королевства и иметь роль в регулировании. Хотя известно, что 5-гидроксиметилцитидин (hm5dC) широко распространен в ДНК, hm5C также обнаруживается у организмов, для которых не было обнаружено hm5dC, что указывает на то, что это отдельный процесс с различными регуляторными условиями. Чтобы наблюдать in vivo добавление метильных групп к остаткам цитозиновой РНК с последующим окислительным процессингом, мышей можно питаться диетой, включающей определенные изотопы и они отслеживаются LC-МС / МС анализ. Поскольку метаболический путь от приема пищи до включения нуклеотидов, как известно, идет от диетического метионин --> S-аденозилметионин (SAM) -> метильная группа на основе РНК, маркировка диетического метионина ¹³C и D означают, что они останутся в остатках hm5C, которые изменились с момента их добавления в рацион.^[35] В отличие от m5C, большое количество модификаций hm5C было записано в кодирующих последовательностях.^[36]

hMeRIP-seq

hMeRIP-seq - это метод иммунопреципитации, при котором комплексы РНК-белок перекрестно сшиваются для обеспечения стабильности и добавляются антитела, специфичные к hm5C. С помощью этого метода было получено более 3000 пиков hm5C. Drosophila melanogaster S2 клетки.

Ограничения

Несмотря на то, что для hm5dC доступны два различных метода базового разрешения, методов базового разрешения для обнаружения hm5C не существует.

Биофизическая проверка модификаций РНК

Помимо масс-спектрометрии и хроматография, были разработаны два других метода валидации, а именно

Методы до и после маркировки:

Предварительная маркировка → предполагает использование ³²P: клетки растут в ³²Среда, содержащая P, что позволяет включать [α-³²P] NTP во время транскрипции РНК-полимеразой Т7.Затем модифицированная РНК экстрагируется, каждый вид РНК выделяется и впоследствии переваривается Т2 РНКазой. Затем РНК гидролизуется до 5'-нуклеозидных монофосфатов, которые анализируются. 2D-ТСХ (двумерная тонкослойная хроматография). Этот метод позволяет обнаруживать и количественно оценивать каждую модификацию, но не вносит вклад в характеристику последовательности.
Пост-маркировка → подразумевает выборочную маркировку конкретной позиции в последовательности: эти методы основаны на принципах подхода Стэнли-Василенко, который был скорректирован для достижения лучшего качества проверки. Во-первых, РНК расщепляется на свободные 5’-ОН фрагменты либо РНКазой H, либо ДНКзимами путем специфичного гидролиза последовательности. Затем полинуклеотидкиназа (PKN) выполняет 5 ’радиоактивное фосфорилирование после метки с использованием [γ-³²P] АТФ. На этом этапе меченые фрагменты подвергаются дроблению по размеру, которое может быть выполнено либо Нуклеаза P1 или по методу АЛЕТА. В обоих случаях конечный продукт представляет собой группу 5 ’нуклеозидмонофосфатов (5’ NMP), которые будут анализироваться с помощью ТСХ.
- АЛЫЙ: этот недавний подход использует не один, а два этапа выбора последовательности, последний из которых получается во время лигирования радиоактивно меченных фрагментов с длинным олигонуклеотидом ДНК на его 3’-конце. После разложения меченый остаток очищается вместе с лигированным ДНК-олигонуклеотидом и, наконец, гидролизуется и, следовательно, высвобождается благодаря активности нуклеазы P1.

Этот метод оказался очень полезным при валидации модифицированных остатков в мРНК и днРНК, Такие как m6A и Ψ

Методы на основе олигонуклеотидов: этот метод включает несколько вариантов

Сплит-лигирование конкретных модифицированных ДНК, который использует чувствительность лигазы к 3 ’и 5’ нуклеотидам (до сих пор используется для m6A, 2’-O-Me, Ψ)
Идентификация модификации микроматрицы с помощью ДНК-чипа, который использует снижение стабильности дуплекса олигонуклеотидов кДНК из-за препятствий в обычном спаривании оснований, вызванных модификациями (например, m1A, m1G, m22G)
Удлинение праймера ОТ при низкой концентрации дНТФ, для отображения сигналов остановки RT.^[36]

Одномолекулярное секвенирование в реальном времени для секвенирования эпитранскриптома

Секвенирование одной молекулы в реальном времени (SMRT) используется в эпигеномной и эпитранскриптомной областях. В отношении эпигеномика, тысячи нулевые волноводы (ZMW) используются для захвата ДНК-полимераза: когда присутствует модифицированное основание, биофизическая динамика его движения изменяется, создавая уникальную кинетическую сигнатуру до, во время и после включения основания. СМРТ-секвенирование может использоваться для обнаружения модифицированных оснований в РНК, включая сайты m6A. В этом случае обратная транскриптаза используется в качестве фермента с ZMW для наблюдения за синтезом кДНК в реальном времени. Включение синтетически сконструированных сайтов m6A оставляет кинетическую сигнатуру и увеличивает межимпульсную длительность (IPD). Существуют некоторые проблемы, касающиеся считывания гомонуклеотидных участков и разрешения оснований m6A в них из-за заикания обратной транскриптазы. Во-вторых, пропускная способность слишком мала для подходов, охватывающих весь транскриптом. Одной из наиболее часто используемых платформ является технология секвенирования SMRT от Тихоокеанские биологические науки.^[37]

Секвенирование нанопор в эпитранскриптомике

Возможной альтернативой обнаружению эпитранскриптомных модификаций с помощью секвенирования SMRT является прямое обнаружение с использованием Секвенирование нанопор технологии. В этом методе используются белковые каналы нанометрового размера, встроенные в мембрану или твердые материалы и подключенные к датчикам, способные определять амплитуду и продолжительность изменений ионного тока, проходящего через пору. Когда РНК проходит через нанопору, блокировка приводит к нарушению потока тока, который различается для разных оснований, включая модифицированные, и поэтому может использоваться для выявления возможных модификаций. Производя считывание одной молекулы, без предварительной амплификации РНК и преобразования в кДНК, эти методы могут привести к созданию количественных карт транскриптома.^[1]В частности, технология Nanopore оказалась эффективной при обнаружении присутствия двух нуклеотидных аналогов в РНК: N⁶-метиладенозин (m6A) и 5-метилцитозин (5-мкС). С помощью Скрытые марковские модели (HMM) или повторяющиеся нейронные сети (RNN), обученный с использованием известных последовательностей, можно было продемонстрировать, что модифицированные нуклеотиды вызывают характерное нарушение ионного тока при прохождении через пору, и что эти данные могут быть использованы для идентификации нуклеотида.^[1]^[38]

Эпитранскриптомное секвенирование - Epitranscriptomic sequencing

Содержание