Библиотека прыжков - Jumping library
Прыгающие библиотеки или библиотеки фрагментов соединения представляют собой коллекции геномный ДНК фрагменты, созданные хромосомный скачок. Эти библиотеки позволяют нам анализировать большие области генома и преодолевать ограничения по расстоянию в обычных методах клонирования. Клон прыгающей библиотеки состоит из двух участков ДНК, которые обычно расположены на расстоянии многих килобаз друг от друга. Участок ДНК, расположенный между этими двумя «концами», удаляется серией биохимических манипуляций, проводимых в начале этой техники клонирования.
Изобретение и ранние улучшения
Источник
Перескок хромосом (или скачок хромосом) был впервые описан в 1984 г. Коллинз и Вайсман.[1]В то время методы клонирования позволяли создавать клоны ограниченного размера (до 240 килобайт), а цитогенетические методы позволяли картировать такие клоны на небольшой участок конкретной хромосомы с разрешением около 5-10 Мб. Таким образом, оставался большой разрыв в разрешении между доступными технологиями, и не было доступных методов для картирования больших участков генома.[1]
Основной принцип и оригинальный метод
Этот метод является продолжением «хромосомного хождения», который позволяет делать большие «шаги» по хромосоме. Если мы хотим предпринять шаги длиной N kb, нам сначала потребуется ДНК с очень высокой молекулярной массой. После выделения мы частично перевариваем его частым срезанием. рестрикционный фермент (например, MboI или BamHI ). Затем полученные фрагменты выбираются по размеру, который должен быть около N kb. Затем ДНК необходимо лигировать при низкой концентрации, чтобы способствовать лигированию в круги, а не образованию мультимеров. Маркер ДНК (например, янтарный супрессорный ген тРНК supF) может быть включен в этот момент времени в ковалентно связанный круг, чтобы сделать возможным выбор фрагментов соединения. Затем круги полностью перевариваются вторым рестрикционным ферментом (например, EcoRI ) для генерации большого количества фрагментов. Такие фрагменты лигируют в векторы (такие как вектор λ), которые следует выбирать для использования ранее введенного маркера ДНК. Остальные фрагменты, таким образом, представляют нашу библиотеку соединительных фрагментов или «библиотеку прыжков».[1]Следующим шагом является скрининг этой библиотеки с помощью зонда, который представляет «начальную точку» желаемого «хромосомного скачка», то есть определение местоположения генома, который запрашивается. Клоны, полученные на этом последнем этапе отбора, будут состоять из ДНК, гомологичной нашему зонду, отделенной нашим ДНК-маркером от другой последовательности ДНК, которая изначально была расположена на расстоянии N kb (таким образом, называемая «прыгающей»).[1]Создав несколько библиотек с разными значениями N, мы должны в конечном итоге иметь возможность отображать весь геном и перемещаться из одного места в другое, контролируя направление, с любым желаемым значением N.[1]
Ранние испытания и улучшения
Оригинальная техника прыжка хромосом была разработана в лабораториях Коллинза и Вайсмана в Йельском университете в Нью-Хейвене, США.[1] и лаборатории Poustka и Lehrach в Европейской лаборатории молекулярной биологии в Гейдельберге, Германия.[2]
Метод Коллинза и Вайсмана[1] описанное выше столкнулось с некоторыми ранними ограничениями. Основная проблема заключалась в том, чтобы избежать некруглых фрагментов. Было предложено два решения: либо скрининг соединительных фрагментов с заданным зондом, либо добавление второй стадии отбора по размеру после лигирования для отделения одиночных кольцевых клонов (мономеров) от клонов, лигированных друг с другом (мультимеры). Авторы также предположили, что следует учитывать другие маркеры, такие как сайт λ cos или гены устойчивости к антибиотикам (вместо гена тРНК-супрессора янтаря), чтобы облегчить отбор клонов соединений.
Поустка и Лехрах[2] предположили, что на первом этапе построения библиотеки следует использовать полное переваривание с редкими разрезающими ферментами рестрикции (такими как NotI) вместо частичного переваривания с помощью часто разрезающих ферментов рестрикции. Это значительно сократит количество клонов с миллионов до тысяч. Однако это может создать проблемы с циркуляризацией фрагментов ДНК, поскольку эти фрагменты будут очень длинными, а также потеряют гибкость в выборе конечных точек, которую можно получить при частичном переваривании. Одним из предложений по преодолению этих проблем было бы объединение двух методов, то есть создание прыгающей библиотеки из фрагментов ДНК, частично переваренных с помощью обычно расщепляющего рестрикционного фермента и полностью редкого режущего рестрикционного фермента, и превращение их в циркулярную форму в плазмиды, расщепленные обоими ферментами. Несколько из этих «комбинированных» библиотек были завершены в 1986 году.[2][3]
В 1991 г. Забаровский и др.[4] предложил новый подход к построению прыгающих библиотек. Этот подход включал использование двух отдельных λ-векторов для создания библиотеки и реакцию частичного заполнения, которая устраняет необходимость в селектируемом маркере. Эта реакция заполнения работала за счет разрушения определенных когезионных концов (возникающих в результате рестрикционного переваривания) фрагментов ДНК, которые не были лигированы и не циркуляризованы, тем самым предотвращая их клонирование в векторы более энергоэффективным и точным способом. Кроме того, этот улучшенный метод потребовал меньше ДНК для начала, а также произвел библиотеку, которую можно было преобразовать в плазмидную форму, что упростило ее хранение и репликацию. Используя этот новый подход, они успешно сконструировали библиотеку прыжков NotI человека из линии лимфобластоидных клеток и библиотеку прыжков NotI, специфичную для хромосомы 3 человека, из линии гибридных клеток хромосомы 3 человека и мыши.[4]
Текущий метод
Второе поколение или "Следующее поколение" (NGS) радикально изменились: возможности секвенирования увеличились более чем в десять тысяч раз, а стоимость снизилась более чем в миллион раз с 2007 года (Национальный исследовательский институт генома человека). NGS произвела революцию в области генетики во многих отношениях.
Строительство библиотеки
Библиотеку часто получают путем случайной фрагментации ДНК и лигирования общих последовательностей адаптеров.[5][6] Однако сгенерированные короткие чтения затрудняют идентификацию структурных вариантов, таких как инделки, транслокации и дупликации. Большие области простых повторов могут еще больше усложнить выравнивание.[7] В качестве альтернативы, с NGS можно использовать прыгающую библиотеку для отображения структурных вариаций и строительных лесов сборок de novo.[8]
Библиотеки прыжков можно разделить на категории по длине встроенных фрагментов ДНК.
- Библиотека коротких прыжков
Фрагменты геномной ДНК размером 3 т.п.н. лигируют с биотинилатными концами и подвергают циркуляризации. Затем круглые сегменты разрезают на небольшие фрагменты, и биотинилированные фрагменты отбирают с помощью анализа аффинности для секвенирования парных концов.
Есть две проблемы, связанные с библиотеками коротких прыжков. Во-первых, считывание может проходить через биотинилированный переход циркуляризации и уменьшать эффективную длину считывания. Во-вторых, чтения из неперескоченных фрагментов (то есть фрагментов без соединения циркуляризации) секвенируются и уменьшают геномный охват. Сообщалось, что фрагменты без перескока варьируются от 4% до 13%, в зависимости от размера выделения. Первую проблему можно решить, разрезая круги на больший размер и выбирая для них более крупные фрагменты. Вторую проблему можно решить с помощью библиотеки пользовательских прыжков со штрих-кодами.[9][10]
- Пользовательская библиотека прыжков со штрих-кодом
Эта специальная библиотека для перехода использует адаптеры, содержащие маркеры для выбора фрагментов в сочетании со штрих-кодами для мультиплексирования. Протокол был разработан Talkowski et al.[9] и основан на подготовке библиотеки пар пары для секвенирования SOLiD. Размер выбранного фрагмента ДНК составляет 3,5 - 4,5 т.п.н. Были задействованы два адаптера: один, содержащий сайт распознавания EcoP15I и выступ AC; другой содержит выступ GT, биотинилированный тимин и олиго-штрих-код. Циркуляризованная ДНК была переварена, и были отобраны фрагменты с биотинилированными адаптерами (см. Фиг. 3). Сайт распознавания EcoP15I и штрих-код помогают отличить фрагменты соединения от фрагментов без перескока. Эти целевые фрагменты должны содержать от 25 до 27 пар оснований геномной ДНК, сайт узнавания EcoP15I, выступ и штрих-код.[9]
- Библиотека прыжков в длину
Этот процесс построения библиотеки аналогичен процессу создания библиотеки Short-jump, за исключением того, что условие оптимизировано для более длинных фрагментов (5 кб).[10]
- Библиотека фосмид-прыжков
Этот процесс построения библиотеки также аналогичен процессу создания библиотеки Short-jump, за исключением того, что трансфекция с использованием вектора E. coli требуется для амплификации больших (40 т.п.н.) фрагментов ДНК. В дополнение Фосмиды может быть изменен для облегчения преобразования в библиотеку прыжков, совместимую с определенными секвенсорами нового поколения.[8][10]
Парное секвенирование
Сегменты, полученные в результате циркуляризации во время конструирования прыгающей библиотеки, расщепляются, а фрагменты ДНК с маркерами будут обогащены и подвергнуты секвенированию по парным концам. Эти фрагменты ДНК секвенируются с обоих концов и генерируют пары считываний. Геномное расстояние между считываниями в каждой паре приблизительно известно и используется для процесса сборки. Например, клон ДНК, созданный случайной фрагментацией, составляет около 200 п.н., а считывание с каждого конца составляет около 180 п.н., перекрывая друг друга. Это следует отличать от секвенирования пар пары, которое в основном представляет собой комбинацию секвенирования следующего поколения с библиотеками прыжков.
Вычислительный анализ
Для работы с данными библиотеки скачков были разработаны различные сборочные инструменты. Один из примеров - ДЕЛЛИ. DELLY был разработан для обнаружения структурных вариантов генома и «объединяет короткие вставки с парными концами, дальнодействующие пары спариваний и выравнивания с разделенным считыванием» для обнаружения реаранжировок на уровне последовательности.[11]
Пример совместной разработки нового экспериментального дизайна и разработки алгоритма демонстрирует ассемблер ALLPATHS-LG.[12]
Подтверждение
При использовании для обнаружения генетических и геномных изменений прыгающие клоны требуют проверки Секвенирование по Сэнгеру.
Приложения
Ранние приложения
В первые дни хромосомный ход от генетически связанных ДНК-маркеров использовался для идентификации и клонирования генов болезней. Однако большое молекулярное расстояние между известными маркерами и интересующим геном усложняло процесс клонирования. В 1987 году была создана библиотека «прыгающих хромосом» человека для клонирования гена кистозного фиброза. Кистозный фиброз это аутосомно-рецессивное заболевание, которым страдает 1 человек из 2000 европеоидов. Это была первая болезнь, при которой была продемонстрирована полезность прыгающих библиотек. Онкоген Met был маркером, прочно связанным с геном кистозного фиброза на хромосоме 7 человека, и библиотеку проверяли на наличие прыгающего клона, начинающегося с этого маркера. Было установлено, что ген кистозного фиброза локализован на 240 т.п.н. ниже гена met. Прыжки хромосом помогли сократить «шаги» картирования и обойти очень повторяющиеся участки в геноме млекопитающих.[13] Прыжки хромосом также позволили получить зонды, необходимые для более быстрой диагностики этого и других заболеваний.[1]
Новые приложения
Характеристика хромосомных перестроек
Сбалансированные хромосомные перестройки могут вносить значительный вклад в развитие заболеваний, как показали исследования лейкемии.[14] Однако многие из них не обнаруживаются хромосомным микрочипом. Кариотипирование и FISH может идентифицировать сбалансированные транслокации и инверсии, но они трудоемки и обеспечивают низкое разрешение (небольшие геномные изменения пропускаются).
Комбинированный подход NGS с прыгающей библиотекой может быть применен для выявления таких геномных изменений. Например, Slade et al. применил этот метод для точного картирования сбалансированной транслокации de novo у ребенка с Опухоль Вильмса.[15] Для этого исследования было сгенерировано 50 миллионов считываний, но только 11,6% из них можно было сопоставить однозначно с эталонным геномом, что составляет примерно шестикратный охват.
Talkowski et al.[9] сравнили различные подходы к обнаружению сбалансированных хромосомных изменений и показали, что модифицированная прыгающая библиотека в сочетании с секвенированием ДНК следующего поколения является точным методом картирования хромосомных точек разрыва. Были протестированы две разновидности библиотек прыжков (библиотеки коротких прыжков и пользовательские библиотеки прыжков со штрих-кодом) и сравнивались со стандартными библиотеками секвенирования. Для стандартного NGS генерируются фрагменты размером 200-500 пар оснований. Около 0,03% -0,54% фрагментов представляют собой химерные пары, которые представляют собой пары концевых считываний, которые картированы на две разные хромосомы. Следовательно, очень мало фрагментов покрывают область точки останова. При использовании библиотек быстрого перехода с фрагментами 3,2–3,8 кбайт процент химерных пар увеличивается до 1,3%. Благодаря пользовательским библиотекам прыжков со штрих-кодами процент химерных пар увеличился до 1,49%.[9]
Пренатальная диагностика
Обычное цитогенетическое тестирование не может предложить разрешение на уровне генов, необходимое для прогнозирования исхода беременности, а глубокое секвенирование всего генома нецелесообразно для рутинной пренатальной диагностики. Прыжковая библиотека полного генома может дополнить обычное пренатальное тестирование. Этот новый метод был успешно применен для выявления случая ЗАРЯДНЫЙ синдром.[6]
De novo сборка
В метагеномика области геномов, общие для разных штаммов, обычно длиннее, чем чтения. Это усложняет процесс сборки и делает восстановление отдельных геномов вида сложной задачей.[10] Химерные пары, которые картированы далеко друг от друга в геноме, могут облегчить процесс сборки de novo. Используя библиотеку прыжков в длину, Ribeiro et al. продемонстрировали, что сборки бактериальных геномов были высокого качества при сокращении затрат и времени.[16]
Ограничение
Стоимость секвенирования резко упала за последние несколько лет, в то время как стоимость создания прыгающих библиотек - нет. Следовательно, по мере развития новых технологий секвенирования и биоинформатических инструментов скачкообразные библиотеки могут стать излишними.
внешняя ссылка
- ДЕЛЛИ: Обнаружение структурных вариантов с помощью интегрированного анализа парных и раздельных считываний
- ALLPATHS-LG: de novo сборка полногеномных микрочитаний дробовика[17]
Смотрите также
Рекомендации
- ^ а б c d е ж грамм час Коллинз, Ф.С. Вайсман, С.М. (ноябрь 1984 г.). «Направленное клонирование фрагментов ДНК на большом расстоянии от исходного зонда: метод циркуляризации». Труды Национальной академии наук Соединенных Штатов Америки. 81 (21): 6812–6. Bibcode:1984PNAS ... 81.6812C. Дои:10.1073 / pnas.81.21.6812. ЧВК 392022. PMID 6093122.
- ^ а б c Поустка, Аннемари; Лехрах, Ганс (1 января 1986 г.). «Прыгающие библиотеки и связывающие библиотеки: новое поколение молекулярных инструментов в генетике млекопитающих». Тенденции в генетике. 2: 174–179. Дои:10.1016/0168-9525(86)90219-2.
- ^ Поустка, А; Pohl, TM; Барлоу, Д.П .; Frischauf, AM; Lehrach, H (22–28 января 1987 г.). «Создание и использование библиотек скачков хромосом человека из NotI-расщепленной ДНК». Природа. 325 (6102): 353–5. Bibcode:1987Натура.325..353П. Дои:10.1038 / 325353a0. PMID 3027567.
- ^ а б Забаровский, ЕР; Болдог, Ф; Erlandsson, R; Кашуба, VI; Алликметс, Р.Л .; Marcsek, Z; Киселев, Л.Л .; Stanbridge, E; Klein, G; Сумеги, Дж. (Декабрь 1991 г.). «Новая стратегия картирования генома человека на основе новой процедуры построения прыгающих библиотек». Геномика. 11 (4): 1030–9. Дои:10.1016 / 0888-7543 (91) 90029-э. PMID 1783374.
- ^ Шендуре, Дж; Джи, Х (октябрь 2008 г.). «Секвенирование ДНК нового поколения». Природа Биотехнологии. 26 (10): 1135–45. Дои:10.1038 / nbt1486. PMID 18846087.
- ^ а б Тальковски, МЭ; Ордулу, З; Пиллаламарри, V; Бенсон, CB; Блюменталь, I; Коннолли, S; Hanscom, C; Хуссейн, N; Перейра, S; Пикер, Дж; Rosenfeld, JA; Шаффер, LG; Wilkins-Haug, LE; Gusella, JF; Morton, CC (6 декабря 2012 г.). «Клиническая диагностика с помощью полногеномного секвенирования пренатального образца». Медицинский журнал Новой Англии. 367 (23): 2226–32. Дои:10.1056 / NEJMoa1208594. ЧВК 3579222. PMID 23215558.
- ^ Мелдрам, C; Дойл, Массачусетс; Тотхилл, RW (ноябрь 2011 г.). «Секвенирование нового поколения для диагностики рака: практическая перспектива». Клинический биохимик. Обзоры / Австралийская ассоциация клинических биохимиков. 32 (4): 177–95. ЧВК 3219767. PMID 22147957.
- ^ а б Уильямс, Л. Дж. С .; Tabbaa, D.G .; Li, N .; Берлин, А. М .; Shea, T. P .; MacCallum, I .; Лоуренс, М. С .; Drier, Y .; Getz, G .; Янг, С. К .; Jaffe, D. B .; Nusbaum, C .; Гнирке, А. (16 июля 2012 г.). «Парное секвенирование библиотек Fosmid от Illumina». Геномные исследования. 22 (11): 2241–2249. Дои:10.1101 / гр.138925.112. ЧВК 3483553. PMID 22800726.
- ^ а б c d е Тальковски, МЭ; Эрнст, К; Хайльбут, А; Чанг, К; Hanscom, C; Линдгрен, А; Кирби, А; Лю, S; Муддукришна, Б; Осуми, ТЗ; Шен, Й; Боровский, МЗ; Дэли, MJ; Morton, CC; Гуселла, JF (8 апреля 2011 г.). «Стратегии секвенирования следующего поколения позволяют рутинно обнаруживать сбалансированные хромосомные перестройки для клинической диагностики и генетических исследований». Американский журнал генетики человека. 88 (4): 469–81. Дои:10.1016 / j.ajhg.2011.03.013. ЧВК 3071919. PMID 21473983.
- ^ а б c d Нагараджан, Ниранджан; Поп, Михай (29 января 2013 г.). «Демистификация последовательности сборки». Природа Обзоры Генетика. 14 (3): 157–167. Дои:10.1038 / nrg3367. PMID 23358380.
- ^ Rausch, T .; Зихнер, Т .; Schlattl, A .; Stutz, A.M .; Benes, V .; Корбель, Дж. О. (7 сентября 2012 г.). «DELLY: обнаружение структурных вариантов с помощью интегрированного анализа парных и раздельных считываний». Биоинформатика. 28 (18): i333 – i339. Дои:10.1093 / биоинформатика / bts378. ЧВК 3436805. PMID 22962449.
- ^ Gnerre, S; Maccallum, I; Przybylski, D; Ribeiro, FJ; Бертон, JN; Уокер, Би Джей; Шарп, Т; Холл, Г; Shea, TP; Сайкс, S; Берлин, AM; Эйрд, Д; Костелло, М; Даза, Р; Уильямс, L; Nicol, R; Гнирке, А; Нусбаум, К; Lander, ES; Jaffe, DB (25 января 2011 г.). «Высококачественные черновые сборки геномов млекопитающих из массивно параллельных данных последовательностей». Труды Национальной академии наук Соединенных Штатов Америки. 108 (4): 1513–8. Bibcode:2011ПНАС..108.1513Г. Дои:10.1073 / pnas.1017351108. ЧВК 3029755. PMID 21187386.
- ^ Rommens, J .; Iannuzzi, M .; Керем, Б; Драмм, М .; Melmer, G; Дин, М; Розмахель, Р; Cole, J .; Кеннеди, Д. Hidaka, N; и другие. (8 сентября 1989 г.). «Идентификация гена муковисцидоза: ходьба и прыжки по хромосомам». Наука. 245 (4922): 1059–1065. Bibcode:1989Научный ... 245.1059R. Дои:10.1126 / science.2772657. PMID 2772657.
- ^ Роули, JD (1979). «хромосомные аномалии при лейкемии». Переливание крови. PMID 232467.
- ^ Slade, I .; Stephens, P .; Дуглас, Дж .; Barker, K .; Stebbings, L .; Аббасзаде, Ф .; Pritchard-Jones, K .; Cole, R .; Пизер, Б .; Stiller, C .; Vujanic, G .; Scott, R.H .; Страттон, М. Р .; Рахман, Н. (30 ноября 2009 г.). «Картирование контрольных точек конституциональной транслокации с помощью секвенирования парных концов всего генома идентифицирует HACE1 как предполагаемый ген предрасположенности к опухоли Вильмса». Журнал медицинской генетики. 47 (5): 342–347. Дои:10.1136 / jmg.2009.072983. PMID 19948536.
- ^ Ribeiro, F.J .; Przybylski, D .; Инь, С .; Шарп, Т .; Gnerre, S .; Abouelleil, A .; Берлин, А. М .; Montmayeur, A .; Shea, T. P .; Уокер, Б. Дж .; Янг, С. К .; Russ, C .; Nusbaum, C .; MacCallum, I .; Джаффе, Д. Б. (24 июля 2012 г.). «Готовые бактериальные геномы на основе данных о последовательности из дробовика». Геномные исследования. 22 (11): 2270–2277. Дои:10.1101 / гр.141515.112. ЧВК 3483556. PMID 22829535.
- ^ Батлер, Дж; MacCallum, I; Клебер, М; Шляхтер И.А.; Бельмонте, МК; Lander, ES; Нусбаум, К; Джаффе, ДБ (май 2008 г.). "ALLPATHS: de novo сборка полногеномных микрочитаний дробовика". Геномные исследования. 18 (5): 810–20. Дои:10.1101 / гр.7337908. ЧВК 2336810. PMID 18340039.