Секвенирование наношаров ДНК - DNA nanoball sequencing
Секвенирование наношаров ДНК это высокопроизводительное секвенирование технология, которая используется для определения всего геномная последовательность организма. Метод использует репликация катящегося круга для амплификации небольших фрагментов геномной ДНК в Наношарики ДНК. Флуоресцентные нуклеотиды связываются с комплементарными нуклеотидами и затем полимеризуются для закрепления последовательностей, связанных с известными последовательностями на матрице ДНК. Базовый порядок определяется через флуоресценция связанных нуклеотидов[2] Этот Секвенирование ДНК метод позволяет секвенировать большое количество наношаров ДНК за цикл при более низких реагент затраты по сравнению с другими секвенирование следующего поколения платформы.[3] Однако недостатком этого метода является то, что он генерирует только короткие последовательности ДНК, что создает проблемы при отображении его считываний на эталонный геном.[2] После покупки Complete Genomics Пекинский институт геномики (BGI) уточненный Секвенирование наношаров ДНК секвенировать образцы нуклеотидов на собственной платформе.[4][5]
Процедура
Секвенирование ДНК-наношара включает выделение ДНК то есть секвенировать, разрезая его на мелкие 100 - 350 базовая пара (п.н.) фрагменты, перевязка адаптера последовательностей к фрагментам и циркуляризации фрагментов. Круговые фрагменты скопированы репликация катящегося круга в результате получается множество одноцепочечных копий каждого фрагмента. Копии ДНК соединяются голова к хвосту в длинную цепочку и уплотняются в наношар ДНК. Затем наношарики адсорбированный на проточную ячейку для секвенирования. Цвет флуоресценция в каждой опрашиваемой позиции записывается камера высокого разрешения. Биоинформатика используются для анализа данных флуоресценции и определения базы, а также для сопоставления или количественной оценки одно- или парных считываний 50, 100 или 150 пар оснований.[6][2]
Выделение, фрагментация и определение размера ДНК
Клетки лизированный и ДНК извлеченный из камеры лизат. ДНК с высоким молекулярным весом, часто длиной в несколько пар мегабаз, фрагментируется физическими или ферментативными методами, чтобы разорвать двойные цепи ДНК через случайные интервалы. Биоинформатическое картирование считываний секвенирования наиболее эффективно, когда образец ДНК имеет узкий диапазон длин.[7] За секвенирование малых РНК, выбор идеальной длины фрагмента для секвенирования осуществляется гель-электрофорез;[8] для секвенирования более крупных фрагментов фрагменты ДНК разделяются путем выбора размера гранул.[9]
Присоединение последовательностей адаптеров
Последовательности адаптерной ДНК должны быть прикреплены к неизвестному фрагменту ДНК, чтобы сегменты ДНК с известными последовательностями фланкировали неизвестную ДНК. В первом раунде адаптера перевязка, правый (Ad153_right) и левый (Ad153_left) адаптеры прикрепляются к правому и левому бокам фрагментированной ДНК, и ДНК амплифицируется с помощью ПЦР. Затем олигонуклеотид сплинта гибридизуется с концами фрагментов, которые лигируются, образуя круг. Добавляют экзонуклеазу для удаления всех оставшихся линейных одноцепочечных и двухцепочечных продуктов ДНК. Результатом является законченная круглая матрица ДНК.[2]
Репликация катящегося круга
После создания однонитевой кольцевой ДНК-матрицы, содержащей образец ДНК, который лигируется с двумя уникальными адапторными последовательностями, создается полная последовательность, амплифицируемая в длинную цепочку ДНК. Это достигается репликация катящегося круга с ДНК-полимераза Phi 29 который связывает и реплицирует матрицу ДНК. Вновь синтезированная цепь высвобождается из кольцевой матрицы, в результате чего получается длинная одноцепочечная ДНК, содержащая несколько копий кольцевой матрицы, расположенные от головы к хвосту.[10] Полученные наночастицы самоорганизуются в плотный клубок ДНК размером примерно 300 нанометры (нм) в поперечнике. Наночастицы остаются отделенными друг от друга, потому что они имеют отрицательный заряд, естественно отталкивая друг друга, уменьшая любое запутывание между разными длинами одноцепочечных ДНК.[2]
Узорчатый массив ДНК-наношаров
Чтобы получить последовательность ДНК, наношарики ДНК прикрепляют к проточной ячейке с рисунком. Проточная ячейка представляет собой силиконовую пластину, покрытую диоксид кремния, титан, гексаметилдисилазан (HMDS) и фоторезист материал. Наношарики ДНК добавляются в проточную кювету и выборочно связываются с положительно заряженным аминосиланом в высокоупорядоченном виде, что позволяет секвенировать очень высокую плотность наношаров ДНК.[2][11]
Изображения
После каждого этапа включения нуклеотидов в ДНК изображение проточной кюветы определяют, какое нуклеотидное основание связано с наношаром ДНК. Флуорофор возбуждается лазер что возбуждает конкретные длины волн света. Излучение флуоресценции каждого наношара ДНК фиксируется с высоким разрешением. CCD камера. Затем изображение обрабатывается для удаления фонового шума и оценки интенсивности каждой точки. Цвет каждого наношара ДНК соответствует основанию в вопросительной позиции, и компьютер записывает информацию о базовом положении.[2]
Формат данных секвенирования
Данные, полученные из наношаров ДНК, имеют стандартный формат. FASTQ отформатирован файлы с непрерывными базами (без пробелов). Эти файлы могут использоваться в любом конвейере анализа данных, который настроен для чтения односторонних или парных файлов FASTQ.
Например:
Считайте 1, из парного конца 100 б.п.[12]
@ CL100011513L1C001R013_126365 / 1 CTAGGCAACTATAGGTCTCAGTTAAGTCAAATAAAATTCACATCAAATTTTTACTCCCACCATCCCAACACTTTCCTGCCTGGCATATGCCGTGTCTGCC + FFFFFFFFFFFGFGFFFFFF; FFFFFFFGFGFGFFFFFF; FFFFGFGFGFFEFFFFFEDGFDFF @ FCFGFGCFFFFFEFFEGDFDFFFFFGDAFFEFGFF
Соответствующее чтение 2:
@ CL100011513L1C001R013_126365 / 2 TGTCTACCATATTCTACATTCCACACTCGGTGAGGGAAGGTAGGCACATAAAGCAATGGCAGTACGGTGTAATACATGCTAATGTAGAGTACGGTGTAATACATGCTAATGTAGAGTAAGCACTCAG + 3E9E @ <>? 9CB & = E <7: - +>; 29: 7 + / 5D9)? 5F /:
Советы по информатике
Выравнивание эталонного генома
Для популярных элайнеров достаточно параметров по умолчанию.
Прочитать имена
В файле FASTQ, созданном секвенсорами BGI / MGI с использованием наношариков ДНК на проточной ячейке с узорным массивом, считываемые имена выглядят следующим образом:
BGISEQ-500:CL100025298L1C002R050_244547
MGISEQ-2000:V100006430L1C001R018613883
Имена чтения могут быть проанализированы для извлечения трех переменных, описывающих физическое расположение чтения в массиве с шаблоном: (1) фрагмент / область, (2) координата x и (3) координата y. Обратите внимание, что из-за порядка этих переменных эти имена чтения не могут быть изначально проанализированы с помощью Пикард Отметьте дубликаты для идентификации оптических дубликатов. Однако, поскольку их нет на этой платформе, это не создает проблем для анализа данных на основе Пикара.
Дубликаты
Поскольку наношарики ДНК остаются ограниченными своими пятнами на структурированном массиве, нет оптических дубликатов, с которыми нужно бороться во время биоинформатического анализа считываний секвенирования. Предлагается запустить Picard MarkDuplicates следующим образом:
java -jar picard.jar MarkDuplicates I = input.bam O = selected_duplicates.bam M = отмеченный_dup_metrics.txt READ_NAME_REGEX = null
Тест с удобными для Пикара переформатированными именами чтения демонстрирует отсутствие этого класса повторяющегося чтения:
Единичное считывание, отмеченное как оптический дубликат, несомненно, является артефактом. В любом случае влияние на предполагаемый размер библиотеки незначительно.
Преимущества
Технология секвенирования ДНК-наношар имеет некоторые преимущества перед другими платформами секвенирования. Одним из преимуществ является устранение оптических дубликатов. Наношарики ДНК остаются на месте в узорчатом массиве и не мешают соседним наношарам.
Еще одно преимущество секвенирования ДНК-наношаров включает использование высокоточной ДНК-полимеразы Phi 29.[10] Чтобы гарантировать точную амплификацию круглого шаблона, несколько сотен копий круглого шаблона уплотнены в небольшую область, что приводит к интенсивному сигналу, а прикрепление флуорофора к зонду на большом расстоянии от точки лигирования приводит к улучшенному лигированию.[2]
Недостатки
Основным недостатком секвенирования ДНК-наношаров является малая длина считывания последовательностей ДНК, полученных этим методом.[2] Короткие чтения, особенно для ДНК с высоким содержанием Повторы ДНК, может отображаться в двух или более регионах эталонного генома. Второй недостаток этого метода состоит в том, что необходимо использовать несколько раундов ПЦР. Это может привести к смещению ПЦР и, возможно, к увеличению контаминантов на этапе конструирования шаблона.[2] Однако эти недостатки являются общими для всех платформ секвенирования с коротким считыванием и не являются специфическими для наношаров ДНК.
Приложения
Секвенирование ДНК-наношаров было использовано в недавних исследованиях. Ли и другие. использовал эту технологию, чтобы найти мутации, присутствующие в раке легких, и сравнить их с нормальной тканью легких.[13] Им удалось идентифицировать более 50 000 однонуклеотидные варианты. Плотва и другие. использовали секвенирование ДНК-наношаров для секвенирования геномов семьи из четырех родственников и смогли идентифицировать SNP, которые могут быть ответственны за Менделирующее расстройство,[14] и смогли оценить частоту мутаций между поколениями.[14] В Институт системной биологии использовал эту технологию для секвенирования 615 полных образцов генома человека в рамках исследования нейродегенеративный болезни, и Национальный институт рака использует секвенирование наношаров ДНК для определения последовательности 50 опухолей и сопоставленных нормальных тканей из детский рак.[нужна цитата ]
Значимость
Массивно параллельный Платформы секвенирования нового поколения, такие как секвенирование наношаров ДНК, могут способствовать диагностике и лечению многих генетических заболеваний. Стоимость секвенирования всего генома человека упала с примерно одного миллиона долларов в 2008 году до 4400 долларов в 2010 году благодаря технологии наношаров ДНК.[15] Секвенирование полных геномов пациентов с наследственные болезни или же рак, мутации ассоциированных с этими заболеваниями, были выявлены новые стратегии, такие как таргетная терапия для людей из группы риска и для генетическое консультирование.[15] Поскольку цена секвенирования всего генома человека приближается к отметке в 1000 долларов, секвенирование генома каждого человека может стать возможным как часть обычного профилактическая медицина.[15]
Рекомендации
- ^ Хуанг, Цзе; Лян, Синьминь; Сюань, Юанькай; Гэн, Чунью; Ли, Юйсян; Лу, Хаоронг; Цюй, Шоуфанг; Мэй, Сянлинь; Чен, Хунбо; Ю, Тинг; Вс, Нан; Рао, Цзюньхуа; Ван, Цзяхао; Чжан, Вэньвэй; Чен, Инь; Ляо, Ша; Цзян, Хуэй; Лю, Синь; Ян, Чжаопэн; Му, Фэн; Гао, Шансянь (2017). «Эталонный набор данных генома человека секвенатора BGISEQ-500». GigaScience. 6 (5): 1–9. Дои:10.1093 / gigascience / gix024. ISSN 2047-217X. ЧВК 5467036. PMID 28379488.
- ^ а б c d е ж грамм час я j Drmanac, R .; Спаркс, А.Б .; Callow, M. J .; Halpern, A. L .; Burns, N.L .; Kermani, B.G .; Carnevali, P .; Назаренко, И .; и другие. (2009). «Секвенирование генома человека с использованием несвязанного основания читает о самоорганизующихся нанометрах ДНК». Наука. 327 (5961): 78–81. Bibcode:2010Sci ... 327 ... 78D. Дои:10.1126 / science.1181498. PMID 19892942.
- ^ Поррека, Грегори Дж (2010). «Секвенирование генома на наношариках». Природа Биотехнологии. 28 (1): 43–4. Дои:10.1038 / nbt0110-43. PMID 20062041.
- ^ "BGI-Shenzhen завершает приобретение полной геномики". PR Newswire.
- ^ «Обзор технологии секвенирования всего генома Revolocity ™» (PDF). Полная геномика. Получено 18 ноября 2017.
- ^ Хуанг, Дж. (2017). «Эталонный набор данных генома человека секвенатора BGISEQ-500». Gigascience. 6 (5): 1–9. Дои:10.1093 / gigascience / gix024. ЧВК 5467036. PMID 28379488.
- ^ Фуллвуд, М. Дж .; Wei, C.-L .; Liu, E.T .; Руан, Ю. (2009). «Секвенирование ДНК нового поколения с парными концевыми метками (ПЭТ) для анализа транскриптома и генома». Геномные исследования. 19 (4): 521–32. Дои:10.1101 / гр.074906.107. ЧВК 3807531. PMID 19339662.
- ^ Фельманн, Т. (2016). «Секвенирование на основе cPAS на BGISEQ-500 для исследования небольших некодирующих РНК». Clin Epigenetics. 8: 123. Дои:10.1186 / s13148-016-0287-1. ЧВК 5117531. PMID 27895807.
- ^ Мюллер, В. (1982). «Фракционирование по размеру фрагментов ДНК в диапазоне от 20 до 30000 пар оснований с помощью жидкостной / жидкостной хроматографии». Eur J Biochem. 128 (1): 231–238. Дои:10.1111 / j.1432-1033.1982.tb06956.x. PMID 7173204.
- ^ а б Бланко, Луис; Бернад, Антонио; Lázaro, José M .; Мартин, Гил; Гармендия, Кристина; Маргарита, М; Салас (1989). «Высокоэффективный синтез ДНК ДНК-полимеразой фага phi 29. Симметричный режим репликации ДНК». Журнал биологической химии. 264 (15): 8935–40. PMID 2498321.
- ^ Chrisey, L .; Ли, GU; О'Ферралл, CE (1996). «Ковалентное прикрепление синтетической ДНК к самоорганизующимся монослойным пленкам». Исследования нуклеиновых кислот. 24 (15): 3031–9. Дои:10.1093 / nar / 24.15.3031. ЧВК 146042. PMID 8760890.
- ^ "Обновленный эталонный набор данных генома человека секвенатора BGISEQ-500". GigaDB. Получено 22 марта 2017.
- ^ Ли, Уильям; Цзян, Чжаоши; Лю, Цзиньфэн; Хаверти, Питер М .; Гуань, Инхуэй; Стинсон, Джереми; Юэ, Пэн; Чжан, Ян; и другие. (2010). «Спектр мутаций, выявленный парными последовательностями генома от пациента с раком легкого». Природа. 465 (7297): 473–7. Bibcode:2010Натура.465..473л. Дои:10.1038 / природа09004. PMID 20505728.
- ^ а б Roach, J.C .; Glusman, G .; Смит, А. Ф. А .; Huff, C.D .; Hubley, R .; Shannon, P.T .; Rowen, L .; Pant, K. P .; и другие. (2010). «Анализ генетической наследственности в семейном квартете путем секвенирования всего генома». Наука. 328 (5978): 636–9. Bibcode:2010Sci ... 328..636R. Дои:10.1126 / science.1186802. ЧВК 3037280. PMID 20220176.
- ^ а б c Спайчер, Майкл Р.; Гейгл, Йохен Б; Томлинсон, Ян П. (2010). «Влияние полногеномных ассоциативных исследований, генетического тестирования, направленного непосредственно на потребителя, и технологий высокоскоростного секвенирования на прогностическое генетическое консультирование в отношении риска рака». Ланцет онкологии. 11 (9): 890–8. Дои:10.1016 / S1470-2045 (09) 70359-6. PMID 20537948.