Пространство последовательностей (эволюция) - Sequence space (evolution)

Протеин пространство последовательностей может быть представлено как пространство с n размеры, где n - количество аминокислоты в белке. Каждая ось имеет 20 положений, представляющих 20 аминокислот. Существует 400 возможных белков из 2 аминокислот (дипептид ), которые можно расположить в виде 2D-сетки. 8000 трипептиды можно расположить в трехмерном кубе. Большинство белков длиннее 100 аминокислот и поэтому занимают большие многомерные пространства, содержащие астрономическое количество белковых последовательностей.
Как направленная эволюция лазит по фитнес-ландшафтам. Выполнение нескольких раундов направленной эволюции полезно не только потому, что в каждом раунде создается новая библиотека мутантов, но также потому, что каждая новая библиотека использует лучшие мутанты в качестве шаблонов, чем предыдущая. Эксперимент аналогичен восхождению на холм в «фитнес-ландшафте», где высота представляет собой желаемое свойство. Цель состоит в том, чтобы достичь вершины, которая представляет собой наиболее достижимого мутанта. Каждый раунд отбора отбирает мутанты со всех сторон исходного шаблона (1) и выбирает мутант с наибольшей высотой, тем самым поднимаясь на холм. Это повторяется до тех пор, пока не будет достигнута местная вершина (2).

В эволюционная биология, пространство последовательности это способ представления всех возможных последовательностей (для белок, ген или же геном ).[1][2] Пространство последовательностей имеет одно измерение на аминокислота или же нуклеотид в последовательности, ведущей к многомерные пространства.[3][4]

Большинство последовательностей в пространстве последовательностей не имеют функции, оставляя относительно небольшие области, которые населены природными генами.[5] Каждая последовательность белка смежна со всеми другими последовательностями, которые могут быть достигнуты с помощью одного мутация. Было подсчитано, что все функциональное пространство белковых последовательностей было исследовано жизнью на Земле.[6] Эволюцию можно визуализировать как процесс выборки соседних последовательностей в пространстве последовательностей и перехода к любой из них с улучшенными фитнес над текущим.

Представление

Пространство последовательности обычно представляет собой сетку. За белок пробелы последовательности, каждое остаток в белке представлен измерение с 20 возможными положениями по этой оси, соответствующими возможным аминокислотам.[3][4] Следовательно, существует 400 возможных дипептиды расположены в пространстве 20x20, но расширяется до 10130 ведь даже небольшой белок из 100 аминокислот размещается в пространстве со 100 измерениями. Хотя такую ​​подавляющую многомерность нельзя визуализировать или представить в виде диаграмм, она предоставляет полезную абстрактную модель для размышлений о диапазоне белков и эволюция от одной последовательности к другой.

Эти многомерные пространства можно сжать до 2 или 3 измерений с помощью Анализ главных компонентов. Фитнес-ландшафт - это просто пространство последовательностей с дополнительной вертикальной осью фитнеса, добавленной для каждой последовательности.[7]

Функциональные последовательности в пространстве последовательностей

Несмотря на разнообразие суперсемейств белков, пространство последовательностей чрезвычайно мало заполнено функциональными белками. Большинство случайных белковых последовательностей не имеют складок или функций.[8] Суперсемейства ферментов следовательно, существуют как крошечные кластеры активных белков в огромном пустом пространстве нефункциональной последовательности.[9][10]

Плотность функциональных белков в пространстве последовательностей и близость различных функций друг к другу являются ключевыми факторами в понимании эволюционируемость.[11] Степень взаимопроникновения двух нейтральные сети разных виды деятельности Пространство последовательности определит, насколько легко перейти от одного вида деятельности к другому. Чем больше совпадений между различными действиями в пространстве последовательности, тем больше загадочная вариация за беспорядочная деятельность будет.[12]

Пространство белковой последовательности сравнивали с Вавилонская библиотека, теоретическая библиотека, содержащая всевозможные книги объемом 410 страниц.[13][14] в Вавилонская библиотеканайти любую имеющую смысл книгу было невозможно из-за большого количества и отсутствия порядка. То же самое было бы верно и для белковых последовательностей, если бы не естественный отбор, который отбирал только те белковые последовательности, которые имеют смысл. Кроме того, каждая последовательность белка окружена набором соседей (точечных мутантов), которые, вероятно, имеют хотя бы некоторую функцию.

С другой стороны, эффективный «алфавит» пространства последовательностей на самом деле может быть довольно маленьким, уменьшая полезное количество аминокислот с 20 до гораздо меньшего числа. Например, в чрезвычайно упрощенном виде все аминокислоты можно разделить на два класса (гидрофобные / полярные) по гидрофобность и по-прежнему позволяют отображать многие общие структуры. Ранняя жизнь на Земле может иметь только четыре или пять типов аминокислот для работы,[15] и исследования показали, что функциональные белки могут быть созданы из белков дикого типа с помощью аналогичного процесса сокращения алфавита.[16][17] Сокращенные алфавиты также полезны в биоинформатика, поскольку они обеспечивают простой способ анализа сходства белков.[18][19]

Исследование через направленную эволюцию и рациональный дизайн

Как Библиотеки ДНК создано случайный мутагенез пространство последовательности образцов. Показана аминокислота, замещенная в данном положении. Каждая точка или набор связанных точек является одним из членов библиотеки. ПЦР, подверженная ошибкам, случайным образом изменяет некоторые остатки на другие аминокислоты. Аланиновое сканирование заменяет каждый остаток белка на аланин, один за другим. Насыщение сайта заменяет каждую из 20 возможных аминокислот (или некоторые их подмножества) в одном положении, одну за другой.

Основное внимание в области белковая инженерия находится на создании Библиотеки ДНК который образец области пространства последовательностей, часто с целью поиска мутантов белков с улучшенными функциями по сравнению с дикого типа. Эти библиотеки создаются либо с использованием последовательности дикого типа в качестве шаблона, либо с применением одного или нескольких мутагенез методы для создания различных вариантов этого, или путем создания белков с нуля, используя искусственный синтез генов. Эти библиотеки затем проверено или выбрано и с улучшенными фенотипы используются для следующего раунда мутагенеза.

Смотрите также

Рекомендации

  1. ^ ДеПристо, Марк А .; Weinreich, Daniel M .; Хартл, Дэниел Л. (2 августа 2005 г.). «Несмысленные извилины в пространстве последовательностей: биофизический взгляд на эволюцию белка». Природа Обзоры Генетика. 6 (9): 678–687. Дои:10.1038 / nrg1672. PMID  16074985. S2CID  13236893.
  2. ^ Мейнард Смит, Джон (7 февраля 1970 г.). «Естественный отбор и концепция белкового пространства». Природа. 225 (5232): 563–564. Bibcode:1970Натура.225..563М. Дои:10.1038 / 225563a0. PMID  5411867. S2CID  204994726.
  3. ^ а б Bornberg-Bauer, E .; Чан, Х.С. (14 сентября 1999 г.). «Моделирование эволюционных ландшафтов: мутационная стабильность, топология и суперпунели в пространстве последовательностей». Труды Национальной академии наук. 96 (19): 10689–10694. Bibcode:1999PNAS ... 9610689B. Дои:10.1073 / пнас.96.19.10689. ЧВК  17944. PMID  10485887.
  4. ^ а б Кордес, штат Миннесота; Дэвидсон, АР; Зауэр, RT (февраль 1996 г.). «Пространство последовательности, фолдинг и дизайн белка». Текущее мнение в структурной биологии. 6 (1): 3–10. Дои:10.1016 / S0959-440X (96) 80088-1. PMID  8696970.
  5. ^ Hermes, JD; Блэклоу, Южная Каролина; Ноулз, младший (январь 1990 г.). «Поиск в пространстве последовательностей с помощью определенно случайного мутагенеза: повышение каталитической активности фермента». Труды Национальной академии наук Соединенных Штатов Америки. 87 (2): 696–700. Bibcode:1990PNAS ... 87..696H. Дои:10.1073 / pnas.87.2.696. ЧВК  53332. PMID  1967829.
  6. ^ http://rsif.royalsocietypublishing.org/content/5/25/953
  7. ^ Ромеро, Пенсильвания; Арнольд, Ф.Х. (декабрь 2009 г.). «Изучение ландшафтов пригодности белков путем направленной эволюции». Обзоры природы Молекулярная клеточная биология. 10 (12): 866–76. Дои:10.1038 / nrm2805. ЧВК  2997618. PMID  19935669.
  8. ^ Киф, AD; Szostak, JW (5 апреля 2001 г.). «Функциональные белки из библиотеки случайных последовательностей». Природа. 410 (6829): 715–8. Bibcode:2001Натура.410..715К. Дои:10.1038/35070613. ЧВК  4476321. PMID  11287961.
  9. ^ Стеммер, Виллем П. К. (июнь 1995 г.). «Пространство поисковой последовательности». Био / Технологии. 13 (6): 549–553. Дои:10.1038 / nbt0695-549. S2CID  20117819.
  10. ^ Борнберг-Бауэр, Э (ноябрь 1997 г.). «Как модельные белковые структуры распределены в пространстве последовательностей?». Биофизический журнал. 73 (5): 2393–403. Bibcode:1997BpJ .... 73.2393B. Дои:10.1016 / S0006-3495 (97) 78268-7. ЧВК  1181141. PMID  9370433.
  11. ^ Борнберг-Бауэр, Э; Huylmans, AK; Сикосек, Т. (июнь 2010 г.). «Как возникают новые белки?». Текущее мнение в структурной биологии. 20 (3): 390–6. Дои:10.1016 / j.sbi.2010.02.005. PMID  20347587.
  12. ^ Вагнер, Андреас (14.07.2011). Истоки эволюционных инноваций: теория трансформационных изменений в живых системах. Оксфорд [и др.]: Издательство Оксфордского университета. ISBN  978-0199692590.
  13. ^ Арнольд, FH (2000). «Библиотека Мейнарда-Смита: мои поиски смысла в белковой вселенной». Достижения в химии белков. 55: ix – xi. Дои:10.1016 / с0065-3233 (01) 55000-7. PMID  11050930.
  14. ^ Остермайер, М. (март 2007 г.). «Помимо каталогизации Вавилонской библиотеки». Химия и биология. 14 (3): 237–8. Дои:10.1016 / j.chembiol.2007.03.002. PMID  17379136.
  15. ^ Драйден, ДТ; Томсон, АР; Уайт, JH (6 августа 2008 г.). «Какая часть пространства белковых последовательностей была исследована жизнью на Земле?». Журнал Королевского общества, Интерфейс. 5 (25): 953–6. Дои:10.1098 / rsif.2008.0085. ЧВК  2459213. PMID  18426772.
  16. ^ Akanuma, S .; Kigawa, T .; Йокояма, С. (2 октября 2002 г.). «Комбинаторный мутагенез для ограничения использования аминокислот в ферменте сокращенным набором». Труды Национальной академии наук. 99 (21): 13549–13553. Bibcode:2002PNAS ... 9913549A. Дои:10.1073 / pnas.222243999. ЧВК  129711. PMID  12361984.
  17. ^ Фудзисима, Косуке; Ван, Кендрик М .; Палмер, Джесси А .; Абэ, Нозоми; Накахигаши, Кенджи; Энди, Дрю; Ротшильд, Линн Дж. (29 января 2018 г.). «Реконструкция биосинтеза цистеина с использованием сконструированных безцистеиновых ферментов». Научные отчеты. 8 (1): 1776. Bibcode:2018НатСР ... 8.1776F. Дои:10.1038 / с41598-018-19920-л. ЧВК  5788988. PMID  29379050.
  18. ^ Бакардит, Жауме; Стаут, Майкл; Херст, Джонатан Д; Валенсия, Альфонсо; Смит, Роберт Э; Красногор, Наталио (6 января 2009 г.). «Автоматическое сокращение алфавита для наборов данных о белках». BMC Биоинформатика. 10 (1): 6. Дои:10.1186/1471-2105-10-6. ЧВК  2646702. PMID  19126227.
  19. ^ Солис, Армандо Д. (30 июля 2019 г.). «Сокращенный алфавит пребиотических аминокислот оптимально кодирует конформационное пространство разнообразных существующих белковых складок». BMC Эволюционная биология. 19 (1): 158. Дои:10.1186 / s12862-019-1464-6. ЧВК  6668081. PMID  31362700.