Частотный спектр аллелей - Allele frequency spectrum

В популяционная генетика, то частотный спектр аллеля, иногда называемый частотный спектр сайта, это распределение из частоты аллелей данного набора места (довольно часто SNP ) в генеральной совокупности или выборке.[1][2][3][4] Поскольку частотный спектр аллелей часто является суммой или сравнением с секвенированными выборками всей популяции, это гистограмма, размер которой зависит от количества секвенированных отдельных хромосом. Каждая запись в частотном спектре записывает общее количество локусов с соответствующими полученный частота аллелей. Предполагается, что локусы, вносящие вклад в частотный спектр, независимо изменяются по частоте. Кроме того, предполагается, что локусы являются двуаллельными (то есть с двумя присутствующими аллелями), хотя существуют расширения для многоаллельных частотных спектров.[5]

Много сводные статистические данные наблюдаемых генетическая вариация сами по себе являются сводками частотного спектра аллелей, включая оценки Такие как Уоттерсона и Таджима , Таджима D, Фэй и Ву H и .[6]

Пример

Частотный спектр аллеля из выборки хромосом рассчитывается путем подсчета количества сайтов с производными частотами аллелей . Например, рассмотрим образец люди с восемью наблюдаемыми вариабельными участками. В этой таблице 1 указывает, что производный аллель наблюдается в этом сайте, а 0 указывает, что наблюдали предковый аллель.

SNP 1SNP 2SNP 3СНП 4СНП 5СНП 6SNP 7СНП 8
Образец 101000010
Образец 210100010
Образец 301100100
Образец 400001011
Образец 500100010
Образец 600010110
Общий12311251

Частотный спектр аллеля можно записать в виде вектора , куда - количество наблюдаемых сайтов с полученной частотой аллелей . В этом примере наблюдаемый частотный спектр аллеля равен из-за четырех экземпляров одного наблюдаемого производного аллеля в конкретном локусе SNP, двух экземпляров двух производных аллелей и т. д.

Расчет

Ожидаемый частотный спектр аллелей может быть рассчитан с использованием либо сливающийся или же распространение подход.[7][8] Демографическая история населения и естественный отбор влияют на динамику частоты аллелей, и эти эффекты отражаются на форме частотного спектра аллелей. Для простого случая селективной сегрегации нейтральных аллелей в популяции, которая достигла демографического равновесия (то есть без недавних изменений размера популяции или потока генов), ожидаемый частотный спектр аллелей за образец размера дан кем-то

куда - частота мутаций в масштабе популяции. Отклонения от демографического равновесия или нейтральности изменят форму ожидаемого частотного спектра.

Для расчета частотного спектра на основе данных наблюдаемых последовательностей необходимо уметь различать предковые и производные (мутантные) аллели, часто путем сравнения с аллелями. аутгруппа последовательность. Например, в генетических исследованиях человеческой популяции, эталонная последовательность гомологичных шимпанзе обычно используется для оценки наследственного аллеля. Однако иногда предковый аллель не может быть определен, и в этом случае вместо него может быть рассчитан частотный спектр свернутого аллеля. В свернутом частотном спектре хранятся наблюдаемые подсчеты частот минорных (наиболее редких) аллелей. Свернутый спектр можно рассчитать, объединяя й и th записи из развернутого спектра, где - количество отобранных особей.

Частотный спектр многопопуляционного аллеля

Совместный частотный спектр аллелей (JAFS) - это совместное распределение частот аллелей в двух или более связанных популяциях. JAFS для населения, с отобранные хромосомы в -я популяция, это -мерная гистограмма, в которой каждая запись хранит общее количество сегрегационных сайтов, в которых производный аллель наблюдается с соответствующей частотой в каждой популяции. Каждая ось гистограммы соответствует генеральной совокупности, а индексы отсчитываются от для -го населения.[9][10]

Пример

Предположим, мы секвенируем диплоидных особей из двух популяций: 4 особи из популяции 1 и 2 особи из популяции 2. JAFS будет матрица, индексированная с нуля. В Запись будет записывать количество наблюдаемых полиморфных локусов с производной частотой аллеля 3 в популяции 1 и частотой 2 в популяции 2. Запись будет записывать те локусы с наблюдаемой частотой 1 в популяции 1 и частотой 0 в популяции 2. Запись будет записывать те локусы с производным аллелем, фиксированным в популяции 1 (наблюдается во всех хромосомах), и с частотой 3 в популяции 2.

Приложения

Форма частотного спектра аллелей чувствительна к демографии, например, к изменениям размера популяции, миграции и субструктуре, а также к естественному отбору. Сравнивая наблюдаемые данные, обобщенные в частотном спектре, с ожидаемым частотным спектром, рассчитанным в рамках данной демографической модели и модели выбора, можно оценить степень соответствия этой модели к данным и используйте вероятность теория для оценки наиболее подходящих параметров модели.

Например, предположим, что популяция недавно пережила период экспоненциального роста и последовательности образцов были получены из популяции в конце роста, и наблюдаемый (данные) частотный спектр аллелей был рассчитан с использованием предположительно нейтральной вариации. Демографическая модель будет иметь параметры для экспоненциального роста , время для которого произошел рост, и эталонная численность населения , предполагая, что население было в равновесии, когда начался рост. Ожидаемый частотный спектр для данного набора параметров можно получить с помощью теории диффузии или коалесценции и сравнить с частотным спектром данных. Параметры наилучшего соответствия можно найти с использованием максимального правдоподобия.

Этот подход использовался для вывода демографических и селекционных моделей для многих видов, включая человека. Например, Marth et al. (2004) использовали частотные спектры аллелей одной популяции для группы африканцев, европейцев и азиатов, чтобы показать, что узкие места населения произошли в азиатской и европейской демографической истории, но не у африканцев.[11] Совсем недавно Gutenkunst et al. (2009) использовали общий частотный спектр аллелей для этих трех популяций, чтобы сделать вывод о времени, когда популяции разошлись, и о количестве последующей продолжающейся миграции между ними (см. гипотеза из Африки ).[10] Кроме того, эти методы могут использоваться для оценки паттернов отбора на основе данных частоты аллелей. Например, Boyko et al. (2008) сделали вывод распределение фитнес-эффектов для вновь возникающих мутаций с использованием данных человеческого полиморфизма, которые контролировали эффекты неравновесной демографии.[12]

Рекомендации

  1. ^ Фишер, Рональд А. (1930). «Распределение соотношений генов для редких мутаций». Труды Королевского общества Эдинбурга. 50: 205–220.
  2. ^ Райт, Сьюэлл (1938). «Распределение частот генов при необратимой мутации». Proc. Natl. Акад. Sci. Соединенные Штаты Америки. 24: 253–259. Bibcode:1938ПНАС ... 24..253Вт. Дои:10.1073 / пнас.24.7.253. ЧВК  1077089. PMID  16577841.
  3. ^ Кимура, Мотоо (1964). «Модели диффузии в популяционной генетике». J. Appl. Вероятно. 1 (2): 177–232. Дои:10.2307/3211856.
  4. ^ Эванс, Стивен Н .; Швец, Елена; Слаткин, Монтгомери (2007). «Неравновесная теория частотного спектра аллелей». Теоретическая популяционная биология. 71 (1): 109–119. arXiv:q-bio / 0604010. Дои:10.1016 / j.tpb.2006.06.005.
  5. ^ Jenkins, Paul A .; Мюллер, Йонас В .; Сон, Юн С. (2014). «Общий триаллельный частотный спектр в демографических моделях с переменной численностью населения». Генетика. 196 (1): 295–311. arXiv:1310.3444. Дои:10.1534 / генетика.113.158584. ЧВК  3872192. PMID  24214345.
  6. ^ Дарретт, Рик (2008). Вероятностные модели эволюции последовательности ДНК (PDF) (2-е изд.).
  7. ^ Уэйкли, Джон. Теория слияния: введение. Roberts & Company Publishers. ISBN  0974707759.
  8. ^ Ворона, Джеймс Ф .; Кимура, Мотоо (1970). Введение в теорию популяционной генетики ([Перепечатка] ред.). Нью-Джерси: Блэкберн Пресс. ISBN  9781932846126.
  9. ^ Chen, H .; Green, R.E .; Paabo, S .; Слаткин, М. (29 июля 2007 г.). "Совместный частотный спектр аллелей у близкородственных видов". Генетика. 177 (1): 387–398. Дои:10.1534 / genetics.107.070730. ЧВК  2013700. PMID  17603120.
  10. ^ а б Gutenkunst, Ryan N .; Эрнандес, Райан Д .; Уильямсон, Скотт Х .; Бустаманте, Карлос Д. (23 октября 2009 г.). «Вывод совместной демографической истории множества популяций из многомерных данных о частоте SNP». PLoS Genetics. 5 (10): e1000695. Дои:10.1371 / journal.pgen.1000695. ЧВК  2760211. PMID  19851460.
  11. ^ Marth, Gabor T .; Чабарка, Ева; Мурвай, Янош; Шерри, Стивен Т. (1 января 2004 г.). «Частотный спектр аллелей в данных об изменениях человека в масштабе всего генома выявляет сигналы дифференциальной демографической истории в трех больших популяциях мира». Генетика. 166 (1): 351–372. Дои:10.1534 / genetics.166.1.351. ЧВК  1470693. PMID  15020430.
  12. ^ Бойко, Адам Р .; Уильямсон, Скотт Х .; Indap, Amit R .; Degenhardt, Jeremiah D .; Эрнандес, Райан Д .; Lohmueller, Kirk E .; Адамс, Марк Д .; Шмидт, Штеффен; Снинский, Джон Дж .; Сюняев, Шамиль Р .; Белый, Томас Дж .; Нильсен, Расмус; Кларк, Эндрю Дж .; Бустаманте, Карлос Д. (30 мая 2008 г.). «Оценка эволюционного воздействия аминокислотных мутаций в геноме человека». PLoS Genetics. 4 (5): e1000083. Дои:10.1371 / journal.pgen.1000083.