Частотный спектр аллелей - Allele frequency spectrum
В популяционная генетика, то частотный спектр аллеля, иногда называемый частотный спектр сайта, это распределение из частоты аллелей данного набора места (довольно часто SNP ) в генеральной совокупности или выборке.[1][2][3][4] Поскольку частотный спектр аллелей часто является суммой или сравнением с секвенированными выборками всей популяции, это гистограмма, размер которой зависит от количества секвенированных отдельных хромосом. Каждая запись в частотном спектре записывает общее количество локусов с соответствующими полученный частота аллелей. Предполагается, что локусы, вносящие вклад в частотный спектр, независимо изменяются по частоте. Кроме того, предполагается, что локусы являются двуаллельными (то есть с двумя присутствующими аллелями), хотя существуют расширения для многоаллельных частотных спектров.[5]
Много сводные статистические данные наблюдаемых генетическая вариация сами по себе являются сводками частотного спектра аллелей, включая оценки Такие как Уоттерсона и Таджима , Таджима D, Фэй и Ву H и .[6]
Пример
Частотный спектр аллеля из выборки хромосом рассчитывается путем подсчета количества сайтов с производными частотами аллелей . Например, рассмотрим образец люди с восемью наблюдаемыми вариабельными участками. В этой таблице 1 указывает, что производный аллель наблюдается в этом сайте, а 0 указывает, что наблюдали предковый аллель.
SNP 1 | SNP 2 | SNP 3 | СНП 4 | СНП 5 | СНП 6 | SNP 7 | СНП 8 | |
---|---|---|---|---|---|---|---|---|
Образец 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 |
Образец 2 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Образец 3 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 |
Образец 4 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 |
Образец 5 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Образец 6 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 |
Общий | 1 | 2 | 3 | 1 | 1 | 2 | 5 | 1 |
Частотный спектр аллеля можно записать в виде вектора , куда - количество наблюдаемых сайтов с полученной частотой аллелей . В этом примере наблюдаемый частотный спектр аллеля равен из-за четырех экземпляров одного наблюдаемого производного аллеля в конкретном локусе SNP, двух экземпляров двух производных аллелей и т. д.
Расчет
Ожидаемый частотный спектр аллелей может быть рассчитан с использованием либо сливающийся или же распространение подход.[7][8] Демографическая история населения и естественный отбор влияют на динамику частоты аллелей, и эти эффекты отражаются на форме частотного спектра аллелей. Для простого случая селективной сегрегации нейтральных аллелей в популяции, которая достигла демографического равновесия (то есть без недавних изменений размера популяции или потока генов), ожидаемый частотный спектр аллелей за образец размера дан кем-то
куда - частота мутаций в масштабе популяции. Отклонения от демографического равновесия или нейтральности изменят форму ожидаемого частотного спектра.
Для расчета частотного спектра на основе данных наблюдаемых последовательностей необходимо уметь различать предковые и производные (мутантные) аллели, часто путем сравнения с аллелями. аутгруппа последовательность. Например, в генетических исследованиях человеческой популяции, эталонная последовательность гомологичных шимпанзе обычно используется для оценки наследственного аллеля. Однако иногда предковый аллель не может быть определен, и в этом случае вместо него может быть рассчитан частотный спектр свернутого аллеля. В свернутом частотном спектре хранятся наблюдаемые подсчеты частот минорных (наиболее редких) аллелей. Свернутый спектр можно рассчитать, объединяя й и th записи из развернутого спектра, где - количество отобранных особей.
Частотный спектр многопопуляционного аллеля
Совместный частотный спектр аллелей (JAFS) - это совместное распределение частот аллелей в двух или более связанных популяциях. JAFS для населения, с отобранные хромосомы в -я популяция, это -мерная гистограмма, в которой каждая запись хранит общее количество сегрегационных сайтов, в которых производный аллель наблюдается с соответствующей частотой в каждой популяции. Каждая ось гистограммы соответствует генеральной совокупности, а индексы отсчитываются от для -го населения.[9][10]
Пример
Предположим, мы секвенируем диплоидных особей из двух популяций: 4 особи из популяции 1 и 2 особи из популяции 2. JAFS будет матрица, индексированная с нуля. В Запись будет записывать количество наблюдаемых полиморфных локусов с производной частотой аллеля 3 в популяции 1 и частотой 2 в популяции 2. Запись будет записывать те локусы с наблюдаемой частотой 1 в популяции 1 и частотой 0 в популяции 2. Запись будет записывать те локусы с производным аллелем, фиксированным в популяции 1 (наблюдается во всех хромосомах), и с частотой 3 в популяции 2.
Приложения
Форма частотного спектра аллелей чувствительна к демографии, например, к изменениям размера популяции, миграции и субструктуре, а также к естественному отбору. Сравнивая наблюдаемые данные, обобщенные в частотном спектре, с ожидаемым частотным спектром, рассчитанным в рамках данной демографической модели и модели выбора, можно оценить степень соответствия этой модели к данным и используйте вероятность теория для оценки наиболее подходящих параметров модели.
Например, предположим, что популяция недавно пережила период экспоненциального роста и последовательности образцов были получены из популяции в конце роста, и наблюдаемый (данные) частотный спектр аллелей был рассчитан с использованием предположительно нейтральной вариации. Демографическая модель будет иметь параметры для экспоненциального роста , время для которого произошел рост, и эталонная численность населения , предполагая, что население было в равновесии, когда начался рост. Ожидаемый частотный спектр для данного набора параметров можно получить с помощью теории диффузии или коалесценции и сравнить с частотным спектром данных. Параметры наилучшего соответствия можно найти с использованием максимального правдоподобия.
Этот подход использовался для вывода демографических и селекционных моделей для многих видов, включая человека. Например, Marth et al. (2004) использовали частотные спектры аллелей одной популяции для группы африканцев, европейцев и азиатов, чтобы показать, что узкие места населения произошли в азиатской и европейской демографической истории, но не у африканцев.[11] Совсем недавно Gutenkunst et al. (2009) использовали общий частотный спектр аллелей для этих трех популяций, чтобы сделать вывод о времени, когда популяции разошлись, и о количестве последующей продолжающейся миграции между ними (см. гипотеза из Африки ).[10] Кроме того, эти методы могут использоваться для оценки паттернов отбора на основе данных частоты аллелей. Например, Boyko et al. (2008) сделали вывод распределение фитнес-эффектов для вновь возникающих мутаций с использованием данных человеческого полиморфизма, которые контролировали эффекты неравновесной демографии.[12]
Рекомендации
- ^ Фишер, Рональд А. (1930). «Распределение соотношений генов для редких мутаций». Труды Королевского общества Эдинбурга. 50: 205–220.
- ^ Райт, Сьюэлл (1938). «Распределение частот генов при необратимой мутации». Proc. Natl. Акад. Sci. Соединенные Штаты Америки. 24: 253–259. Bibcode:1938ПНАС ... 24..253Вт. Дои:10.1073 / пнас.24.7.253. ЧВК 1077089. PMID 16577841.
- ^ Кимура, Мотоо (1964). «Модели диффузии в популяционной генетике». J. Appl. Вероятно. 1 (2): 177–232. Дои:10.2307/3211856.
- ^ Эванс, Стивен Н .; Швец, Елена; Слаткин, Монтгомери (2007). «Неравновесная теория частотного спектра аллелей». Теоретическая популяционная биология. 71 (1): 109–119. arXiv:q-bio / 0604010. Дои:10.1016 / j.tpb.2006.06.005.
- ^ Jenkins, Paul A .; Мюллер, Йонас В .; Сон, Юн С. (2014). «Общий триаллельный частотный спектр в демографических моделях с переменной численностью населения». Генетика. 196 (1): 295–311. arXiv:1310.3444. Дои:10.1534 / генетика.113.158584. ЧВК 3872192. PMID 24214345.
- ^ Дарретт, Рик (2008). Вероятностные модели эволюции последовательности ДНК (PDF) (2-е изд.).
- ^ Уэйкли, Джон. Теория слияния: введение. Roberts & Company Publishers. ISBN 0974707759.
- ^ Ворона, Джеймс Ф .; Кимура, Мотоо (1970). Введение в теорию популяционной генетики ([Перепечатка] ред.). Нью-Джерси: Блэкберн Пресс. ISBN 9781932846126.
- ^ Chen, H .; Green, R.E .; Paabo, S .; Слаткин, М. (29 июля 2007 г.). "Совместный частотный спектр аллелей у близкородственных видов". Генетика. 177 (1): 387–398. Дои:10.1534 / genetics.107.070730. ЧВК 2013700. PMID 17603120.
- ^ а б Gutenkunst, Ryan N .; Эрнандес, Райан Д .; Уильямсон, Скотт Х .; Бустаманте, Карлос Д. (23 октября 2009 г.). «Вывод совместной демографической истории множества популяций из многомерных данных о частоте SNP». PLoS Genetics. 5 (10): e1000695. Дои:10.1371 / journal.pgen.1000695. ЧВК 2760211. PMID 19851460.
- ^ Marth, Gabor T .; Чабарка, Ева; Мурвай, Янош; Шерри, Стивен Т. (1 января 2004 г.). «Частотный спектр аллелей в данных об изменениях человека в масштабе всего генома выявляет сигналы дифференциальной демографической истории в трех больших популяциях мира». Генетика. 166 (1): 351–372. Дои:10.1534 / genetics.166.1.351. ЧВК 1470693. PMID 15020430.
- ^ Бойко, Адам Р .; Уильямсон, Скотт Х .; Indap, Amit R .; Degenhardt, Jeremiah D .; Эрнандес, Райан Д .; Lohmueller, Kirk E .; Адамс, Марк Д .; Шмидт, Штеффен; Снинский, Джон Дж .; Сюняев, Шамиль Р .; Белый, Томас Дж .; Нильсен, Расмус; Кларк, Эндрю Дж .; Бустаманте, Карлос Д. (30 мая 2008 г.). «Оценка эволюционного воздействия аминокислотных мутаций в геноме человека». PLoS Genetics. 4 (5): e1000083. Дои:10.1371 / journal.pgen.1000083.