Счет Сулстона - Sulston score
В Счет Сулстона это уравнение, используемое в Картирование ДНК чтобы численно оценить вероятность того, что данное сходство «отпечатков пальцев» между двумя клонами ДНК является просто результатом случайности. В таком виде это проверка статистической значимости. То есть низкие значения означают, что сходство существенный, предполагая, что два клона ДНК перекрывают друг друга и что данное сходство не просто случайность. Имя это эпоним это относится к Джон Салстон в силу того, что он был ведущим автором статьи, в которой впервые было предложено использование этого уравнения.[1]
Проблема перекрытия при отображении
Каждый клон в Картирование ДНК проект имеет «отпечаток пальца», т.е. набор длин фрагментов ДНК, выведенных из (1) ферментативного переваривания клона, (2) разделения этих фрагментов на геле и (3) оценки их длины на основе местоположения в геле. Для каждого попарного сравнения клонов можно установить, сколько длин из каждого набора совпадений. Случаи, имеющие хотя бы 1 совпадение, указывают на то, что клоны мог бы перекрываются, потому что совпадения май представляют собой ту же ДНК. Однако основные последовательности для каждого совпадения неизвестны. Следовательно, два фрагмента, длины которых совпадают, могут по-прежнему представлять разные последовательности. Другими словами, совпадения окончательно не указывают на совпадения. Проблема заключается в использовании совпадений с вероятностно классифицировать статус перекрытия.
Математические баллы при оценивании перекрытий
Биологи использовали различные методы (часто в комбинации), чтобы различить клоны перекрытия в Картирование ДНК проекты. Хотя многие из них являются биологическими, т.е. поиск общих маркеров, другие в основном математические, обычно применяя вероятностные и / или статистические подходы.
Экспозиция партитуры Сулстона
Оценка Сулстона основана на концепции Бернулли и биномиальные процессы, следующее. Рассмотрим двух клонов, и , имея и соответственно измеренные длины фрагментов, где . То есть клон имеет как минимум столько же фрагментов, сколько клон , но обычно больше. Оценка Сулстона - это вероятность того, что по крайней мере длины фрагментов на клоне будут соответствовать любой комбинации длин на . Интуитивно мы видим, что в лучшем случае может быть совпадения. Таким образом, для данного сравнения двух клонов можно измерить статистическую значимость совпадения фрагменты т.е. насколько вероятно, что это совпадение произошло просто случайно. Очень низкие значения указывают на значительное совпадение, которое вряд ли возникло по чистой случайности, в то время как более высокие значения предполагают, что данное совпадение могло быть просто совпадением.
Вывод баллов Сулстона Одно из основных предположений состоит в том, что фрагменты равномерно распределены на геле, т.е. Фрагмент имеет равную вероятность появления где-нибудь на геле. Поскольку положение геля является показателем длины фрагмента, это предположение эквивалентно предположению, что длины фрагментов распределены равномерно. Измеренное местоположение любого фрагмента , имеет связанную устойчивость к ошибкам , так что его истинное местоположение известно только в пределах сегмента . В дальнейшем будем называть длины отдельных фрагментов просто длина. Учитывайте конкретную длину на клоне и определенная длина на клоне . Эти две длины произвольно выбираются из соответствующих наборов. и . Мы предполагаем, что расположение фрагмента в геле было определено, и мы хотим, чтобы вероятность события что расположение фрагмента будет соответствовать тому из . Геометрически, будет объявлено соответствующим если он попадает в окно размера вокруг . Поскольку фрагмент может произойти где угодно в геле длиной , у нас есть . Вероятность того, что не матч это просто дополнение, т.е. , поскольку он должен совпадать или не совпадать.
Теперь давайте расширим это, чтобы вычислить вероятность того, что длина клона соответствует единственной конкретной длине на клоне . Это просто пересечение всех отдельных испытаний. где мероприятие происходит, т.е. . Устно это можно переформулировать как: длина 1 на клоне не соответствует длине на клоне и длина 2 не соответствует длине и длина 3 не совпадает и т. д. Поскольку предполагается, что каждое из этих испытаний является независимым, вероятность просто равна
Конечно же, актуальным событием является дополнение: т.е. есть нет "нет совпадений". Другими словами, вероятность одного или нескольких совпадений равна . Формально, вероятность того, что хотя бы одна полоса на клоне группа матчей на клоне .
Это событие принято как Бернулли суд имеющий «успех» (совпадение) вероятность для группы . Однако мы хотим описать процесс над все полосы на клоне . С постоянно, количество совпадений распределяется биномиально. Данный наблюдаемые матчи, оценка Сулстона это просто вероятность получения по меньшей мере совпадения случайно согласно
куда находятся биномиальные коэффициенты.
Математическое уточнение
В статье 2005 г.[2] Майкл Вендл привел пример, показывающий, что предположение о независимых испытаниях неверно. Итак, хотя традиционная оценка Сулстона действительно представляет собой распределение вероятностей, на самом деле это не характеристика распределения проблемы отпечатков пальцев. Вендл дал общее решение этой проблемы в терминах Полиномы Белла, показывающий, что традиционная оценка на несколько порядков превосходит P-значения. (P-значения в этой задаче очень малы, поэтому мы говорим, например, о вероятностях порядка 10 × 10−14 против 10 × 10−12(последнее значение Сулстона на 2 порядка выше). Это решение обеспечивает основу для определения того, когда проблема имеет достаточно информации, чтобы ее можно было обработать с помощью вероятностного подхода, а также является общим решением проблемы. задача дня рождения 2-х видов.
Недостатком точного решения является то, что его оценка требует больших вычислительных ресурсов и, по сути, невозможна для сравнения больших клонов.[2] Были предложены некоторые быстрые приближения для этой проблемы.[3]
Рекомендации
- ^ Салстон Дж., Маллетт Ф., Стаден Р., Дурбин Р., Хорснелл Т., Коулсон А. (март 1988 г.). «Программное обеспечение для картирования генома методами дактилоскопии». Comput Appl Biosci. 4 (1): 125–32. Дои:10.1093 / биоинформатика / 4.1.125. PMID 2838135.
- ^ а б Wendl MC (апрель 2005 г.). «Вероятностная оценка клонов перекрытия в картировании отпечатков пальцев ДНК с помощью априорных моделей». J. Comput. Биол. 12 (3): 283–97. Дои:10.1089 / cmb.2005.12.283. PMID 15857243.
- ^ Wendl MC (2007). «Методы алгебраической коррекции для компьютерной оценки перекрытий клонов при картировании отпечатков пальцев ДНК». BMC Bioinformatics. 8: 127. Дои:10.1186/1471-2105-8-127. ЧВК 1868038. PMID 17442113.
Смотрите также
- FPC: широко используемая программа картирования отпечатков пальцев, использующая шкалу Сулстона.