Bowtie (анализ последовательности) - Википедия - Bowtie (sequence analysis)

Галстук-бабочка
Оригинальный автор (ы)Бен Лэнгмид
Коул Трапнелл
Михай Поп
Стивен Зальцберг
Разработчики)Бен Лэнгмид и другие.,
Стабильный выпуск
2.3.5.1 / 16 апреля 2019; 19 месяцев назад (2019-04-16)
Репозиторий Отредактируйте это в Викиданных
Операционная системаLinux
macOS
Windows
Размер14.7 МБ (Источник)
ТипБиоинформатика
Интернет сайтwww.bowtie-bio.sourceforge.сеть

Галстук-бабочка это программный пакет, обычно используемый для выравнивание последовательностей и анализ последовательности в биоинформатика.[1] Исходный код пакета распространяется свободно и скомпилированные двоичные файлы доступны для Linux, macOS и Windows платформы. По состоянию на 2017 год Геномная биология статья, описывающая оригинальный метод Bowtie, цитировалась более 11000 раз.[1] Bowtie это программное обеспечение с открытым исходным кодом и в настоящее время поддерживается Университет Джона Хопкинса.

История

Выравниватель последовательностей Bowtie был первоначально разработан Бен Лэнгмид и другие. на Университет Мэриленда в 2009.[1] Выравниватель обычно используется с короткими считываниями и большим эталонный геном, или для анализ всего генома. Bowtie продвигается как «сверхбыстрый, эффективный для памяти короткий выравниватель для краткости. ДНК последовательности ". Увеличение скорости Bowtie частично связано с реализацией Преобразование Барроуза – Уиллера для выравнивания, что уменьшает объем памяти (обычно около 2,2 ГБ для генома человека);[2] аналогичный метод используется BWA[3] и SOAP2[4] методы выравнивания. [2]

Bowtie проводит качественную, жадную, рандомизированную поиск в глубину через пространство возможных выравниваний. Поскольку поиск является жадным, первое действительное выравнивание, обнаруженное Bowtie, не обязательно будет «лучшим» с точки зрения количества несоответствий или с точки зрения качества.

Bowtie используется в качестве выравнивателя последовательностей рядом других связанных алгоритмов биоинформатики, включая TopHat,[5] Запонки[6] и CummeRbund Биокондуктор упаковка.[7]

Галстук-бабочка 2

16 октября 2011 года разработчики выпустили бета-версию вилка проекта под названием Галстук-бабочка 2.[8] В дополнение к преобразованию Барроуза-Уиллера, Bowtie 2 также использует FM-индекс (аналогично массив суффиксов ), чтобы уменьшить объем памяти. Благодаря своей реализации Bowtie 2 больше подходит для поиска более длинных совмещений с зазорами по сравнению с исходным методом Bowtie. В Bowtie 2 нет верхнего предела длины чтения, и это позволяет выравниванию перекрывать неоднозначные символы в ссылке.

Рекомендации

  1. ^ а б c Лэнгмид, Бен; Коул Трапнелл; Михай Поп; Стивен Л. Зальцберг (4 марта 2009 г.). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с геномом человека» (PDF). Геномная биология. 10 (3): 10: R25. Дои:10.1186 / gb-2009-10-3-r25. ЧВК  2690996. PMID  19261174. Получено 29 ноябрь 2013.
  2. ^ а б "Bowtie: сверхбыстрый выравниватель короткого чтения с эффективным использованием памяти - SourceForge". Получено 29 ноябрь 2013.
  3. ^ Li, H .; Дурбин, Р. (18 мая 2009 г.). «Быстрое и точное согласование короткого чтения с преобразованием Барроуза-Уиллера». Биоинформатика. 25 (14): 1754–1760. Дои:10.1093 / биоинформатика / btp324. ЧВК  2705234. PMID  19451168.
  4. ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Ван Дж. (3 июня 2009 г.). «SOAP2: улучшенный сверхбыстрый инструмент для согласования краткого чтения». Биоинформатика. 25 (15): 1966–1967. Дои:10.1093 / биоинформатика / btp336. PMID  19497933.
  5. ^ Trapnell, C .; Пахтер, Л.; Зальцберг, С. Л. (16 марта 2009 г.). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq». Биоинформатика. 25 (9): 1105–1111. Дои:10.1093 / биоинформатика / btp120. ЧВК  2672628. PMID  19289445.
  6. ^ «CummeRbund - пакет R для постоянного хранения, анализа и визуализации RNA-Seq из выходных данных запонок». Получено 11 августа 2015.
  7. ^ Лэнгмид, Бен; Зальцберг, Стивен Л. (4 марта 2012 г.). «Быстрое выравнивание с пропуском чтения с Bowtie 2». Методы природы. 9 (4): 357–359. Дои:10.1038 / мес.1923. ЧВК  3322381. PMID  22388286.

внешняя ссылка