Список программного обеспечения для обнаружения областей низкой сложности в белках - List of software to detect low complexity regions in proteins
Вычислительные методы позволяют изучать белковые последовательности для идентификации областей с низкая сложность, которые могут иметь определенные свойства в отношении их функции и структуры.
имя | Последнее обновление | Применение | Описание | Открытый исходный код? | Справка |
---|---|---|---|---|---|
SAPS | 1992 | загружаемый / сеть | Он описывает несколько статистических данных последовательностей белков для оценки отличительных характеристик содержания и расположения остатков в первичных структурах. | да | [1] |
SEG | 1993 | загружаемый | Это двухпроходный алгоритм: сначала идентифицирует LCR, а затем выполняет локальную оптимизацию, маскируя с помощью X LCR. | да | [2] |
fLPS | 2017 | загружаемый / сеть | Он может легко обрабатывать очень большие наборы данных о белках, которые могут быть получены в результате метагеномических проектов. Это полезно для поиска белков со схожими CBR и для функциональных выводов о CBR для интересующего белка. | да | [3] |
БРОСАТЬ | 2000 | сеть | Он идентифицирует LCR с помощью динамического программирования. | нет | [4] |
ПРОСТО | 2002 | загружаемый сеть | Это облегчает количественную оценку количества простой последовательности в белках и определяет тип коротких мотивов, которые демонстрируют кластеризацию выше определенного порога. | да | [5] |
Oj.py | 2001 | по запросу | Инструмент для разграничения белковых доменов низкой сложности. | нет | [6] |
DSR | 2003 | по запросу | Он вычисляет сложность, используя взаимную сложность. | нет | [7] |
ScanCom | 2003 | по запросу | Вычисляет сложность композиции с использованием меры лингвистической сложности. | нет | [8] |
КАРТА | 2005 | по запросу | На основе анализа сложности подпоследовательностей, разделенных парами идентичных повторяющихся подпоследовательностей. | нет | [9] |
Смещение | 2006 | загружаемый / сеть | Он использует статистику дискретного сканирования, которая обеспечивает высокоточную коррекцию множественных тестов для вычисления аналитических оценок значимости каждого сегмента с композиционным смещением. | да | [10] |
GBA | 2006 | по запросу | Алгоритм на основе графа, который строит граф последовательности. | нет | [11] |
SubSeqer | 2008 | сеть | Подход на основе графов для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности. | нет | [12] |
ЭННИ | 2009 | сеть | Этот метод автоматизирует процесс анализа последовательностей. | нет | [13] |
LPS-аннотировать | 2011 | по запросу | Этот алгоритм определяет композиционную систематическую ошибку посредством тщательного поиска подпоследовательностей с наименьшей вероятностью (LPS; Low Probability Sequences) и служит рабочим столом инструментов, которые теперь доступны молекулярным биологам для генерации гипотез и выводов относительно исследуемых белков. | нет | [14] |
LCReXXXplorer | 2015 | сеть | Веб-платформа для поиска, визуализации и обмена данными о регионах низкой сложности в белковых последовательностях. LCR-eXXXplorer предлагает инструменты для отображения LCR из базы знаний UniProt / SwissProt в сочетании с другими соответствующими характеристиками белков, предсказанными или экспериментально подтвержденными. Кроме того, пользователи могут выполнять запросы к специально разработанной базе данных последовательностей / LCR. | нет | [15] |
XNU | 1993 | загружаемый | Он использует оценочную матрицу PAM120 для расчета сложности. | да | [16] |
Подробный обзор различных методов и инструментов см. [17].
Кроме того, был разработан веб-мета-сервер под названием PLAtform of TOols для LOw COmplexity (PlaToLoCo) для визуализации и аннотации областей низкой сложности в белках. [18]. PlaToLoCo объединяет и собирает выходные данные пяти различных современных инструментов для обнаружения LCR и предоставляет функциональные аннотации, такие как обнаружение домена, прогнозирование трансмембранного сегмента и вычисление частот аминокислот. Кроме того, можно получить объединение или пересечение результатов поиска по последовательности запросов.
Веб-сервер нейронной сети, названный LCR-hound, был разработан для прогнозирования функции LCR прокариот и эукариот на основе их аминокислотного или диаминокислотного содержания. [19].
использованная литература
- ^ Брендель В., Бухер П., Нурбахш И. Р., Блейсделл Б. Е., Карлин С. (15 марта 1992 г.). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc Natl Acad Sci U S A. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК 48584. PMID 1549558.
- ^ Вуттон Дж. С., Федерхен С. (июнь 2003 г.). «Статистика локальной сложности в аминокислотных последовательностях и базах данных последовательностей». Компьютеры и химия. 17 (2): 149–163. Дои:10.1016 / 0097-8485 (93) 85006-X.
- ^ Harrison PM (13 ноября 2017 г.). «fLPS: быстрое открытие композиционных предубеждений для белковой вселенной». BMC Bioinformatics. 18 (1): 476. Дои:10.1186 / s12859-017-1906-3. ЧВК 5684748. PMID 29132292.
- ^ Промпонас В.Дж., Энрайт А.Дж., Цока С., Крейл Д.П., Лерой С., Хамодракас С., Сандер К., Узунис, Калифорния (октябрь 2000 г.). «CAST: итерационный алгоритм для анализа сложности участков последовательности. Анализ сложности участков последовательности». Биоинформатика. 16 (10): 915–922. Дои:10.1093 / биоинформатика / 16.10.915. PMID 11120681.
- ^ Альба М.М., Ласковски Р.А., Хэнкок Дж. М. (май 2002 г.). «Обнаружение криптически простых последовательностей белков с помощью алгоритма SIMPLE». Биоинформатика. 18 (5): 672–678. Дои:10.1093 / биоинформатика / 18.5.672. PMID 12050063.
- ^ Мудрый MJ (2001). «0j.py: программный инструмент для белков низкой сложности и белковых доменов». Биоинформатика. 17 (Приложение 1): S288 – S295. Дои:10.1093 / биоинформатика / 17.suppl_1.s288. PMID 11473020.
- ^ Ван Х, Ли Л., Федерхен С., Вуттон Дж. С. (2003). «Обнаружение простых областей в биологических последовательностях, связанных со схемами оценки». J Comput Biol. 10 (2): 171–185. Дои:10.1089/106652703321825955. PMID 12804090.
- ^ Нанди Т., Даш Д., Гай Р., Б-Рао С., Каннан К., Брахмачари С. К., Рамакришнан С., Рамачандран С. (2003). «Новый алгоритм обнаружения участков низкой сложности в белковых последовательностях». J Biomol Struct Dyn. 20 (5): 657–668. Дои:10.1080/07391102.2003.10506882. PMID 12643768.
- ^ Шин С.В., Ким С.М. (15 января 2005 г.). «Новая мера сложности для сравнительного анализа белковых последовательностей полных геномов». Биоинформатика. 21 (2): 160–170. Дои:10.1093 / биоинформатика / bth497. PMID 15333459.
- ^ Кузнецов И.Б., Хван С. (1 мая 2006 г.). «Новый чувствительный метод для обнаружения определяемой пользователем систематической ошибки в биологических последовательностях». Биоинформатика. 22 (9): 1055–1063. Дои:10.1093 / биоинформатика / btl049. PMID 16500936.
- ^ Ли Х, Кахвечи Т. (15 декабря 2006 г.). «Новый алгоритм для идентификации областей низкой сложности в последовательности белка». Биоинформатика. 22 (24): 2980–2987. Дои:10.1093 / биоинформатика / btl495. PMID 17018537.
- ^ He D, Parkinson J (1 апреля 2008 г.). «SubSeqer: основанный на графах подход для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности». Биоинформатика. 24 (7): 1016–1017. Дои:10.1093 / биоинформатика / btn073. PMID 18304932.
- ^ Ooi HS, Kwo CY, Wildpaner M, Sirota FL, Eisenhaber B, Maurer-Stroh S, Wong WC, Schleiffer A, Eisenhaber F, Schneider G (июль 2009 г.). «ЭННИ: интегрированная аннотация белковой последовательности de novo». Нуклеиновые кислоты Res. 37 (Проблема с веб-сервером): W435 – W440. Дои:10.1093 / нар / gkp254. ЧВК 2703921. PMID 19389726.
- ^ Харби Д., Кумар М., Харрисон П.М. (6 января 2011 г.). «LPS-annotate: полная аннотация композиционно смещенных областей в базе знаний о белках». База данных (Оксфорд). 2011: baq031. Дои:10.1093 / база данных / baq031. ЧВК 3017391. PMID 21216786.
- ^ Kirmitzoglou I, Promponas VJ (1 июля 2015 г.). «LCR-eXXXplorer: веб-платформа для поиска, визуализации и обмена данными для областей низкой сложности в белковых последовательностях». Биоинформатика. 31 (13): 2208–2210. Дои:10.1093 / биоинформатика / btv115. ЧВК 4481844. PMID 25712690.
- ^ Claverie JM, States D (июнь 1993 г.). «Методы расширения информации для крупномасштабного анализа последовательностей». Компьютеры Chem. 17 (2): 191–201. Дои:10.1016 / 0097-8485 (93) 85010-а.
- ^ Майер, Пабло; Паладин, Лисанна; Тамана, Стелла; Петросян, Софья; Хайду-Солтес, Борбала; Урбанек, Анника; Груца, Александра; Плевчинский, Дариуш; Гринберг, Марцин; Бернадо, По; Гаспари, Золтан (23 марта 2020 г.). «Распутывая сложность белков низкой сложности». Брифинги по биоинформатике. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ISSN 1467-5463. ЧВК 7299295. PMID 30698641.
- ^ Ярно, Патрик; Зиемска-Легецкая, Иоанна; Добсон, Ласло; Мерски, Мэтью; Майер, Пабло; Андраде-Наварро, Мигель А; Хэнкок, Джон М; Dosztányi, Zsuzsanna; Паладин, Лисанна; Некчи, Марко; Пиовезан, Дамиано (02.07.2020). «PlaToLoCo: первый веб-мета-сервер для визуализации и аннотации областей низкой сложности в белках». Исследования нуклеиновых кислот. 48 (W1): W77 – W84. Дои:10.1093 / нар / gkaa339. ISSN 0305-1048. ЧВК 7319588. PMID 32421769.
- ^ Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN 0305-1048. ЧВК 6821194. PMID 31504783.