Список программного обеспечения для обнаружения областей низкой сложности в белках - List of software to detect low complexity regions in proteins

Вычислительные методы позволяют изучать белковые последовательности для идентификации областей с низкая сложность, которые могут иметь определенные свойства в отношении их функции и структуры.

имяПоследнее обновлениеПрименениеОписаниеОткрытый исходный код?Справка
SAPS1992загружаемый / сетьОн описывает несколько статистических данных последовательностей белков для оценки отличительных характеристик содержания и расположения остатков в первичных структурах.да[1]
SEG1993загружаемыйЭто двухпроходный алгоритм: сначала идентифицирует LCR, а затем выполняет локальную оптимизацию, маскируя с помощью X LCR.да[2]
fLPS2017загружаемый / сетьОн может легко обрабатывать очень большие наборы данных о белках, которые могут быть получены в результате метагеномических проектов. Это полезно для поиска белков со схожими CBR и для функциональных выводов о CBR для интересующего белка.да[3]
БРОСАТЬ2000сетьОн идентифицирует LCR с помощью динамического программирования.нет[4]
ПРОСТО2002загружаемый сетьЭто облегчает количественную оценку количества простой последовательности в белках и определяет тип коротких мотивов, которые демонстрируют кластеризацию выше определенного порога.да[5]
Oj.py2001по запросуИнструмент для разграничения белковых доменов низкой сложности.нет[6]
DSR2003по запросуОн вычисляет сложность, используя взаимную сложность.нет[7]
ScanCom2003по запросуВычисляет сложность композиции с использованием меры лингвистической сложности.нет[8]
КАРТА2005по запросуНа основе анализа сложности подпоследовательностей, разделенных парами идентичных повторяющихся подпоследовательностей.нет[9]
Смещение2006загружаемый / сетьОн использует статистику дискретного сканирования, которая обеспечивает высокоточную коррекцию множественных тестов для вычисления аналитических оценок значимости каждого сегмента с композиционным смещением.да[10]
GBA2006по запросуАлгоритм на основе графа, который строит граф последовательности.нет[11]
SubSeqer2008сетьПодход на основе графов для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности.нет[12]
ЭННИ2009сетьЭтот метод автоматизирует процесс анализа последовательностей.нет[13]
LPS-аннотировать2011по запросуЭтот алгоритм определяет композиционную систематическую ошибку посредством тщательного поиска подпоследовательностей с наименьшей вероятностью (LPS; Low Probability Sequences) и служит рабочим столом инструментов, которые теперь доступны молекулярным биологам для генерации гипотез и выводов относительно исследуемых белков.нет[14]
LCReXXXplorer2015сетьВеб-платформа для поиска, визуализации и обмена данными о регионах низкой сложности в белковых последовательностях. LCR-eXXXplorer предлагает инструменты для отображения LCR из базы знаний UniProt / SwissProt в сочетании с другими соответствующими характеристиками белков, предсказанными или экспериментально подтвержденными. Кроме того, пользователи могут выполнять запросы к специально разработанной базе данных последовательностей / LCR.нет[15]
XNU1993загружаемыйОн использует оценочную матрицу PAM120 для расчета сложности.да[16]


Подробный обзор различных методов и инструментов см. [17].

Кроме того, был разработан веб-мета-сервер под названием PLAtform of TOols для LOw COmplexity (PlaToLoCo) для визуализации и аннотации областей низкой сложности в белках. [18]. PlaToLoCo объединяет и собирает выходные данные пяти различных современных инструментов для обнаружения LCR и предоставляет функциональные аннотации, такие как обнаружение домена, прогнозирование трансмембранного сегмента и вычисление частот аминокислот. Кроме того, можно получить объединение или пересечение результатов поиска по последовательности запросов.

Веб-сервер нейронной сети, названный LCR-hound, был разработан для прогнозирования функции LCR прокариот и эукариот на основе их аминокислотного или диаминокислотного содержания. [19].

использованная литература

  1. ^ Брендель В., Бухер П., Нурбахш И. Р., Блейсделл Б. Е., Карлин С. (15 марта 1992 г.). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc Natl Acad Sci U S A. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК  48584. PMID  1549558.
  2. ^ Вуттон Дж. С., Федерхен С. (июнь 2003 г.). «Статистика локальной сложности в аминокислотных последовательностях и базах данных последовательностей». Компьютеры и химия. 17 (2): 149–163. Дои:10.1016 / 0097-8485 (93) 85006-X.
  3. ^ Harrison PM (13 ноября 2017 г.). «fLPS: быстрое открытие композиционных предубеждений для белковой вселенной». BMC Bioinformatics. 18 (1): 476. Дои:10.1186 / s12859-017-1906-3. ЧВК  5684748. PMID  29132292.
  4. ^ Промпонас В.Дж., Энрайт А.Дж., Цока С., Крейл Д.П., Лерой С., Хамодракас С., Сандер К., Узунис, Калифорния (октябрь 2000 г.). «CAST: итерационный алгоритм для анализа сложности участков последовательности. Анализ сложности участков последовательности». Биоинформатика. 16 (10): 915–922. Дои:10.1093 / биоинформатика / 16.10.915. PMID  11120681.
  5. ^ Альба М.М., Ласковски Р.А., Хэнкок Дж. М. (май 2002 г.). «Обнаружение криптически простых последовательностей белков с помощью алгоритма SIMPLE». Биоинформатика. 18 (5): 672–678. Дои:10.1093 / биоинформатика / 18.5.672. PMID  12050063.
  6. ^ Мудрый MJ (2001). «0j.py: программный инструмент для белков низкой сложности и белковых доменов». Биоинформатика. 17 (Приложение 1): S288 – S295. Дои:10.1093 / биоинформатика / 17.suppl_1.s288. PMID  11473020.
  7. ^ Ван Х, Ли Л., Федерхен С., Вуттон Дж. С. (2003). «Обнаружение простых областей в биологических последовательностях, связанных со схемами оценки». J Comput Biol. 10 (2): 171–185. Дои:10.1089/106652703321825955. PMID  12804090.
  8. ^ Нанди Т., Даш Д., Гай Р., Б-Рао С., Каннан К., Брахмачари С. К., Рамакришнан С., Рамачандран С. (2003). «Новый алгоритм обнаружения участков низкой сложности в белковых последовательностях». J Biomol Struct Dyn. 20 (5): 657–668. Дои:10.1080/07391102.2003.10506882. PMID  12643768.
  9. ^ Шин С.В., Ким С.М. (15 января 2005 г.). «Новая мера сложности для сравнительного анализа белковых последовательностей полных геномов». Биоинформатика. 21 (2): 160–170. Дои:10.1093 / биоинформатика / bth497. PMID  15333459.
  10. ^ Кузнецов И.Б., Хван С. (1 мая 2006 г.). «Новый чувствительный метод для обнаружения определяемой пользователем систематической ошибки в биологических последовательностях». Биоинформатика. 22 (9): 1055–1063. Дои:10.1093 / биоинформатика / btl049. PMID  16500936.
  11. ^ Ли Х, Кахвечи Т. (15 декабря 2006 г.). «Новый алгоритм для идентификации областей низкой сложности в последовательности белка». Биоинформатика. 22 (24): 2980–2987. Дои:10.1093 / биоинформатика / btl495. PMID  17018537.
  12. ^ He D, Parkinson J (1 апреля 2008 г.). «SubSeqer: основанный на графах подход для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности». Биоинформатика. 24 (7): 1016–1017. Дои:10.1093 / биоинформатика / btn073. PMID  18304932.
  13. ^ Ooi HS, Kwo CY, Wildpaner M, Sirota FL, Eisenhaber B, Maurer-Stroh S, Wong WC, Schleiffer A, Eisenhaber F, Schneider G (июль 2009 г.). «ЭННИ: интегрированная аннотация белковой последовательности de novo». Нуклеиновые кислоты Res. 37 (Проблема с веб-сервером): W435 – W440. Дои:10.1093 / нар / gkp254. ЧВК  2703921. PMID  19389726.
  14. ^ Харби Д., Кумар М., Харрисон П.М. (6 января 2011 г.). «LPS-annotate: полная аннотация композиционно смещенных областей в базе знаний о белках». База данных (Оксфорд). 2011: baq031. Дои:10.1093 / база данных / baq031. ЧВК  3017391. PMID  21216786.
  15. ^ Kirmitzoglou I, Promponas VJ (1 июля 2015 г.). «LCR-eXXXplorer: веб-платформа для поиска, визуализации и обмена данными для областей низкой сложности в белковых последовательностях». Биоинформатика. 31 (13): 2208–2210. Дои:10.1093 / биоинформатика / btv115. ЧВК  4481844. PMID  25712690.
  16. ^ Claverie JM, States D (июнь 1993 г.). «Методы расширения информации для крупномасштабного анализа последовательностей». Компьютеры Chem. 17 (2): 191–201. Дои:10.1016 / 0097-8485 (93) 85010-а.
  17. ^ Майер, Пабло; Паладин, Лисанна; Тамана, Стелла; Петросян, Софья; Хайду-Солтес, Борбала; Урбанек, Анника; Груца, Александра; Плевчинский, Дариуш; Гринберг, Марцин; Бернадо, По; Гаспари, Золтан (23 марта 2020 г.). «Распутывая сложность белков низкой сложности». Брифинги по биоинформатике. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ISSN  1467-5463. ЧВК  7299295. PMID  30698641.
  18. ^ Ярно, Патрик; Зиемска-Легецкая, Иоанна; Добсон, Ласло; Мерски, Мэтью; Майер, Пабло; Андраде-Наварро, Мигель А; Хэнкок, Джон М; Dosztányi, Zsuzsanna; Паладин, Лисанна; Некчи, Марко; Пиовезан, Дамиано (02.07.2020). «PlaToLoCo: первый веб-мета-сервер для визуализации и аннотации областей низкой сложности в белках». Исследования нуклеиновых кислот. 48 (W1): W77 – W84. Дои:10.1093 / нар / gkaa339. ISSN  0305-1048. ЧВК  7319588. PMID  32421769.
  19. ^ Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN  0305-1048. ЧВК  6821194. PMID  31504783.