Список программного обеспечения для обнаружения областей низкой сложности в белках - List of software to detect low complexity regions in proteins

Вычислительные методы позволяют изучать белковые последовательности для идентификации областей с низкая сложность, которые могут иметь определенные свойства в отношении их функции и структуры.

имя	Последнее обновление	Применение	Описание	Открытый исходный код?	Справка
SAPS	1992	загружаемый / сеть	Он описывает несколько статистических данных последовательностей белков для оценки отличительных характеристик содержания и расположения остатков в первичных структурах.	да	^[1]
SEG	1993	загружаемый	Это двухпроходный алгоритм: сначала идентифицирует LCR, а затем выполняет локальную оптимизацию, маскируя с помощью X LCR.	да	^[2]
fLPS	2017	загружаемый / сеть	Он может легко обрабатывать очень большие наборы данных о белках, которые могут быть получены в результате метагеномических проектов. Это полезно для поиска белков со схожими CBR и для функциональных выводов о CBR для интересующего белка.	да	^[3]
БРОСАТЬ	2000	сеть	Он идентифицирует LCR с помощью динамического программирования.	нет	^[4]
ПРОСТО	2002	загружаемый сеть	Это облегчает количественную оценку количества простой последовательности в белках и определяет тип коротких мотивов, которые демонстрируют кластеризацию выше определенного порога.	да	^[5]
Oj.py	2001	по запросу	Инструмент для разграничения белковых доменов низкой сложности.	нет	^[6]
DSR	2003	по запросу	Он вычисляет сложность, используя взаимную сложность.	нет	^[7]
ScanCom	2003	по запросу	Вычисляет сложность композиции с использованием меры лингвистической сложности.	нет	^[8]
КАРТА	2005	по запросу	На основе анализа сложности подпоследовательностей, разделенных парами идентичных повторяющихся подпоследовательностей.	нет	^[9]
Смещение	2006	загружаемый / сеть	Он использует статистику дискретного сканирования, которая обеспечивает высокоточную коррекцию множественных тестов для вычисления аналитических оценок значимости каждого сегмента с композиционным смещением.	да	^[10]
GBA	2006	по запросу	Алгоритм на основе графа, который строит граф последовательности.	нет	^[11]
SubSeqer	2008	сеть	Подход на основе графов для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности.	нет	^[12]
ЭННИ	2009	сеть	Этот метод автоматизирует процесс анализа последовательностей.	нет	^[13]
LPS-аннотировать	2011	по запросу	Этот алгоритм определяет композиционную систематическую ошибку посредством тщательного поиска подпоследовательностей с наименьшей вероятностью (LPS; Low Probability Sequences) и служит рабочим столом инструментов, которые теперь доступны молекулярным биологам для генерации гипотез и выводов относительно исследуемых белков.	нет	^[14]
LCReXXXplorer	2015	сеть	Веб-платформа для поиска, визуализации и обмена данными о регионах низкой сложности в белковых последовательностях. LCR-eXXXplorer предлагает инструменты для отображения LCR из базы знаний UniProt / SwissProt в сочетании с другими соответствующими характеристиками белков, предсказанными или экспериментально подтвержденными. Кроме того, пользователи могут выполнять запросы к специально разработанной базе данных последовательностей / LCR.	нет	^[15]
XNU	1993	загружаемый	Он использует оценочную матрицу PAM120 для расчета сложности.	да	^[16]

Подробный обзор различных методов и инструментов см. ^[17].

Кроме того, был разработан веб-мета-сервер под названием PLAtform of TOols для LOw COmplexity (PlaToLoCo) для визуализации и аннотации областей низкой сложности в белках. ^[18]. PlaToLoCo объединяет и собирает выходные данные пяти различных современных инструментов для обнаружения LCR и предоставляет функциональные аннотации, такие как обнаружение домена, прогнозирование трансмембранного сегмента и вычисление частот аминокислот. Кроме того, можно получить объединение или пересечение результатов поиска по последовательности запросов.

Веб-сервер нейронной сети, названный LCR-hound, был разработан для прогнозирования функции LCR прокариот и эукариот на основе их аминокислотного или диаминокислотного содержания. ^[19].

использованная литература

^ Брендель В., Бухер П., Нурбахш И. Р., Блейсделл Б. Е., Карлин С. (15 марта 1992 г.). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc Natl Acad Sci U S A. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК 48584. PMID 1549558.
^ Вуттон Дж. С., Федерхен С. (июнь 2003 г.). «Статистика локальной сложности в аминокислотных последовательностях и базах данных последовательностей». Компьютеры и химия. 17 (2): 149–163. Дои:10.1016 / 0097-8485 (93) 85006-X.
^ Harrison PM (13 ноября 2017 г.). «fLPS: быстрое открытие композиционных предубеждений для белковой вселенной». BMC Bioinformatics. 18 (1): 476. Дои:10.1186 / s12859-017-1906-3. ЧВК 5684748. PMID 29132292.
^ Промпонас В.Дж., Энрайт А.Дж., Цока С., Крейл Д.П., Лерой С., Хамодракас С., Сандер К., Узунис, Калифорния (октябрь 2000 г.). «CAST: итерационный алгоритм для анализа сложности участков последовательности. Анализ сложности участков последовательности». Биоинформатика. 16 (10): 915–922. Дои:10.1093 / биоинформатика / 16.10.915. PMID 11120681.
^ Альба М.М., Ласковски Р.А., Хэнкок Дж. М. (май 2002 г.). «Обнаружение криптически простых последовательностей белков с помощью алгоритма SIMPLE». Биоинформатика. 18 (5): 672–678. Дои:10.1093 / биоинформатика / 18.5.672. PMID 12050063.
^ Мудрый MJ (2001). «0j.py: программный инструмент для белков низкой сложности и белковых доменов». Биоинформатика. 17 (Приложение 1): S288 – S295. Дои:10.1093 / биоинформатика / 17.suppl_1.s288. PMID 11473020.
^ Ван Х, Ли Л., Федерхен С., Вуттон Дж. С. (2003). «Обнаружение простых областей в биологических последовательностях, связанных со схемами оценки». J Comput Biol. 10 (2): 171–185. Дои:10.1089/106652703321825955. PMID 12804090.
^ Нанди Т., Даш Д., Гай Р., Б-Рао С., Каннан К., Брахмачари С. К., Рамакришнан С., Рамачандран С. (2003). «Новый алгоритм обнаружения участков низкой сложности в белковых последовательностях». J Biomol Struct Dyn. 20 (5): 657–668. Дои:10.1080/07391102.2003.10506882. PMID 12643768.
^ Шин С.В., Ким С.М. (15 января 2005 г.). «Новая мера сложности для сравнительного анализа белковых последовательностей полных геномов». Биоинформатика. 21 (2): 160–170. Дои:10.1093 / биоинформатика / bth497. PMID 15333459.
^ Кузнецов И.Б., Хван С. (1 мая 2006 г.). «Новый чувствительный метод для обнаружения определяемой пользователем систематической ошибки в биологических последовательностях». Биоинформатика. 22 (9): 1055–1063. Дои:10.1093 / биоинформатика / btl049. PMID 16500936.
^ Ли Х, Кахвечи Т. (15 декабря 2006 г.). «Новый алгоритм для идентификации областей низкой сложности в последовательности белка». Биоинформатика. 22 (24): 2980–2987. Дои:10.1093 / биоинформатика / btl495. PMID 17018537.
^ He D, Parkinson J (1 апреля 2008 г.). «SubSeqer: основанный на графах подход для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности». Биоинформатика. 24 (7): 1016–1017. Дои:10.1093 / биоинформатика / btn073. PMID 18304932.
^ Ooi HS, Kwo CY, Wildpaner M, Sirota FL, Eisenhaber B, Maurer-Stroh S, Wong WC, Schleiffer A, Eisenhaber F, Schneider G (июль 2009 г.). «ЭННИ: интегрированная аннотация белковой последовательности de novo». Нуклеиновые кислоты Res. 37 (Проблема с веб-сервером): W435 – W440. Дои:10.1093 / нар / gkp254. ЧВК 2703921. PMID 19389726.
^ Харби Д., Кумар М., Харрисон П.М. (6 января 2011 г.). «LPS-annotate: полная аннотация композиционно смещенных областей в базе знаний о белках». База данных (Оксфорд). 2011: baq031. Дои:10.1093 / база данных / baq031. ЧВК 3017391. PMID 21216786.
^ Kirmitzoglou I, Promponas VJ (1 июля 2015 г.). «LCR-eXXXplorer: веб-платформа для поиска, визуализации и обмена данными для областей низкой сложности в белковых последовательностях». Биоинформатика. 31 (13): 2208–2210. Дои:10.1093 / биоинформатика / btv115. ЧВК 4481844. PMID 25712690.
^ Claverie JM, States D (июнь 1993 г.). «Методы расширения информации для крупномасштабного анализа последовательностей». Компьютеры Chem. 17 (2): 191–201. Дои:10.1016 / 0097-8485 (93) 85010-а.
^ Майер, Пабло; Паладин, Лисанна; Тамана, Стелла; Петросян, Софья; Хайду-Солтес, Борбала; Урбанек, Анника; Груца, Александра; Плевчинский, Дариуш; Гринберг, Марцин; Бернадо, По; Гаспари, Золтан (23 марта 2020 г.). «Распутывая сложность белков низкой сложности». Брифинги по биоинформатике. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ISSN 1467-5463. ЧВК 7299295. PMID 30698641.
^ Ярно, Патрик; Зиемска-Легецкая, Иоанна; Добсон, Ласло; Мерски, Мэтью; Майер, Пабло; Андраде-Наварро, Мигель А; Хэнкок, Джон М; Dosztányi, Zsuzsanna; Паладин, Лисанна; Некчи, Марко; Пиовезан, Дамиано (02.07.2020). «PlaToLoCo: первый веб-мета-сервер для визуализации и аннотации областей низкой сложности в белках». Исследования нуклеиновых кислот. 48 (W1): W77 – W84. Дои:10.1093 / нар / gkaa339. ISSN 0305-1048. ЧВК 7319588. PMID 32421769.
^ Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN 0305-1048. ЧВК 6821194. PMID 31504783.

[1] Брендель В., Бухер П., Нурбахш И. Р., Блейсделл Б. Е., Карлин С. (15 марта 1992 г.). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc Natl Acad Sci U S A. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК 48584. PMID 1549558.

[2] Вуттон Дж. С., Федерхен С. (июнь 2003 г.). «Статистика локальной сложности в аминокислотных последовательностях и базах данных последовательностей». Компьютеры и химия. 17 (2): 149–163. Дои:10.1016 / 0097-8485 (93) 85006-X.

[3] Harrison PM (13 ноября 2017 г.). «fLPS: быстрое открытие композиционных предубеждений для белковой вселенной». BMC Bioinformatics. 18 (1): 476. Дои:10.1186 / s12859-017-1906-3. ЧВК 5684748. PMID 29132292.

[4] Промпонас В.Дж., Энрайт А.Дж., Цока С., Крейл Д.П., Лерой С., Хамодракас С., Сандер К., Узунис, Калифорния (октябрь 2000 г.). «CAST: итерационный алгоритм для анализа сложности участков последовательности. Анализ сложности участков последовательности». Биоинформатика. 16 (10): 915–922. Дои:10.1093 / биоинформатика / 16.10.915. PMID 11120681.

[5] Альба М.М., Ласковски Р.А., Хэнкок Дж. М. (май 2002 г.). «Обнаружение криптически простых последовательностей белков с помощью алгоритма SIMPLE». Биоинформатика. 18 (5): 672–678. Дои:10.1093 / биоинформатика / 18.5.672. PMID 12050063.

[6] Мудрый MJ (2001). «0j.py: программный инструмент для белков низкой сложности и белковых доменов». Биоинформатика. 17 (Приложение 1): S288 – S295. Дои:10.1093 / биоинформатика / 17.suppl_1.s288. PMID 11473020.

[7] Ван Х, Ли Л., Федерхен С., Вуттон Дж. С. (2003). «Обнаружение простых областей в биологических последовательностях, связанных со схемами оценки». J Comput Biol. 10 (2): 171–185. Дои:10.1089/106652703321825955. PMID 12804090.

[8] Нанди Т., Даш Д., Гай Р., Б-Рао С., Каннан К., Брахмачари С. К., Рамакришнан С., Рамачандран С. (2003). «Новый алгоритм обнаружения участков низкой сложности в белковых последовательностях». J Biomol Struct Dyn. 20 (5): 657–668. Дои:10.1080/07391102.2003.10506882. PMID 12643768.

[9] Шин С.В., Ким С.М. (15 января 2005 г.). «Новая мера сложности для сравнительного анализа белковых последовательностей полных геномов». Биоинформатика. 21 (2): 160–170. Дои:10.1093 / биоинформатика / bth497. PMID 15333459.

[10] Кузнецов И.Б., Хван С. (1 мая 2006 г.). «Новый чувствительный метод для обнаружения определяемой пользователем систематической ошибки в биологических последовательностях». Биоинформатика. 22 (9): 1055–1063. Дои:10.1093 / биоинформатика / btl049. PMID 16500936.

[11] Ли Х, Кахвечи Т. (15 декабря 2006 г.). «Новый алгоритм для идентификации областей низкой сложности в последовательности белка». Биоинформатика. 22 (24): 2980–2987. Дои:10.1093 / биоинформатика / btl495. PMID 17018537.

[12] He D, Parkinson J (1 апреля 2008 г.). «SubSeqer: основанный на графах подход для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности». Биоинформатика. 24 (7): 1016–1017. Дои:10.1093 / биоинформатика / btn073. PMID 18304932.

[13] Ooi HS, Kwo CY, Wildpaner M, Sirota FL, Eisenhaber B, Maurer-Stroh S, Wong WC, Schleiffer A, Eisenhaber F, Schneider G (июль 2009 г.). «ЭННИ: интегрированная аннотация белковой последовательности de novo». Нуклеиновые кислоты Res. 37 (Проблема с веб-сервером): W435 – W440. Дои:10.1093 / нар / gkp254. ЧВК 2703921. PMID 19389726.

[14] Харби Д., Кумар М., Харрисон П.М. (6 января 2011 г.). «LPS-annotate: полная аннотация композиционно смещенных областей в базе знаний о белках». База данных (Оксфорд). 2011: baq031. Дои:10.1093 / база данных / baq031. ЧВК 3017391. PMID 21216786.

[15] Kirmitzoglou I, Promponas VJ (1 июля 2015 г.). «LCR-eXXXplorer: веб-платформа для поиска, визуализации и обмена данными для областей низкой сложности в белковых последовательностях». Биоинформатика. 31 (13): 2208–2210. Дои:10.1093 / биоинформатика / btv115. ЧВК 4481844. PMID 25712690.

[16] Claverie JM, States D (июнь 1993 г.). «Методы расширения информации для крупномасштабного анализа последовательностей». Компьютеры Chem. 17 (2): 191–201. Дои:10.1016 / 0097-8485 (93) 85010-а.

[17] Майер, Пабло; Паладин, Лисанна; Тамана, Стелла; Петросян, Софья; Хайду-Солтес, Борбала; Урбанек, Анника; Груца, Александра; Плевчинский, Дариуш; Гринберг, Марцин; Бернадо, По; Гаспари, Золтан (23 марта 2020 г.). «Распутывая сложность белков низкой сложности». Брифинги по биоинформатике. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ISSN 1467-5463. ЧВК 7299295. PMID 30698641.

[18] Ярно, Патрик; Зиемска-Легецкая, Иоанна; Добсон, Ласло; Мерски, Мэтью; Майер, Пабло; Андраде-Наварро, Мигель А; Хэнкок, Джон М; Dosztányi, Zsuzsanna; Паладин, Лисанна; Некчи, Марко; Пиовезан, Дамиано (02.07.2020). «PlaToLoCo: первый веб-мета-сервер для визуализации и аннотации областей низкой сложности в белках». Исследования нуклеиновых кислот. 48 (W1): W77 – W84. Дои:10.1093 / нар / gkaa339. ISSN 0305-1048. ЧВК 7319588. PMID 32421769.

[19] Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN 0305-1048. ЧВК 6821194. PMID 31504783.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]