РАПТОР (программное обеспечение) - Википедия - RAPTOR (software)
Оригинальный автор (ы) | Доктор Джинбо Сюй |
---|---|
Разработчики) | Bioinformatics Solutions Inc. |
Стабильный выпуск | 4.2 / ноябрь 2008 г. |
Операционная система | Windows, Linux |
Тип | Прогноз структуры белка |
Интернет сайт | биоинфор |
RAPTOR программное обеспечение потоковой передачи белков, используемое для предсказание структуры белка. Он был заменен на RaptorX, что намного точнее, чем RAPTOR.
Сравнение техник
Протеиновые нити и моделирование гомологии
Исследователи, пытающиеся решить структуру белка, начинают свое исследование с немногим более, чем последовательность белка. Первоначальные шаги могут включать выполнение PSI-BLAST или же PatternHunter поиск, чтобы найти похожие последовательности с известной структурой в Банк данных белков (PDB). Если есть очень похожие последовательности с известными структурами, высока вероятность того, что структура этого белка будет очень похожа на эти известные структуры, а также функции. Если гомологии не обнаружено, исследователь должен выполнить либо Рентгеновская кристаллография или же спектроскопия ядерного магнитного резонанса (ЯМР), оба из которых требуют значительного времени и ресурсов для создания структуры. Если эти методы слишком дороги, отнимают много времени или ограничены по объему, исследователи могут использовать программное обеспечение потоковой передачи белков, такое как RAPTOR, для создания высоконадежной модели белка.
Распределение белков более эффективно, чем моделирование гомологии, особенно для белков, которые имеют мало гомологов, обнаруживаемых выравнивание последовательностей. Оба метода предсказывают структуру белка по шаблону. Учитывая последовательность белка, потоки белков сначала выравнивают (потоки) последовательность с каждым шаблоном в библиотеке структур путем оптимизации функции подсчета, которая измеряет соответствие выравнивания структуры последовательности. Выбранный лучший шаблон используется для построения модели конструкции. В отличие от моделирования гомологии, которое выбирает шаблон исключительно на основе информации о гомологии (выравнивание последовательностей), функция подсчета очков, используемая в потоке белков, использует информацию как о гомологии, так и о структуре (выравнивание структуры последовательностей).
Если в последовательности не обнаружена значительная гомология, моделирование гомологии в этом случае может не дать надежного прогноза. Без информации о гомологии потоки белков могут использовать информацию о структуре для получения хорошего прогноза. Неудачные попытки получить хороший шаблон с помощью BLAST часто приводят к тому, что пользователи обрабатывают результаты через RAPTOR.
Целочисленное программирование против динамического программирования
В целочисленное программирование Подход к RAPTOR позволяет получать модели более высокого качества, чем другие методы нарезки протеинов. Большинство поточных программ используют динамическое программирование для оптимизации своих функций подсчета при выравнивании последовательности с шаблоном. Динамическое программирование реализовать намного проще, чем целочисленное; однако, если функция оценки включает в себя потенциал попарного контакта, динамическое программирование не может глобально оптимизировать такую функцию оценки и вместо этого просто генерирует локальное оптимальное выравнивание.
Парные контакты очень консервативны в структуре белка и имеют решающее значение для точности прогнозов. Целочисленное программирование может глобально оптимизировать функцию подсчета очков с парным контактным потенциалом и произвести глобальное оптимальное выравнивание.
Составные части
Потоковые двигатели
NoCore, NPCore и IP - это три разных механизма потоковой передачи, реализованные в RAPTOR. NoCore и NPCore основаны на динамическом программировании и работают быстрее, чем IP. Разница между ними в том, что в NPCore шаблон разбирается на множество «основных» областей. Ядро - это структурно консервативный регион. IP - это уникальный движок потокового программирования RAPTOR, основанный на целочисленном программировании. Он обеспечивает лучшее выравнивание и модели, чем два других механизма нарезания резьбы. Люди всегда могут начать с NoCore и NPCore. Если их прогнозы недостаточно хороши, IP может быть лучшим выбором. После запуска всех трех методов простой консенсус может помочь найти лучший прогноз.
Модуль моделирования 3D конструкций
По умолчанию в RAPTOR используется инструмент моделирования трехмерных структур - OWL. Моделирование трехмерной конструкции состоит из двух этапов. Первым шагом является моделирование цикла, которое моделирует области в целевой последовательности, которые не отображаются в шаблоне. После того, как все петли смоделированы и хребет готов, боковые цепи прикрепляются к хребту и упаковываются. Для моделирования циклов используется алгоритм циклического спуска координат, чтобы заполнить циклы и избежать конфликтов. Для упаковки боковых цепей используется алгоритм декомпозиции дерева, чтобы упаковать все боковые цепи и избежать любых конфликтов. OWL автоматически вызывается в RAPTOR для создания трехмерного вывода.
Если у исследователя есть MODELLER, он также может настроить RAPTOR на автоматический вызов MODELLER. RAPTOR также может генерировать входные файлы ICM-Pro, с которыми люди запускают ICM-Pro самостоятельно.
Модуль PSI-BLAST
Чтобы сделать его всеобъемлющим набором инструментов, PSI-BLAST также включен в RAPTOR, чтобы люди могли моделировать гомологию. Люди могут сами настроить все необходимые параметры. Запуск PSI-BLAST состоит из двух этапов. Первым шагом является создание профиля последовательности. Для этого шага используется нерезервированная база данных NR. Следующим шагом будет позволить PSI-BLAST выполнить поиск целевой последовательности по последовательностям из банка данных белков. Пользователи также могут указать свою собственную базу данных для каждого шага.
Наблюдатель структуры белков
Есть много различных программ просмотра структуры. В RAPTOR, Jmol используется как средство просмотра структуры для проверки сгенерированного прогноза.
Выход
После задания многопоточности / PSI-BLAST можно увидеть ранжированный список всех шаблонов. Для каждого шаблона люди могут просматривать выравнивание, E-значение и множество других конкретных оценок. Также функциональная информация о шаблоне и его SCOP классификация. Можно также просмотреть матрицу PSM последовательности и прогноз вторичной структуры. Если о шаблоне было сообщено более чем одним методом, он будет отмечен количеством раз, когда он был отправлен. Это помогает определить лучший шаблон.
Производительность в CASP
CASP, Критическая оценка методов предсказания структуры белка, - это проводимый раз в два года эксперимент, спонсируемый Национальные институты здравоохранения США. CASP представляет собой Олимпийские игры сообщества специалистов по предсказанию структуры белков и был основан в 1994 году.
RAPTOR впервые появился в КАФАСП 3 (CASP5) в 2002 году и занял первое место в индивидуальной группе серверов за этот год. С тех пор RAPTOR активно участвовал во всех CASP с целью оценки и неизменно занимал высшие позиции.
Самый последний CASP8 проводился с мая по август 2008 года. Более 80 серверов предсказаний и более 100 групп экспертов по всему миру зарегистрировались для участия в мероприятии, участники которого пытаются предсказать трехмерную структуру по последовательности белка. Согласно рейтингу группы Чжана, RAPTOR занял 2-е место среди всех серверов (мета-сервер и отдельные серверы). Робетта из Baker lab занимает 5-е место в этом же рейтинге.
Пять лучших серверов прогнозирования в CASP8
Классифицировать | Предсказатель | Используемые цели | TM-оценка | MaxSub-оценка | GDT-оценка | ГСГ-оценка |
---|---|---|---|---|---|---|
1 | Чжан-Сервер | 171 | 120.65 | 108.78 | 114.69 | 85.55 |
2 | RAPTOR | 171 | 116.13 | 104.69 | 110.79 | 82.92 |
3 | pro-sp3-TASSER | 171 | 116.05 | 103.38 | 109.95 | 80.88 |
4 | Phyre_de_novo | 171 | 115.35 | 103.47 | 110.00 | 82.51 |
5 | БЕЙКЕР-РОБЕТТА | 171 | 115.12 | 102.68 | 109.27 | 80.71 |
Рекомендации
- Сюй Дж, Ли М, Ким Д., Сюй Ю (2003). «RAPTOR: оптимальное распределение потоков с помощью линейного программирования, первый выпуск». J Bioinform Comput Biol. 1 (1): 95–117. Дои:10.1142 / S0219720003000186. PMID 15290783.
- Сюй Дж., Ли М. (2003). «Оценка подхода линейного программирования RAPTOR в CAFASP3». Белки. 53 (Дополнение 6): 579–584. Дои:10.1002 / prot.10531. PMID 14579349.
- Сюй Дж, Ли М, Лин Дж, Ким Д., Сюй Ю (2003). «Протеиновая многопоточность посредством линейного программирования». Пак Симп Биокомпьютер: 264–275. PMID 12603034.
- Сюй Дж (2005). «Распознавание белковых складок с помощью предсказанной точности выравнивания». IEEE / ACM Trans. на Вычислительная биология и биоинформатика.
- Сюй Дж (2005). «Быстрая упаковка боковой цепи белка посредством разложения дерева». РЕКОМБ.