Функции подсчета очков для стыковки - Scoring functions for docking

Глоссарий стыковки
Рецептор или хозяин или замок
"Получение" молекула, чаще всего белок или другой биополимер.
Лиганд или гость или ключ
Комплементарная молекула-партнер, которая связывает к рецептору. Лиганды чаще всего маленькие молекулы но также может быть другой биополимер.
Стыковка
Компьютерное моделирование связывания лиганда-кандидата с рецептором.
Режим привязки
Ориентация лиганда относительно рецептора, а также конформация лиганда и рецептора, когда они связаны друг с другом.
Поза
Режим привязки кандидата.
Подсчет очков
Процесс оценки конкретной позы путем подсчета количества благоприятных межмолекулярные взаимодействия такие как водородные связи и гидрофобный контакты.
Рейтинг
Процесс определения того, какие лиганды с наибольшей вероятностью будут благоприятно взаимодействовать с конкретным рецептором, на основе предсказанных свободная энергия привязки.
Оценка стыковки (DA)
Процедура количественной оценки прогностической способности протокола стыковки.
редактировать

В областях вычислительная химия и молекулярное моделирование, скоринговые функции находятся математические функции используется для приблизительного прогнозирования привязка близость между двумя молекулами после того, как они были состыкованный. Чаще всего одна из молекул представляет собой небольшое органическое соединение например, препарат, средство, медикамент а второй - биологическая мишень лекарства, такая как белок рецептор.[1] Также были разработаны оценочные функции для прогнозирования силы межмолекулярный взаимодействия между двумя белками[2] или между белком и ДНК.[3]

Полезность

Функции оценки широко используются в открытие лекарств и другие молекулярное моделирование Приложения. К ним относятся:[4]

  • Виртуальный просмотр из малая молекула базы данных кандидатов на лиганды для идентификации новых малых молекул, которые связываются с интересующей белковой мишенью и, следовательно, являются полезными отправными точками для открытие лекарств[5]
  • De novo дизайн (разработка «с нуля») новых небольших молекул, которые связываются с белковой мишенью.[6]
  • Оптимизация лида просмотров хитов для оптимизации их близости и селективности[7]

Потенциально более надежной, но гораздо более сложной альтернативой скоринговым функциям являются возмущение свободной энергии расчеты.[8]

Предпосылки

Функции подсчета обычно параметризуются (или обучаются) на основе набора данных, состоящего из экспериментально определенных аффинностей связывания между молекулярными видами, аналогичными видам, которые нужно предсказать.

Для используемых в настоящее время методов прогнозирования сродства лиганды для белков сначала необходимо знать или прогнозировать следующее:

Приведенная выше информация дает трехмерную структуру комплекса. На основе этой структуры оценочная функция может затем оценить силу ассоциации между двумя молекулами в комплексе с использованием одного из методов, описанных ниже. Наконец, сама функция подсчета баллов может использоваться для помощи в прогнозировании как режима связывания, так и активной конформации небольшой молекулы в комплексе, или, в качестве альтернативы, в ходе стыковки можно использовать более простую и более быструю в вычислительном отношении функцию.

Классы

Существует четыре основных класса функций подсчета очков:[9][10][11]

  • Силовое поле - сродство оценивается путем суммирования силы межмолекулярных ван дер Ваальс и электростатический взаимодействия между всеми атомами двух молекул в комплексе с использованием силовое поле. Внутримолекулярные энергии (также называемые энергия деформации ) двух связывающих партнеров также часто включаются. Наконец, поскольку связывание обычно происходит в присутствии воды, опустошение энергии лиганда и белка иногда учитываются с использованием неявная сольватация такие методы как GBSA или PBSA.[12]
  • Эмпирический - на основе подсчета количества различных типов взаимодействий между двумя партнерами по связыванию.[6] Подсчет может быть основан на количестве атомов лиганда и рецептора, находящихся в контакте друг с другом, или путем расчета изменения в доступная для растворителя площадь поверхности (ΔSASA) в комплексе по сравнению с не входящим в комплекс лигандом и белком. Коэффициенты оценочной функции обычно подбираются с использованием множественная линейная регрессия методы. Эти условия взаимодействия функции могут включать, например:
    • гидрофобный - гидрофобные контакты (благоприятные),
    • гидрофобный - гидрофильный контакты (неблагоприятные) (учитывает неудовлетворенные водородные связи, которые являются важным энтальпийным вкладом в связывание.[13] Одна потерянная водородная связь может составлять 1-2 порядка величины сродства связывания.[14]),
    • количество водородные связи (благоприятный вклад в сродство, особенно если он защищен от растворителя, если растворитель не влияет),
    • количество вращающихся связей, иммобилизованных в комплексообразовании (неблагоприятный конформационная энтропия вклад).
  • Основанный на знаниях - на основе статистических наблюдений за межмолекулярными тесными контактами в больших трехмерных базах данных (таких как Кембриджская структурная база данных или Банк данных белков ), которые используются для получения статистический "потенциалы средней силы ". Этот метод основан на предположении, что тесные межмолекулярные взаимодействия между определенными типами атомов или функциональных групп, которые происходят чаще, чем можно было бы ожидать, исходя из случайного распределения, вероятно, будут энергетически выгодными и, следовательно, будут способствовать сродству связывания.[15]
  • Машинное обучение - В отличие от этих классических функций оценки, функции оценки машинного обучения характеризуются тем, что не предполагают заранее заданную функциональную форму для взаимосвязи между аффинностью связывания и структурными особенностями, описывающими комплекс белок-лиганд.[16] Таким образом, функциональная форма выводится непосредственно из данных. Было обнаружено, что функции оценки машинного обучения превосходят классические функции оценки при прогнозировании сродства связывания различных комплексов белок-лиганд.[17][18] Это также относится к целевым комплексам,[19][20] хотя преимущество зависит от цели и в основном зависит от объема доступных данных.[11][21] При надлежащей осторожности функции оценки машинного обучения выполняют, по крайней мере, так же хорошо, как и классические функции оценки в связанной задаче виртуального скрининга на основе структуры.[22][23][24][25][26][27] Эти обзоры предоставляют более широкий обзор функций машинного обучения для разработки лекарств на основе структуры.[11][28][29][30]

Первые три типа, силовое поле, эмпирические и основанные на знаниях, обычно называются классическими оценочными функциями и характеризуются тем, что их вклад в связывание линейно комбинируется. Из-за этого ограничения классические функции оценки не могут использовать большие объемы обучающих данных.[31]

Уточнение

Поскольку различные оценочные функции являются относительно коллинеарными, консенсусные оценочные функции не могут значительно повысить точность.[32] Это утверждение несколько противоречило преобладающему мнению в этой области, поскольку предыдущие исследования предполагали, что согласованная оценка полезна.[33]

Идеальная функция подсчета очков могла бы предсказать свободную энергию связывания между лигандом и его мишенью. Но на самом деле и вычислительные методы, и вычислительные ресурсы сдерживают эту цель. Поэтому чаще всего выбирают методы, минимизирующие количество ложноположительных и ложноотрицательных лигандов. В случаях, когда доступен экспериментальный обучающий набор данных констант и структур связывания, был разработан простой метод для уточнения функции оценки, используемой в молекулярном стыковке.[34]

Рекомендации

  1. ^ Джайн А.Н. (октябрь 2006 г.). «Оценочные функции для стыковки белок-лиганд». Современная наука о белках и пептидах. 7 (5): 407–20. Дои:10.2174/138920306778559395. PMID  17073693.
  2. ^ Lensink MF, Méndez R, Wodak SJ (декабрь 2007 г.). «Докинг и оценка белковых комплексов: CAPRI, 3-е издание». Белки. 69 (4): 704–18. Дои:10.1002 / prot.21804. PMID  17918726.
  3. ^ Робертсон Т.А., Варани Г. (февраль 2007 г.). «Всеатомная, зависимая от расстояния функция подсчета очков для предсказания взаимодействий белок-ДНК по структуре». Белки. 66 (2): 359–74. Дои:10.1002 / prot.21162. PMID  17078093.
  4. ^ Раджамани Р., Хороший AC (май 2007 г.). «Ранжирование позиций в поиске и оптимизации потенциальных клиентов на основе структуры: современные тенденции в развитии скоринговых функций». Текущее мнение в области открытия и разработки лекарств. 10 (3): 308–15. PMID  17554857.
  5. ^ Зейферт М.Х., Краус Дж., Крамер Б. (май 2007 г.). «Виртуальный высокопроизводительный скрининг молекулярных баз данных». Текущее мнение в области открытия и разработки лекарств. 10 (3): 298–307. PMID  17554856.
  6. ^ а б Бём Х. Дж. (Июль 1998 г.). «Прогнозирование констант связывания белковых лигандов: быстрый метод определения приоритета совпадений, полученных с помощью программ de novo design или поиска в трехмерных базах данных». Журнал компьютерного молекулярного дизайна. 12 (4): 309–23. Bibcode:1998JCAMD..12..309B. Дои:10.1023 / А: 1007999920146. PMID  9777490. S2CID  7474036.
  7. ^ Джозеф-Маккарти Д., Бабер Дж. К., Фейфант Э, Томпсон, округ Колумбия, Хамблет С. (май 2007 г.). «Оптимизация свинца с помощью высокопроизводительного молекулярного стыковки». Текущее мнение в области открытия и разработки лекарств. 10 (3): 264–74. PMID  17554852.
  8. ^ Фолоппе Н., Хаббард Р. (2006). «К прогнозируемому дизайну лигандов с помощью вычислительных методов, основанных на свободной энергии?». Современная лекарственная химия. 13 (29): 3583–608. Дои:10.2174/092986706779026165. PMID  17168725.
  9. ^ Фену Л.А., Льюис Р.А., Хороший AC, Бодкин М., Эссекс Дж. У. (2007). «Глава 9: Функции подсчета очков: от свободной энергии привязки к обогащению в виртуальном просмотре». В Dhoti H, Leach AR (ред.). Открытие лекарств на основе структуры. Дордрехт: Спрингер. С. 223–246. ISBN  978-1-4020-4407-6.
  10. ^ Сотриффер С., Материя H (2011). «Глава 7.3: Классы функций подсчета очков». В Sotriffer C (ред.). Виртуальный просмотр: принципы, проблемы и практические рекомендации. 48. John Wiley & Sons, Inc. ISBN  978-3-527-63334-0.
  11. ^ а б c Айн Ку, Александрова А., Рёсслер Ф.Д., Баллестер П.Дж. (01.11.2015). «Функции машинного обучения для улучшения предсказания привязки на основе структуры и виртуального скрининга». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука. 5 (6): 405–424. Дои:10.1002 / wcms.1225. ЧВК  4832270. PMID  27110292.
  12. ^ Генхеден С., Райд Ю. (май 2015 г.). «Методы MM / PBSA и MM / GBSA для оценки аффинности связывания лиганда». Мнение эксперта об открытии лекарств. 10 (5): 449–61. Дои:10.1517/17460441.2015.1032936. ЧВК  4487606. PMID  25835573.
  13. ^ Шнайдер Н., Ланге Г., Хиндл С., Кляйн Р., Рэри М. (январь 2013 г.). «Последовательное описание водородной связи и энергии дегидратации в комплексах белок-лиганд: методы, лежащие в основе оценочной функции HYDE». Журнал компьютерного молекулярного дизайна. 27 (1): 15–29. Bibcode:2013JCAMD..27 ... 15S. Дои:10.1007 / s10822-012-9626-2. PMID  23269578. S2CID  1545277.
  14. ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (ноябрь 2003 г.). «Требования к специфическому связыванию фрагментов низкоаффинного ингибитора с доменом SH2 (pp60) Src идентичны требованиям для высокоаффинного связывания полноразмерных ингибиторов». Журнал медицинской химии. 46 (24): 5184–95. Дои:10.1021 / jm020970s. PMID  14613321.
  15. ^ Muegge I (октябрь 2006 г.). «Новый взгляд на оценку PMF». Журнал медицинской химии. 49 (20): 5895–902. Дои:10.1021 / jm050038s. PMID  17004705.
  16. ^ Баллестер П. Дж., Митчелл Дж. Б. (май 2010 г.). «Подход машинного обучения к предсказанию сродства связывания белок-лиганд с приложениями для молекулярного стыковки». Биоинформатика. 26 (9): 1169–75. Дои:10.1093 / биоинформатика / btq112. ЧВК  3524828. PMID  20236947.
  17. ^ Ли Х, Люнг К.С., Вонг М.Х., Баллестер П.Дж. (февраль 2015 г.). «Улучшение AutoDock Vina с помощью случайного леса: возрастающая точность предсказания привязки за счет эффективного использования больших наборов данных». Молекулярная информатика. 34 (2–3): 115–26. Дои:10.1002 / мин. 201400132. PMID  27490034.
  18. ^ Аштави Х.М., Махапатра Н.Р. (01.04.2015). «Сравнительная оценка точности прогнозирования обычных и машинных функций оценки для прогнозирования сродства связывания белок-лиганд». IEEE / ACM Transactions по вычислительной биологии и биоинформатике. 12 (2): 335–47. Дои:10.1109 / TCBB.2014.2351824. PMID  26357221.
  19. ^ Чжань В., Ли Д., Че Дж., Чжан Л., Ян Б., Ху И, Лю Т., Дун Х (март 2014 г.). «Интеграция показателей стыковки, профилей взаимодействия и молекулярных дескрипторов для повышения точности молекулярного стыковки: к открытию новых ингибиторов Akt1». Европейский журнал медицинской химии. 75: 11–20. Дои:10.1016 / j.ejmech.2014.01.019. PMID  24508830.
  20. ^ Киннингс С.Л., Лю Н., Тонг П.Дж., Джексон Р.М., Се Л., Борн П.Е. (февраль 2011 г.). «Основанный на машинном обучении метод улучшения функций подсчета очков и его применение для перепрофилирования лекарств». Журнал химической информации и моделирования. 51 (2): 408–19. Дои:10.1021 / ci100369f. ЧВК  3076728. PMID  21291174.
  21. ^ Ли Х, Сзе КХ, Лу Джи, Баллестер Пи Джей (2020-02-05). «Функции машинного обучения для оптимизации поиска лекарств на основе структуры». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука. 10 (5). Дои:10.1002 / wcms.1465.
  22. ^ Ли Л., Ван Б., Меруэ СО (сентябрь 2011 г.). «Поддержка векторной регрессии комплексов рецептор-лиганд для ранжирования и виртуального скрининга химических библиотек». Журнал химической информации и моделирования. 51 (9): 2132–8. Дои:10.1021 / ci200078f. ЧВК  3209528. PMID  21728360.
  23. ^ Даррант Дж. Д., Фридман А. Дж., Роджерс К. Э., Маккаммон Дж. А. (июль 2013 г.). «Сравнение функций оценки нейронных сетей и современного состояния: приложения с общей библиотечной проверкой». Журнал химической информации и моделирования. 53 (7): 1726–35. Дои:10.1021 / ci400042y. ЧВК  3735370. PMID  23734946.
  24. ^ Дин Б., Ван Дж, Ли Н, Ван В. (январь 2013 г.). «Характеристика связывания малых молекул. I. Точная идентификация сильных ингибиторов при виртуальном скрининге». Журнал химической информации и моделирования. 53 (1): 114–22. Дои:10.1021 / ci300508m. ЧВК  3584174. PMID  23259763.
  25. ^ Wójcikowski M, Ballester PJ, Siedlecki P (апрель 2017 г.). «Выполнение функций оценки машинного обучения в структурированном виртуальном скрининге». Научные отчеты. 7: 46710. Bibcode:2017НатСР ... 746710Вт. Дои:10.1038 / srep46710. ЧВК  5404222. PMID  28440302.
  26. ^ Рагоза М., Хочули Дж., Идробо Э., Сансери Дж., Коэс Д.Р. (апрель 2017 г.). «Оценка белков-лигандов с помощью сверточных нейронных сетей». Журнал химической информации и моделирования. 57 (4): 942–957. arXiv:1612.02751. Дои:10.1021 / acs.jcim.6b00740. ЧВК  5479431. PMID  28368587.
  27. ^ Ли Х, Пэн Дж., Люн Й, Люн К.С., Вонг М.Х., Лу Джи, Баллестер П.Дж. (март 2018 г.). «Влияние структуры белка и сходства последовательностей на точность функций машинного обучения для прогнозирования сродства связывания». Биомолекулы. 8 (1): 12. Дои:10.3390 / biom8010012. ЧВК  5871981. PMID  29538331.
  28. ^ Шен Ц, Дин Дж, Ван З, Цао Д, Дин Х, Хоу Т. (27.06.2019). «От машинного обучения к глубокому обучению: достижения в оценочных функциях для стыковки белок-лиганд». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука. 10. Дои:10.1002 / wcms.1429.
  29. ^ Ян Х, Ван И, Бирн Р., Шнайдер Дж., Ян С. (11.07.2019). «Концепции искусственного интеллекта для компьютерного открытия лекарств». Химические обзоры. 119 (18): 10520–10594. Дои:10.1021 / acs.chemrev.8b00728. PMID  31294972.
  30. ^ Ли Х, Сзе КХ, Лу Джи, Баллестер ПиДжей (2020-04-22). «Функции машинного обучения для виртуального скрининга на основе структуры». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука. Дои:10.1002 / wcms.1478.
  31. ^ Ли Х, Пэн Дж., Сидоров П., Люн И, Люн К.С., Вонг М.Х., Лу Джи, Баллестер П.Дж. (март 2019 г.). «Классические скоринговые функции для стыковки не могут использовать большие объемы структурных данных и данных взаимодействия». Биоинформатика. Оксфорд, Англия. 35 (20): 3989–3995. Дои:10.1093 / биоинформатика / btz183. PMID  30873528.
  32. ^ Englebienne P, Moitessier N (июнь 2009 г.). «Связывание лигандов в гибкие и сольватированные макромолекулы. 4. Являются ли популярные функции подсчета точными для этого класса белков?». Журнал химической информации и моделирования. 49 (6): 1568–80. Дои:10.1021 / ci8004308. PMID  19445499.
  33. ^ Ода А., Цучида К., Такакура Т., Ямаоцу Н., Хироно С. (2006). «Сравнение консенсусных стратегий оценки для оценки вычислительных моделей комплексов белок-лиганд». Журнал химической информации и моделирования. 46 (1): 380–91. Дои:10.1021 / ci050283k. PMID  16426072.
  34. ^ Hellgren M, Carlsson J, Ostberg LJ, Staab CA, Persson B, Höög JO (сентябрь 2010 г.). «Обогащение лигандов молекулярными докингами и последующая характеристика алкогольдегидрогеназы 3 человека». Клеточные и молекулярные науки о жизни. 67 (17): 3005–15. Дои:10.1007 / s00018-010-0370-2. PMID  20405162. S2CID  2391130.