SAMPL Challenge - SAMPL Challenge

SAMPL (Статистическая оценка моделирования белков и лигандов) - это набор слепые вызовы направлены на продвижение вычислительных методов в качестве стандартных инструментов прогнозирования в рациональный дизайн лекарств.[1][2][3][4][5] Широкий спектр биологически значимых систем различного размера и уровня сложности, включая белки, хозяин Гость комплексы и небольшие молекулы, подобные лекарствам, были выбраны для тестирования новейших методов моделирования и силовых полей в SAMPL. Новые экспериментальные данные, такие как связывающая аффинность и энергия без гидратации, удерживаются от участников до крайнего срока подачи прогнозов, так что истинный предсказательная сила методов могут быть выявлены. Самая последняя задача SAMPL5 содержит две категории прогнозов: сродство связывания систем хозяин-гость и коэффициенты распределения молекул, подобных лекарству, между водой и циклогексаном.[6][7] С 2008 года серия испытаний SAMPL вызвала широкий интерес ученых, работающих в области компьютерный дизайн лекарств (CADD) по всему миру, и в результате было опубликовано более 100 публикаций, многие из которых высоко цитируются.[8][9][10] В число нынешних организаторов SAMPL входят профессор Джон Чодера из онкологического центра Memorial Sloan Kettering, профессор Майкл К. Гилсон из Калифорнийского университета в Сан-Диего, профессор Дэвид Мобли из Калифорнийского университета в Ирвине и профессор Майкл Ширтс из Университета Калифорнии. Колорадо, Боулдер.[11]

Значение проекта

Задача SAMPL направлена ​​на ускорение прогресса в разработке количественных и точных инструментов для открытия лекарств путем обеспечения проспективной проверки и строгих сравнений для вычислительных методологий и силовых полей. Методы компьютерного дизайна лекарств со временем значительно улучшились, наряду с быстрым ростом возможностей высокопроизводительных вычислений. Однако их применимость в фармацевтической промышленности все еще сильно ограничена из-за недостаточной точности. Из-за отсутствия крупномасштабных перспективных проверок методы, как правило, страдают от чрезмерного соответствия уже существующим экспериментальным данным. Чтобы преодолеть это, задачи SAMPL были организованы в виде слепых тестов: каждый раз, когда новые наборы данных тщательно разрабатываются и собираются из академических или промышленных исследовательских лабораторий, а измерения публикуются вскоре после крайнего срока представления прогнозов. Затем исследователи могут сравнить эти высококачественные перспективные экспериментальные данные с представленными оценками. Ключевой акцент делается на извлеченных уроках, что позволяет участникам будущих задач извлекать выгоду из улучшений моделирования, сделанных на основе предыдущих задач.

SAMPL исторически фокусировался на свойствах систем хозяин-гость и малых молекул, подобных лекарствам. Эти простые моделирующие системы требуют значительно меньше вычислительных ресурсов для моделирования по сравнению с белковыми системами и, таким образом, обеспечивают гораздо более быструю сходимость. Между тем, благодаря тщательному проектированию, эти модельные системы можно использовать для решения одной конкретной задачи или подмножества задач моделирования.[12] Несколько прошедших прошлых испытаний SAMPL "хозяин-гость", энергия без гидратации и журнал D выявили ограничения в обобщенных силовых полях[13][14] способствовал разработке моделей растворителей,[15][16] и подчеркнул важность правильного обращения с состояниями протонирования и солевыми эффектами.[17][18]

Участие

Регистрация и участие в тестах SAMPL бесплатны. Начиная с SAMPL7, данные об участии в испытаниях публиковались на SAMPL сайт,[19] так же хорошо как Страница GitHub для конкретной задачи. Инструкции, входные файлы и результаты затем предоставлялись через GitHub (более ранние задачи предоставляли контент в основном через D3R для SAMPL4-5 и другими способами для более ранних SAMPL). Участникам было разрешено отправить несколько прогнозов через веб-сайт D3R либо анонимно, либо с исследовательской аффилированностью. После задания SAMPL2 все участники были приглашены на семинары SAMPL и представить рукописи для описания своих результатов. После рецензирования итоговые статьи вместе с обзорными документами, в которых обобщены все представленные данные, были опубликованы в специальных выпусках Журнал компьютерного молекулярного дизайна.[20]

Финансирование

Проект SAMPL недавно был профинансирован Национальные институты здравоохранения США (грант GM124270-01A1) на период с сентября 2018 г. по август 2022 г., чтобы позволить проектировать будущие задачи SAMPL для продвижения вперед в тех областях, в которых они наиболее необходимы для моделирования.[9][10] Возглавляют эту работу Дэвид Л. Мобли (Калифорнийский университет в Ирвине) и соисследователи Джон Д. Чодера (MSKCC), Брюс К. Гибб (Тулейн) и Лайл Айзекс (Мэриленд). В настоящее время задачи и семинары проводятся в партнерстве с финансируемым NIH Ресурс данных о дизайне лекарств, но со временем это, вероятно, изменится, поскольку финансирование двух проектов не совмещено.

Финансирование также позволило расширить сферу применения SAMPL; через SAMPL6 его роль в первую очередь рассматривалась как сосредоточенная на физических свойствах, при этом D3R справлялся с проблемами белок-лиганд. Тем не менее, финансируемые усилия расширили его фокус, включив в него системы, которые будут способствовать улучшениям в моделировании, включая потенциально подходящие системы белок-лиганд. Это по-прежнему отличается от D3R, который основан на переданных наборах данных, представляющих фармацевтический интерес, тогда как задачи SAMPL специально разработаны для решения конкретных задач моделирования.

История

Предыдущие проблемы SAMPL

Первое упражнение SAMPL, SAMPL0 (2008 г.)[21] сосредоточены на предсказаниях свободных энергий сольватации 17 малых молекул. Исследовательская группа в Стэндфордский Университет и ученые Программное обеспечение OpenEye Scientific провели расчеты. Несмотря на неформальный формат, SAMPL0 заложил основу для следующих задач SAMPL.

SAMPL1 (2009 г.)[22] и проблемы SAMPL2 (2010)[1] были организованы OpenEye и продолжали фокусироваться на предсказании энергии свободной от сольватации малых молекул, подобных лекарствам. Были также предприняты попытки предсказать аффинность связывания, позы связывания и соотношения таутомеров. Обе задачи привлекли значительное участие ученых-вычислителей и исследователей из академических кругов и промышленности.

SAMPL3 и SAMPL4

Слепые наборы данных для аффинности связывания хост-гость были впервые представлены в SAMPL3 (2011-2012),[3] наряду с энергиями свободной сольватации для малых молекул и данными о сродстве связывания для 500 фрагментарных ингибиторов тирозина. Все три молекулы хозяина были из кукурбитурил семья. Задача SAMPL3 получила 103 заявки от 23 исследовательских групп со всего мира.[2]

В отличие от трех предыдущих мероприятий SAMPL, упражнение SAMPL4 (2013-2014 гг.)[4][5] координировалась академическими исследователями при материально-технической поддержке OpenEye. Наборы данных в SAMPL4 состояли из сродства связывания для систем хост-гость и Ингибиторы интегразы ВИЧ, а также свободные от гидратации энергии малых молекул. Молекулы-хозяева включали кукурбит [7] урил (CB7) и окта-кислота. В испытании по гидратации SAMPL4 участвовало 49 заявок от 19 групп. По сравнению с SAMPL3 участие гостя-хозяина также значительно выросло. Семинар прошел в Стэнфордском университете в сентябре 2013 года.

SAMPL5

Проблемы белок-лиганд были отделены от SAMPL в SAMPL5 (2015-2016).[6][7] и были распространены как новые Основные проблемы ресурса данных о дизайне лекарств (D3R).[23] SAMPL5 позволил участникам сделать предсказания аффинности связывания трех наборов систем хозяин-гость: ациклического производного CB7 и двух хозяев из семейства октановых кислот. Участникам также было предложено представить прогнозы энтальпий связывания. Был протестирован широкий спектр вычислительных методов, в том числе теория функционала плотности (ДПФ), молекулярная динамика, стыковка, и метадинамика. В коэффициент распределения предсказания были представлены впервые, получив в общей сложности 76 представлений от 18 исследовательских групп или ученых для набора из 53 малых молекул. Семинар прошел в марте 2016 г. Калифорнийский университет в Сан-Диего в рамках мастерской D3R. Самые эффективные методы в задаче «хозяин-гость» дали обнадеживающие, но несовершенные корреляции с экспериментальными данными, сопровождаемые большими систематическими сдвигами по сравнению с экспериментом.[24][25]

SAMPL6

Тестовые системы SAMPL6 включают кукурбит [8] урил, окта-кислоту, тетраэндо-метилокта-кислоту и ряд небольших молекул, подобных фрагментам. Задачи хост-гость, конформационная выборка и предсказание pKa SAMPL6 теперь закрыты. Семинар SAMPL6 проводился совместно с семинаром D3R 22 и 23 февраля 2018 года в Институте океанографии Скриппса, Ла-Хойя, Калифорния. (https://drugdesigndata.org//about/d3r-2018-workshop), и недавний SAMPL специальный выпуск из Журнал компьютерного молекулярного дизайна сообщил о многих результатах. Задача SAMPL6 Part II была сосредоточена на небольшом коэффициент распределения октанол-вода предсказания, за которым последовал виртуальный семинар 16 мая 2019 г. и совместный семинар D3R / SAMPL в Сан-Диего 22-23 августа 2019 г., непосредственно перед Национальным собранием ACS в Сан-Диего. О результатах планируется сообщить в специальном выпуске или специальном разделе JCAMD. Входные данные SAMPL6 и (по мере выполнения компонентов задачи результаты) доступны через Репозиторий SAMPL6 GitHub.

SAMPL7

SAMPL7 снова включал в себя проблемы хост-гость и проблему физического имущества. Также была включена проверка связывания белок-лиганд на фрагментах PHIPA. Связывание хозяин-гость сфокусировано на связывании нескольких небольших молекул с окта-кислотой и экзо-окта-кислотой; связывание двух соединений с рядом производных циклодекстрина; и связывание серии небольших молекул с «гостем» в виде зажима, известным как TrimerTrip. Состоялся виртуальный семинар SAMPL7 и доступно онлайн. Проблема физических свойств SAMPL7 в настоящее время продолжается. Планы проведения личного семинара EuroSAMPL осенью 2020 года были сорваны из-за COVID-19, и семинар проводится виртуально. Входные данные SAMPL7 и результаты (по мере завершения компонентов задачи) доступны через Репозиторий SAMPL6 GitHub.

SAMPL8

Первая фаза SAMPL8 сосредоточена на прогнозировании связывания хозяина и гостя наркотиков, вызывающих злоупотребление, с CB8, как подробно описано в Репозиторий SAMPL8 GitHub. Остальные компоненты SAMPL8 все еще разрабатываются.

SAMPL: специальные вопросы

Будущие вызовы

SAMPL планирует и дальше сосредоточиться на прогнозировании физических свойств, включая значения logP и logD, прогнозирование pKa, связывание хозяина и гостя и другие свойства, а также расширение для включения компонента белок-лиганд.[9] Планируется, что некоторые данные будут собирать непосредственно соисследователи SAMPL (Чодера, Гибб и Айзекс), но также предлагаются отраслевые партнерства и стажировки.[9]

Смотрите также

Рекомендации

  1. ^ а б Geballe, Matthew T .; Скиллман, А. Джеффри; Николлс, Энтони; Гатри, Дж. Питер; Тейлор, Питер Дж. (09.05.2010). «Задача слепого прогнозирования SAMPL2: введение и обзор». Журнал компьютерного молекулярного дизайна. 24 (4): 259–279. Дои:10.1007 / s10822-010-9350-8. ISSN  0920-654X. PMID  20455007.
  2. ^ а б Скиллман, А. Джеффри (24 мая 2012 г.). «SAMPL3: слепое предсказание аффинности связывания хозяина и гостя, энергии свободной гидратации и ингибиторов трипсина». Журнал компьютерного молекулярного дизайна. 26 (5): 473–474. Дои:10.1007 / s10822-012-9580-z. ISSN  0920-654X. PMID  22622621.
  3. ^ а б Муддана, Хари С .; Варнадо, К. Даниэль; Bielawski, Christopher W .; Urbach, Adam R .; Айзекс, Лайл; Geballe, Matthew T .; Гилсон, Майкл К. (25 февраля 2012 г.). "Слепое предсказание сродства связывания хоста и гостя: новая проблема SAMPL3". Журнал компьютерного молекулярного дизайна. 26 (5): 475–487. Дои:10.1007 / s10822-012-9554-1. ISSN  0920-654X. ЧВК  3383923. PMID  22366955.
  4. ^ а б Муддана, Хари С .; Фенли, Эндрю Т .; Мобли, Дэвид Л .; Гилсон, Майкл К. (2014-03-06). "Задача слепого прогнозирования" хост-гость SAMPL4: обзор ". Журнал компьютерного молекулярного дизайна. 28 (4): 305–317. Дои:10.1007 / s10822-014-9735-1. ISSN  0920-654X. ЧВК  4053502. PMID  24599514.
  5. ^ а б Мобли, Дэвид Л .; Wymer, Karisa L .; Lim, Nathan M .; Гатри, Дж. Питер (11 марта 2014 г.). «Слепой прогноз энергий, свободных от сольватации, на основе задачи SAMPL4». Журнал компьютерного молекулярного дизайна. 28 (3): 135–150. Дои:10.1007 / s10822-014-9718-2. ISSN  0920-654X. ЧВК  4006301. PMID  24615156.
  6. ^ а б Инь, Цзянь; Henriksen, Niel M .; Slochower, Дэвид Р .; Рубашки, Майкл Р .; Чиу, Майкл В .; Мобли, Дэвид Л .; Гилсон, Майкл К. (22 сентября 2016 г.). «Обзор задачи« хост – гость »SAMPL5: у нас все лучше?». Журнал компьютерного молекулярного дизайна. 31 (1): 1–19. Дои:10.1007 / s10822-016-9974-4. ISSN  0920-654X. ЧВК  5241188. PMID  27658802.
  7. ^ а б Bannan, Caitlin C .; Берли, Калистын H .; Чиу, Майкл; Рубашки, Майкл Р .; Гилсон, Майкл К .; Мобли, Дэвид Л. (27 сентября 2016 г.). «Слепой прогноз коэффициентов распределения циклогексан – вода с помощью задачи SAMPL5». Журнал компьютерного молекулярного дизайна. 30 (11): 927–944. Дои:10.1007 / s10822-016-9954-8. ISSN  0920-654X. ЧВК  5209301. PMID  27677750.
  8. ^ L, Мобли, Дэвид; Д, Чодера, Джон; К., Гилсон, Майкл (21.06.2017). «Результаты обзора« Дорожная карта »2017 г., проведенного сообществом« Статистическая оценка моделирования белков и лигандов »(SAMPL)». Стипендия ES.
  9. ^ а б c d Мобли, Дэвид Л .; Ходера, Джон Д .; Айзекс, Лайл; Гибб, Брюс С. (2016). «Продвижение прогнозного моделирования посредством целенаправленной разработки модельных систем для стимулирования новых инноваций в моделировании». Зенодо. Дои:10.5281 / zenodo.163963.
  10. ^ а б Мобли, Дэвид Л. (2016-10-05). «Продвижение прогнозного моделирования посредством целенаправленной разработки модельных систем для стимулирования новых инноваций в моделировании». Электронная стипендия.
  11. ^ "D3R | SAMPL".
  12. ^ Мобли, Дэвид Л .; Гилсон, Майкл К. (8 декабря 2016 г.). «Прогнозирование связывания свободных энергий: границы и ориентиры». bioRxiv  10.1101/074625.
  13. ^ Муддана, Хари С .; Гилсон, Майкл К. (25 января 2012 г.). "Прогнозирование сродства связывания хоста и гостя SAMPL3: оценка точности обобщенных силовых полей". Журнал компьютерного молекулярного дизайна. 26 (5): 517–525. Дои:10.1007 / s10822-012-9544-3. ISSN  0920-654X. ЧВК  3383906. PMID  22274835.
  14. ^ Мобли, Дэвид Л .; Лю, Шауи; Cerutti, David S .; Свуп, Уильям С .; Райс, Джулия Э. (24 декабря 2011 г.). «Алхимическое предсказание энергий без гидратации для SAMPL». Журнал компьютерного молекулярного дизайна. 26 (5): 551–562. Дои:10.1007 / s10822-011-9528-8. ISSN  0920-654X. ЧВК  3583515. PMID  22198475.
  15. ^ Пал, Раджат Кумар; Хайдер, Камран; Каур, Дивья; Флинн, Уильям; Ся, Цзюньчао; Леви, Рональд М .; Таран, Татьяна; Викстрем, Лорен; Курцман, Том; Галликкио, Эмилио (30.09.2016). «Комбинированная обработка гидратации и динамических эффектов для моделирования термодинамики связывания хозяина и гостя: слепая задача SAMPL5». Журнал компьютерного молекулярного дизайна. 31 (1): 29–44. Дои:10.1007 / s10822-016-9956-6. ISSN  0920-654X. ЧВК  5477994. PMID  27696239.
  16. ^ Брини, Эмилиано; Paranahewage, S. Shanaka; Феннелл, Кристофер Дж .; Дилл, Кен А. (2016-09-08). «Адаптация полуявной сольватационной модели сборки для оценки разделения воды и циклогексана с помощью молекул SAMPL5». Журнал компьютерного молекулярного дизайна. 30 (11): 1067–1077. Дои:10.1007 / s10822-016-9961-9. ISSN  0920-654X. ЧВК  5261860. PMID  27632227.
  17. ^ Конечно, Ребекка. Энтони, Йенс; Гримме, Стефан (27 марта 2014 г.). «Слепое предсказание аффинностей связывания для заряженных супрамолекулярных систем хозяин – гость: достижения и недостатки DFT-D3». Журнал физической химии B. 118 (12): 3431–3440. Дои:10.1021 / jp411616b. ISSN  1520-6106. PMID  24588346.
  18. ^ Кламт, Андреас; Экерт, Франк; Рейниш, Йенс; Вичманн, Карин (26.07.2016). «Прогнозирование коэффициентов распределения циклогексан-вода с помощью COSMO-RS по набору данных SAMPL5». Журнал компьютерного молекулярного дизайна. 30 (11): 959–967. Дои:10.1007 / s10822-016-9927-y. ISSN  0920-654X. PMID  27460058.
  19. ^ "SAMPL | Вызовы". samplchallenges.github.io. Получено 2020-07-03.
  20. ^ "Журнал компьютерного молекулярного дизайна - Все тома и выпуска - Springer". link.springer.com. Получено 2017-01-12.
  21. ^ Николлс, Энтони; Мобли, Дэвид Л .; Гатри, Дж. Питер; Ходера, Джон Д .; Бейли, Кристофер I .; Купер, Мэтью Д.; Панде, Виджай С. (01.02.2008). "Предсказание свободной энергии сольватации малых молекул: неформальный слепой тест для вычислительной химии". Журнал медицинской химии. 51 (4): 769–779. Дои:10.1021 / jm070549 +. ISSN  0022-2623. PMID  18215013.
  22. ^ Гатри, Дж. Питер (2009-04-09). "Слепой вызов для свободных энергий вычислительных решений: введение и обзор". Журнал физической химии B. 113 (14): 4501–4507. Дои:10.1021 / jp806724u. ISSN  1520-6106. PMID  19338360.
  23. ^ Гатиака, Симон; Лю, Шуай; Чиу, Майкл; Ян, Хуанван; Стаки, Жанна А .; Канг, Ю На; Дельпропосто, Джим; Кубиш, Имбирь; Данбар, Джеймс Б. (30.09.2016). «Грандиозный вызов D3R 2015: оценка позы белок-лиганд и прогнозы сродства». Журнал компьютерного молекулярного дизайна. 30 (9): 651–668. Дои:10.1007 / s10822-016-9946-8. ISSN  0920-654X. ЧВК  5562487. PMID  27696240.
  24. ^ Инь, Цзянь; Henriksen, Niel M .; Slochower, Дэвид Р .; Гилсон, Майкл К. (2016-09-16). «Задача SAMPL5« хозяин – гость »: вычисление свободных энергий и энтальпий связывания на основе явных симуляций растворителя методом присоединения-вытягивания-освобождения (APR)». Журнал компьютерного молекулярного дизайна. 31 (1): 133–145. Дои:10.1007 / s10822-016-9970-8. ISSN  0920-654X. ЧВК  5241238. PMID  27638809.
  25. ^ Бозисио, Стефано; Mey, Antonia S.J.S .; Мишель, Жюльен (2016-08-08). «Слепые предсказания стандартных свободных энергий связывания хозяина и гостя в тесте SAMPL5». Журнал компьютерного молекулярного дизайна. 31 (1): 61–70. Дои:10.1007 / s10822-016-9933-0. ISSN  0920-654X. PMID  27503495.

внешняя ссылка