Количественная структура - взаимосвязь деятельности - Quantitative structure–activity relationship

Количественная структура - взаимосвязь деятельности модели (QSAR модели) являются регресс или классификационные модели, используемые в химических и биологических науках и технике. Подобно другим регрессионным моделям, регрессионные модели QSAR связывают набор «предикторных» переменных (X) с эффективностью переменная ответа (Y), в то время как модели классификации QSAR связывают переменные-предикторы с категориальным значением переменной ответа.

В моделировании QSAR предикторы состоят из физико-химических свойств или теоретических молекулярных дескрипторов химических веществ; переменная ответа QSAR может быть биологическая активность химикатов. Модели QSAR сначала резюмируют предполагаемую взаимосвязь между химические структуры и биологическая активность в наборе данных химикатов. Во-вторых, модели QSAR предсказывать деятельность новых химикатов.[1][2]

Связанные термины включают количественная структура - отношения собственности (QSPR), когда химическое свойство моделируется как переменная отклика.[3][4]«Различные свойства или поведение химических молекул были исследованы в области QSPR. Некоторыми примерами являются количественные отношения структура-реакционная способность (QSRR), количественные отношения структура-хроматография (QSCR) и количественные отношения структура-токсичность (QSTR), количественная структура –Электрохимические отношения (QSER) и количественные отношения структура – ​​биоразлагаемость (QSBR) ».[5]

Например, биологическая активность может быть выражена количественно как концентрация вещества, необходимая для получения определенного биологического ответа. Кроме того, когда физико-химические свойства или структуры выражаются числами, между ними можно найти математическое соотношение или количественное соотношение структура-активность. Математическое выражение, если оно тщательно проверено[6][7][8] затем можно использовать для прогнозирования смоделированного отклика других химических структур.[9]

QSAR имеет вид математическая модель:

  • Активность = ж(физико-химические свойства и / или структурные свойства) + погрешность

Ошибка включает ошибка модели (предвзятость ) и изменчивость наблюдений, то есть изменчивость наблюдений даже на правильной модели.

Основные этапы исследований QSAR

Основные этапы QSAR / QSPR, включая (i) выбор набора данных и извлечение структурных / эмпирических дескрипторов (ii) выбор переменных, (iii) построение модели и (iv) валидационную оценку ».[5]

SAR и парадокс SAR

Основное предположение для всех основанных на молекулах гипотезы заключается в том, что подобные молекулы обладают сходной активностью. Этот принцип также называется взаимосвязью структура – ​​деятельность (SAR ). Поэтому основная проблема заключается в том, как определить маленький различие на молекулярном уровне, поскольку каждый вид деятельности, например реакция способность, биотрансформация способность, растворимость, целевая активность и т. д. могут зависеть от другого различия. Примеры приведены в биоизостеризм отзывы от Patanie / LaVoie[10] и Браун.[11]

В общем, больше интересно найти сильные тенденции. Созданный гипотезы обычно полагаются на конечный количество химикатов, поэтому следует соблюдать осторожность, чтобы избежать переоснащение: генерация гипотез, которые очень точно соответствуют обучающим данным, но плохо работают при применении к новым данным.

В SAR парадокс относится к тому факту, что не все аналогичные молекулы имеют одинаковую активность.

Типы

На основе фрагментов (групповой вклад)

Аналогичным образом, «коэффициент распределения» - измерение дифференциальной растворимости и сам по себе компонент прогнозов QSAR - может быть предсказан либо атомарными методами (известными как «XLogP» или «ALogP»), либо с помощью химические фрагментарные методы (известный как «CLogP» и другие варианты). Было показано, что logP соединения можно определить по сумме его фрагментов; Методы, основанные на фрагментах, обычно считаются лучшими предсказателями, чем методы, основанные на атомах.[12] Фрагментарные значения были определены статистически на основе эмпирических данных для известных значений logP. Этот метод дает смешанные результаты и, как правило, не считается, что он имеет точность более ± 0,1 единицы.[13]

QSAR на основе группы или фрагмента также известен как GQSAR.[14] GQSAR обеспечивает гибкость для изучения различных молекулярных фрагментов, представляющих интерес, в зависимости от вариации биологической реакции. Молекулярные фрагменты могут быть заместителями в различных сайтах замещения в родственном наборе молекул или могут основываться на заранее определенных химических правилах в случае неконгенерических наборов. GQSAR также рассматривает перекрестные дескрипторы фрагментов, которые могут быть полезны при идентификации ключевых взаимодействий фрагментов при определении вариации активности.[14]Свинцовые открытия с использованием фрагномики - это новая парадигма. В этом контексте FB-QSAR оказывается многообещающей стратегией для дизайна библиотеки фрагментов и в попытках идентификации от фрагмента к ведущему.[15]

Разработан продвинутый подход к QSAR на основе фрагментов или групп, основанный на концепции сходства фармакофора.[16] Этот метод, основанный на подобии фармакофора, QSAR (PS-QSAR) использует топологические фармакофорные дескрипторы для разработки моделей QSAR. Этот прогноз активности может способствовать вкладу определенных характеристик фармакофоров, кодируемых соответствующими фрагментами, в улучшение активности и / или вредные эффекты.[16]

3D-QSAR

Акроним 3D-QSAR или же 3-D QSAR относится к применению силовое поле расчеты, требующие трехмерных структур данного набора малых молекул с известной активностью (обучающий набор). Обучающий набор должен быть наложен (выровнен) экспериментальными данными (например, на основе лиганд-белок кристаллография ) или молекула наложение программного обеспечения. Он использует вычисленные потенциалы, например то Потенциал Леннарда-Джонса, а не экспериментальные константы, и касается всей молекулы, а не одного заместителя. Первый 3-D QSAR был назван Крамером и соавторами сравнительным анализом молекулярного поля (CoMFA). Он исследовал стерические поля (форму молекулы) и электростатические поля.[17] которые были соотнесены с помощью частичная регрессия методом наименьших квадратов (PLS).

Созданное пространство данных затем обычно сокращается следующим образом: извлечение признаков (смотрите также уменьшение размерности ). Следующий метод обучения может быть любым из уже упомянутых машинное обучение методы, например опорные векторные машины.[18] Альтернативный подход использует многократное обучение путем кодирования молекул как наборов экземпляров данных, каждый из которых представляет возможную молекулярную конформацию. Метка или ответ присваивается каждому набору, соответствующему активности молекулы, которая, как предполагается, определяется по крайней мере одним экземпляром в наборе (то есть некоторой конформацией молекулы).[19]

18 июня 2011 г. патент на сравнительный анализ молекулярного поля (CoMFA) снял любые ограничения на использование технологий GRID и частичных наименьших квадратов (PLS).[нужна цитата ]

На основе химического дескриптора

В этом подходе дескрипторы, количественно оценивающие различные электронные, геометрические или стерические свойства молекулы, вычисляются и используются для разработки QSAR.[20] Этот подход отличается от подхода фрагментов (или группового вклада) в том, что дескрипторы вычисляются для системы в целом, а не на основе свойств отдельных фрагментов. Этот подход отличается от подхода 3D-QSAR тем, что дескрипторы вычисляются из скалярных величин (например, энергии, геометрические параметры), а не из трехмерных полей.

Примером этого подхода являются QSAR, разработанные для полимеризации олефинов полусэндвич-компаунды.[21][22]

Моделирование

В литературе часто можно найти, что химики отдают предпочтение частичные наименьшие квадраты (PLS) методы,[нужна цитата ] поскольку он применяет извлечение признаков и индукция за один шаг.

Подход интеллектуального анализа данных

Компьютерные модели SAR обычно рассчитывают относительно большое количество функций. Поскольку им не хватает возможности структурной интерпретации, этапы предварительной обработки сталкиваются с выбор функции проблема (т.е. какие структурные особенности следует интерпретировать для определения взаимосвязи структура-деятельность). Выбор характеристик может быть осуществлен путем визуального осмотра (качественный отбор человеком); путем интеллектуального анализа данных; или молекулярным майнингом.

Типичный сбор данных основанное на прогнозировании использование, например опорные векторные машины, деревья решений, искусственные нейронные сети за побуждение модель прогнозирующего обучения.

Молекулярная добыча подходов, частный случай структурированный анализ данных подходы, применять прогнозирование на основе матрицы сходства или автоматическую схему фрагментации на молекулярные субструктуры. Кроме того, существуют также подходы, использующие максимальный общий подграф поиски или ядра графа.[23][24]

QSAR протокол

Анализ согласованных молекулярных пар

Обычно модели QSAR выводятся из нелинейных машинное обучение рассматривается как «черный ящик», которым не могут руководствоваться медицинские химики. В последнее время появилась относительно новая концепция согласованный молекулярный парный анализ[25] или MMPA, управляемый прогнозированием, который сочетается с моделью QSAR, чтобы идентифицировать провалы активности.[26]

Оценка качества моделей QSAR

QSAR-моделирование позволяет прогнозировать модели получено из применения статистических инструментов, коррелирующих биологическая активность (включая желаемый терапевтический эффект и нежелательные побочные эффекты) или физико-химические свойства в моделях химических веществ QSPR (лекарства / токсиканты / загрязнители окружающей среды) с дескрипторами, репрезентативными для молекулярная структура или же характеристики. QSAR применяются во многих дисциплинах, например: оценка рисков, прогноз токсичности и нормативные решения[27] в добавление к открытие лекарств и оптимизация лидов.[28] Получение качественной модели QSAR зависит от многих факторов, таких как качество входных данных, выбор дескрипторов и статистических методов для моделирования и проверки. Любое QSAR-моделирование должно в конечном итоге привести к появлению статистически надежных и прогнозных моделей, способных делать точные и надежные прогнозы смоделированной реакции новых соединений.

Для проверки моделей QSAR обычно используются различные стратегии:[29]

  1. внутренняя проверка или перекрестная проверка (фактически, при извлечении данных перекрестная проверка является мерой надежности модели, чем более надежна модель (выше q2), тем меньше извлечение данных нарушает исходную модель);
  2. внешняя проверка путем разделения доступного набора данных на обучающий набор для разработки модели и набор прогнозирования для проверки прогнозируемости модели;
  3. слепая внешняя проверка путем применения модели к новым внешним данным и
  4. рандомизация данных или Y-скремблирование для проверки отсутствия случайной корреляции между ответом и дескрипторами моделирования.

Успех любой модели QSAR зависит от точности входных данных, выбора подходящих дескрипторов и статистических инструментов и, что наиболее важно, валидации разработанной модели. Валидация - это процесс, с помощью которого устанавливаются надежность и актуальность процедуры для конкретной цели; для моделей QSAR проверка должна быть в основном для надежности, прогнозирования и область применимости (AD) моделей.[6][7][8][30]

Некоторые методики проверки могут быть проблематичными. Например, оставить одноразовый перекрестная проверка обычно приводит к переоценке прогнозирующей способности. Даже при внешней проверке трудно определить, использовались ли выбор обучающих и тестовых наборов для максимизации прогностической способности публикуемой модели.

Различные аспекты валидации моделей QSAR, требующие внимания, включают методы выбора соединений обучающей выборки,[31] установка размера обучающего набора[32] и влияние выбора переменных[33] для моделей обучающего набора для определения качества прогноза. Также важна разработка новых параметров валидации для оценки качества моделей QSAR.[8][34][35]

Заявление

Химическая

Одним из первых исторических приложений QSAR было предсказание точки кипения.[36]

Например, хорошо известно, что в пределах определенного семья из химические соединения, особенно органическая химия, что есть сильные корреляции между структурой и наблюдаемыми свойствами. Простой пример - соотношение между количеством атомов углерода в алканы и их точки кипения. Наблюдается четкая тенденция увеличения температуры кипения с увеличением количества атомов углерода, и это служит средством для прогнозирования точек кипения высшие алканы.

Еще очень интересным приложением является Уравнение Гаммета, Уравнение Тафта и предсказание pKa методы.[37]

Биологические

Биологическая активность молекул обычно измеряется в анализы установить уровень подавления определенных преобразование сигнала или же метаболические пути. Открытие наркотиков часто включает использование QSAR для определения химических структур, которые могут оказывать хорошее ингибирующее действие на определенные цели и иметь низкий токсичность (неспецифическая активность). Особый интерес представляет предсказание Коэффициент распределения бревно п, что является важным показателем для выявления "склонность к наркотикам " в соответствии с Правило пяти Липинского.

Хотя многие количественные анализы взаимосвязи структурной активности включают взаимодействия семейства молекул с фермент или же рецептор сайт связывания, QSAR также можно использовать для изучения взаимодействия между структурные области белков. Взаимодействие белок-белок можно количественно проанализировать на предмет структурных изменений, возникающих в результате сайт-направленный мутагенез.[38]

Это часть машинное обучение метод снижения риска парадокса SAR, особенно с учетом того, что доступен только ограниченный объем данных (см. также МВУЭ ). В целом все задачи QSAR можно разделить на кодирование[39] и учусь.[40]

Приложения

(Q) Модели SAR использовались для управление рисками. QSARS предлагаются регулирующими органами; в Евросоюз, QSAR предлагаются ДОСТИГАТЬ правила, где REACH сокращенно означает "Регистрация, оценка, разрешение и ограничение химических веществ". Нормативное применение методов QSAR включает: in silico токсикологическая оценка генотоксических примесей. [41] Обычно используемое программное обеспечение для оценки QSAR, такое как DEREK или MCASE, используется для определения генотоксичности примесей в соответствии с ICH M7.

Пространство химического дескриптора, чье выпуклый корпус генерируется определенным обучающим набором химических веществ, называется обучающим набором область применимости. Прогнозирование свойств новых химических веществ, которые находятся за пределами области применения. экстраполяция, и поэтому он менее надежен (в среднем), чем прогноз в области применимости. Оценка надежности прогнозов QSAR остается темой исследования.

Уравнения QSAR можно использовать для прогнозирования биологической активности новых молекул до их синтеза.

Примеры инструментов машинного обучения для моделирования QSAR включают:[42]

S.No.ИмяАлгоритмыВнешняя ссылка
1.рRF, SVM, наивный байесовский и ИНС"R: Проект R для статистических вычислений".
2.libSVMSVM«LIBSVM - библиотека для машин опорных векторов».
3.апельсинRF, SVM и наивный байесовский«Orange Data Mining».
4.RapidMinerSVM, RF, Naïve Bayes, DT, ANN и k-NN"RapidMiner | Платформа прогнозной аналитики с открытым исходным кодом № 1".
5.WekaRF, SVM и наивный Байес«Weka 3 - интеллектуальный анализ данных с помощью программного обеспечения для машинного обучения с открытым исходным кодом на Java».
6.KnimeDT, наивный байесовский метод и SVM«KNIME | Открытость для инноваций».
7.AZOrange[43]RT, SVM, ANN и RF"AZCompTox / AZOrange: дополнения AstraZeneca к Orange". GitHub. 2018-09-19.
8.ТанаграSVM, RF, наивный Байес и DT«TANAGRA - бесплатное программное обеспечение для поиска и анализа данных для обучения и исследований».
9.Елкиk-NN«Инфраструктура интеллектуального анализа данных ELKI». Архивировано из оригинал в 2016-11-19.
10.МОЛОТОК"Домашняя страница МОЛЛЕТА".
11.MOA«MOA Massive Online Analysis | Аналитика в реальном времени для потоков данных». Архивировано из оригинал на 19.06.2017.
12.Deep ChemЛогистическая регрессия, Наивный Байес, РФ, ИНС и другие«ДипХим». deepchem.io. Получено 20 октября 2017.


Смотрите также

Рекомендации

  1. ^ Рой К., Кар С., Дас Р. Н. (2015). «Глава 1.2: Что такое QSAR? Определения и формулизм». Праймеры по моделированию QSAR / QSPR: фундаментальные концепции. Нью-Йорк: Springer-Verlag Inc., стр. 2–6. ISBN  978-3-319-17281-1.
  2. ^ Гасеми, Перес-Санчес; Мери, Перес-Гарридо (2018). «Нейронные сети и алгоритмы глубокого обучения, используемые в исследованиях QSAR: достоинства и недостатки». Открытие наркотиков сегодня. 23 (10): 1784–1790. Дои:10.1016 / j.drudis.2018.06.016. PMID  29936244.
  3. ^ Нантасенамат С, Исаранкура-На-Аюдхья С, Наэнна Т., Прачайяситтикул V (2009). «Практический обзор количественной взаимосвязи структура-деятельность». Excli J. 8: 74–88. Дои:10.17877 / DE290R-690.
  4. ^ Nantasenamat C, Isarankura-Na-Ayudhya C, Prachayasittikul V (июль 2010 г.). «Достижения вычислительных методов для прогнозирования биологической активности соединений». Мнение эксперта об открытии лекарств. 5 (7): 633–54. Дои:10.1517/17460441.2010.492827. PMID  22823204. S2CID  17622541.
  5. ^ а б Yousefinejad S, Hemmateenejad B (2015). «Инструменты хемометрии в исследованиях QSAR / QSPR: историческая перспектива». Хемометрия и интеллектуальные лабораторные системы. 149, Часть B: 177–204. Дои:10.1016 / j.chemolab.2015.06.016.
  6. ^ а б Тропша А, Gramatica P, Gombar VJ (2003). «Важность серьезности: проверка является абсолютно необходимым условием успешного применения и интерпретации моделей QSPR». QSAR Comb. Наука. 22: 69–77. Дои:10.1002 / qsar.200390007.
  7. ^ а б Gramatica P (2007). «Принципы валидации моделей QSAR: внутренняя и внешняя». QSAR Comb. Наука. 26 (5): 694–701. Дои:10.1002 / qsar.200610151. HDL:11383/1668881.
  8. ^ а б c Chirico N, Gramatica P (август 2012 г.). «Реальная внешняя предсказуемость моделей QSAR. Часть 2. Новые взаимосопоставимые пороги для различных критериев валидации и необходимость проверки диаграммы разброса». Журнал химической информации и моделирования. 52 (8): 2044–58. Дои:10.1021 / ci300084j. PMID  22721530.
  9. ^ Тропша Александр (2010). «Лучшие практики для разработки, проверки и эксплуатации модели QSAR». Молекулярная информатика. 29 (6–7): 476–488. Дои:10.1002 / мин.201000061. ISSN  1868-1743. PMID  27463326. S2CID  23564249.
  10. ^ Патани Г.А., ЛаВуа Е.Дж. (декабрь 1996 г.). «Биоизостеризм: рациональный подход к разработке лекарств». Химические обзоры. 96 (8): 3147–3176. Дои:10.1021 / cr950066q. PMID  11848856.
  11. ^ Браун N (2012). Биоизостеры в медицинской химии. Вайнхайм: Wiley-VCH. ISBN  978-3-527-33015-7.
  12. ^ Томпсон SJ, Hattotuwagama CK, Holliday JD, Flower DR (2006). «О гидрофобности пептидов: сравнение эмпирических прогнозов значений log P пептидов». Биоинформация. 1 (7): 237–41. Дои:10.6026/97320630001237. ЧВК  1891704. PMID  17597897.
  13. ^ Уайлдман С.А., Криппен Г.М. (1999). «Прогноз физико-химических параметров по атомным вкладам». J. Chem. Инф. Comput. Наука. 39 (5): 868–873. Дои:10.1021 / ci990307l.
  14. ^ а б Аджмани С., Джадхав К., Кулкарни С.А. «Групповой QSAR (G-QSAR)». Цитировать журнал требует | журнал = (помощь)
  15. ^ Манохаран П., Виджаян Р.С., Гошал Н. (октябрь 2010 г.). «Рационализация открытия лекарств на основе фрагментов для BACE1: выводы из исследований FB-QSAR, FB-QSSR, многоцелевых (MO-QSPR) и MIF». Журнал компьютерного молекулярного дизайна. 24 (10): 843–64. Bibcode:2010JCAMD..24..843M. Дои:10.1007 / s10822-010-9378-9. PMID  20740315. S2CID  1171860.
  16. ^ а б Прасант Кумар С., Джасрай Ю. Т., Пандья А. А., Равал Р. М. (ноябрь 2013 г.). «QSAR на основе сходства фармакофоров (PS-QSAR) для прогнозов групповой биологической активности». Журнал биомолекулярной структуры и динамики. 33 (1): 56–69. Дои:10.1080/07391102.2013.849618. PMID  24266725. S2CID  45364247.
  17. ^ Leach AR (2001). Молекулярное моделирование: принципы и приложения. Энглвуд Клиффс, Нью-Джерси: Prentice Hall. ISBN  978-0-582-38210-7.
  18. ^ Vert JP, Schölkopf B, Tsuda K (2004). Ядерные методы в вычислительной биологии. Кембридж, Массачусетс: MIT Press. ISBN  978-0-262-19509-6.
  19. ^ Диттерих Т.Г., Латроп Р.Х., Лозано-Перес Т. (1997). «Решение проблемы нескольких экземпляров с помощью прямоугольников, параллельных оси». Искусственный интеллект. 89 (1–2): 31–71. Дои:10.1016 / S0004-3702 (96) 00034-3.
  20. ^ Карутерс Дж. М., Лаутербах Дж. А., Томсон К. Т., Венкатасубраманиан В., Снайвли К. М., Бхан А., Катаре С., Оскарсдоттир Г. (2003). «Дизайн катализатора: извлечение знаний из высокопроизводительных экспериментов». Дж. Катал. 216 (1–2): 3776–3777. Дои:10.1016 / S0021-9517 (02) 00036-2.
  21. ^ Манц Т.А., Фомфрай К., Медведев Г., Кришнамурти Б.Б., Шарма С., Хак Дж., Новструп К.А., Томсон К.Т., Делгасс В.Н., Карутерс Дж.М., Абу-Омар М.М. (апрель 2007 г.). «Корреляция структура-активность в титановых катализаторах одноцентровой полимеризации олефинов, содержащих смешанное лигирование циклопентадиенил / арилоксид». Журнал Американского химического общества. 129 (13): 3776–7. Дои:10.1021 / ja0640849. PMID  17348648.
  22. ^ Манц Т.А., Карутерс Дж. М., Шарма С., Фомфрай К., Томсон К. Т., Делгасс В. Н., Абу-Омар М. М. (2012). «Корреляция между структурой и активностью для относительной инициации цепи для скорости распространения в одноцентровом катализе полимеризации олефинов». Металлоорганические соединения. 31 (2): 602–618. Дои:10.1021 / om200884x.
  23. ^ Гусфилд Д. (1997). Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология. Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  978-0-521-58519-4.
  24. ^ Хельма С (2005). Прогнозирующая токсикология. Вашингтон, округ Колумбия: Тейлор и Фрэнсис. ISBN  978-0-8247-2397-2.
  25. ^ Доссеттер АГ, Гриффен Э.Дж., Лич АГ (2013). «Соответствующий молекулярный парный анализ в открытии лекарств». Открытие наркотиков сегодня. 18 (15–16): 724–31. Дои:10.1016 / j.drudis.2013.03.003. PMID  23557664.
  26. ^ Сушко Ю., Новотарский С., Кёрнер Р., Фогт Дж, Абдельазиз А., Тетько И.В. (2014). «Соответствующие молекулярные пары на основе прогнозов для интерпретации QSAR и помощи в процессе молекулярной оптимизации». Журнал химинформатики. 6 (1): 48. Дои:10.1186 / s13321-014-0048-0. ЧВК  4272757. PMID  25544551.
  27. ^ Тонг В., Хонг Х, Се Кью, Ши Л., Фанг Х, Перкинс Р. (апрель 2005 г.). «Оценка ограничений QSAR - нормативная перспектива». Современный компьютерный дизайн лекарств. 1 (2): 195–205. Дои:10.2174/1573409053585663.
  28. ^ Дирден JC (2003). «Прогнозирование токсичности лекарств in silico». Журнал компьютерного молекулярного дизайна. 17 (2–4): 119–27. Bibcode:2003JCAMD..17..119D. Дои:10.1023 / А: 1025361621494. PMID  13677480. S2CID  21518449.
  29. ^ Волд С., Эрикссон Л. (1995). «Статистическая проверка результатов QSAR». В Waterbeemd, Хан ван де (ред.). Хемометрические методы в молекулярном дизайне. Вайнхайм: ВЧ. С. 309–318. ISBN  978-3-527-30044-0.
  30. ^ Рой К. (декабрь 2007 г.). «О некоторых аспектах валидации прогнозных количественных моделей взаимосвязи структура-активность». Мнение эксперта об открытии лекарств. 2 (12): 1567–77. Дои:10.1517/17460441.2.12.1567. PMID  23488901. S2CID  21305783.
  31. ^ Леонард Дж. Т., Рой К. (2006). «О выборе обучающих и тестовых наборов для разработки прогнозных моделей QSAR». QSAR и комбинаторная наука. 25 (3): 235–251. Дои:10.1002 / qsar.200510161.
  32. ^ Рой П.П., Леонард Дж. Т., Рой К. (2008). «Изучение влияния размера обучающих наборов на разработку прогнозных моделей QSAR». Хемометрия и интеллектуальные лабораторные системы. 90 (1): 31–42. Дои:10.1016 / j.chemolab.2007.07.004.
  33. ^ Put R, Vander Heyden Y (октябрь 2007 г.). «Обзор аспектов моделирования в обращенно-фазовых жидкостных хроматографических количественных отношениях удерживания структуры». Analytica Chimica Acta. 602 (2): 164–72. Дои:10.1016 / j.aca.2007.09.014. PMID  17933600.
  34. ^ Пратим Рой П., Пол С., Митра I, Рой К. (2009). «О двух новых параметрах для проверки прогнозных моделей QSAR». Молекулы. 14 (5): 1660–701. Дои:10.3390 / молекулы14051660. ЧВК  6254296. PMID  19471190.
  35. ^ Chirico N, Gramatica P (сентябрь 2011 г.). «Реальная внешняя предсказуемость моделей QSAR: как ее оценить? Сравнение различных критериев валидации и предложение использования коэффициента корреляции согласованности». Журнал химической информации и моделирования. 51 (9): 2320–35. Дои:10.1021 / ci200211n. PMID  21800825.
  36. ^ Rouvray DH, Бончев D (1991). Химическая теория графов: введение и основы. Танбридж-Уэллс, Кент, Англия: Abacus Press. ISBN  978-0-85626-454-2.
  37. ^ Fraczkiewicz, R (2013). «Прогнозирование ионизации In Silico». В Reedijk, J (ред.). Справочный модуль по химии, молекулярным наукам и химической инженерии. Справочный модуль по химии, молекулярным наукам и химической инженерии [Интернет]. т. 5. Амстердам, Нидерланды: Эльзевир. Дои:10.1016 / B978-0-12-409547-2.02610-X. ISBN  9780124095472.
  38. ^ Фрейхульт Е.К., Андерссон К., Густафссон М.Г. (апрель 2003 г.). «Структурное моделирование расширяет QSAR-анализ взаимодействий антитело-лизоцим до 3D-QSAR». Биофизический журнал. 84 (4): 2264–72. Bibcode:2003BpJ .... 84.2264F. Дои:10.1016 / S0006-3495 (03) 75032-2. ЧВК  1302793. PMID  12668435.
  39. ^ Тиммерман Х, Тодескини Р., Консонни В., Маннхолд Р., Кубиньи Х (2002). Справочник молекулярных дескрипторов. Вайнхайм: Wiley-VCH. ISBN  978-3-527-29913-3.
  40. ^ Дуда Р.О., Харт П.В., Аист Д.Г. (2001). Классификация паттернов. Чичестер: Джон Уайли и сыновья. ISBN  978-0-471-05669-0.
  41. ^ Fioravanzo, E .; Бассан, А .; Паван, М .; Mostrag-Szlichtyng, A .; Уорт, А. П. (2012-04-01). «Роль инструментов in silico генотоксичности в нормативной оценке фармацевтических примесей». SAR и QSAR в исследованиях окружающей среды. 23 (3–4): 257–277. Дои:10.1080 / 1062936X.2012.657236. ISSN  1062-936X. PMID  22369620. S2CID  2714861.
  42. ^ Lavecchia A (март 2015 г.). «Подходы машинного обучения в открытии лекарств: методы и приложения». Открытие наркотиков сегодня. 20 (3): 318–31. Дои:10.1016 / j.drudis.2014.10.012. PMID  25448759.
  43. ^ Столринг Дж. К., Карлссон Л. А., Алмейда П., Бойер С. (2011). «AZOrange - Высокопроизводительное машинное обучение с открытым исходным кодом для моделирования QSAR в среде графического программирования». Журнал химинформатики. 3: 28. Дои:10.1186/1758-2946-3-28. ЧВК  3158423. PMID  21798025.

дальнейшее чтение

внешняя ссылка