Разработка лекарственного средства – дорогостоящий и отнимающий много времени процесс. Чтобы сузить количество химических соединений, которые могли быть потенциальными кандидатами препарата, ученые используют компьютерные модели, которые могут предсказать, как конкретное химическое соединение могло бы взаимодействовать с биологической целью интереса – например, ключевой белок, который мог бы быть связан с процессом болезни. Традиционно, это сделано через моделирование количественных отношений деятельности структуры (QSAR) и молекулярную стыковку, которые полагаются 2-и 3D информация о тех химикатах.Денис Фоерчес, доцент вычислительной химии, хотел улучшить точность этих моделей QSAR. «Когда Вы показываете ряд 30 миллионов комплексов, Вам не обязательно нужна очень высокая надежность с Вашей моделью – Вы просто получаете приблизительную идею о лучших 5 или 10 процентов той виртуальной библиотеки.
Но при попытке сузить область 200 аналогов 10, который чаще всего имеет место в разработке лекарственного средства, Ваш метод моделирования должен быть чрезвычайно точным. Текущие методы определенно не достаточно надежны».Фоерчес и Джереми Эш, аспирант в биоинформатике, решили включить результаты молекулярных вычислений динамики – моделирования все-атома того, как конкретный комплекс перемещается в связывающий карман белка – в модели предсказания на основе машинного обучения.«Большинство моделей только использует двумерные структуры молекул», говорит Фоерчес. «Но в действительности, химикаты – сложные трехмерные объекты, которые перемещаются, вибрируют и имеют динамические межмолекулярные взаимодействия с белком, однажды состыкованным в его связывающем участке.
Вы не видите это, если Вы просто смотрите на 2-ю или 3D структуру данной молекулы».В исследовании доказательства понятия Фоерчес и Эш посмотрели на киназу ERK2 – фермент, связанный с несколькими типами рака – и группу из 87 известных ингибиторов ERK2, в пределах от очень активного к бездействующему. Они управляли независимыми моделированиями молекулярной динамики (MD) для каждого из тех 87 комплексов и вычислили критическую информацию о гибкости каждого комплекса однажды в кармане ERK2. Тогда они проанализировали описатели MD, используя cheminformatics методы и машинное обучение.
Описатели MD смогли точно отличить активные ингибиторы ERK2 от слабо actives и inactives, который не имел место, когда модели использовали только 2-ю и 3D структурную информацию.«У нас уже были данные об этих 87 молекулах и их деятельности в ERK2», говорит Фоерчес. «Таким образом, мы проверили, чтобы видеть, смогла ли наша модель достоверно найти самые активные комплексы. Действительно, это точно различало сильные и слабые ингибиторы ERK2, и потому что описатели MD закодировали взаимодействия, которые те комплексы создают в кармане ERK2, это также дало нам больше понимания, почему сильные ингибиторы работали хорошо.«Прежде, чем вычислить достижения позволило нам моделировать этот вид данных, нам потребуются шесть месяцев, чтобы моделировать одну единственную молекулу в кармане ERK2.
Благодаря ускорению GPU теперь только требуется три часа. Это – переломный момент.
Я надеюсь, что слияние данных, извлеченных из молекулярной динамики в модели QSAR, позволит новое поколение гиперпрогнозирующих моделей, которые помогут обеспечению новые, эффективные наркотики на рынке еще быстрее. Это – искусственный интеллект, работающий на нас, чтобы обнаружить наркотики завтра».