Skip to content

Репозиторий тестового задания

Notifications You must be signed in to change notification settings

alyferryhalo/BIOCAD_A2aAR

Repository files navigation

BIOCAD_A2aAR

Кейс: Изучить фокусированную библиотеку ингибиторов A2aAR. Предложить способ поиска в ней потенциально активных молекул. Выбрать несколько возможных кандидатов и объяснить свой выбор.

Ссылка для скачивания данных

Препроцессинг

Файл: non-specific_filter.ipynb

Прежде всего попробуем провести виртуальный скрининг. Библиотека, безусловно, уже является фокусированной, но соединений в ней по-прежнему достаточно много: 20323 штук. Надо попробовать отобрать по крайней мере “хорошие” соединения простейшим отбором.

Для начала проведём неспецифическое фильтрование (препроцессинг), чтобы выбрать соединения, обладающие наиболее приемлемыми свойствами. Для этого отфильтруем соединения по их физико-химическим свойствам (правила Липински, правила “lead-likeness” и “drug-likeness”), отфильтруем соединения по токсофорам. Затем планировалось применить подструктурные фильтры (PAINS, например), однако с ними возникли некоторые проблемы. К тому же, есть мнение, что процент ложных срабатываний у них бывает слишком высок.

По правилу Липински биодоступность оптимальна, если:

  • H-bond donors < 5
  • MW < 500
  • LogP < 5
  • H-bond acceptors < 10

По критериям “lead-likeness”:

  • Rotatable bonds < 10
  • Rings > 0
  • Chiral centers < 3

Для исключения соединений, содержащих наиболее распространённые токсофоры, я воспользовалась scopy.ScoTox.

По итогам препроцессинга (Липински, частично lead-likeness, токсофоры) осталось 2138 молекул, найти которые можно в accepted_smiles.txt. Получается, удалось сократить датасет примерно на 90%.

Ранжирование с использованием 2D-структур

Сходство с активными соединениями (индекс Танимото для сравнения фингерпринтов) — виртуальный скрининг на основе молекулярного подобия (SBVS). Представляется логичным, что если некая молекула похожа на молекулу с уже установленной активностью, то вероятность того, что исследуемая молекула будет обладать требуемой активностью, выше. Поэтому для данного фрагмента исследования я решила взять несколько формул известных ингибиторов A2aAR и посчитать инжекс Танимото для оставшихся в датасете молекул, чтобы выделить среди них наиболее похожие.

Соединения для сравнения были взяты отсюда.

Был рассчитан индекс Танимото для всех отобранных ранее молекул. Файл можно посмотреть вот тут. Было решено отобрать все молекулы, у которых индекс Танимото для той или иной референсной молекулы был больше 0.25.

В результате получился список из 47 молекул. Это немного меньше (сильно меньше), чем я ожидала, но исследование продолжается.

Ранжирование с использованием 3D-структур

Для дальнейших исследований возьмём структуру 4EIY в формате .pdb

Полученные на предыдущем шаге SMILES конвертируем в формат .pdbqt, подходящий для докинга в Autodock, при помощи open babel. Получившиеся файлы находится здесь.

Прежде всего удалим лишние молекулы, которые "привязались" к этой структуре. Затем необходимо приготовить саму молекулу белка и проверить, нет ли отсутствующих атомов:

image

Теперь добавим полярные водороды:

image

И Kollman Charges:

image

Теперь проверим, равномерно ли распределены заряды. Оказывается, что нет:

image

Распределим заряды равномерно:

image

И проверим снова. Теперь всё в порядке:

image

Наконец, можно добавлять лиганды. Однако, как обычно, что-то пошло не по плану, и ни один лиганд не был открыт, из-за чего вся дальнейшая работа полностью остановилась:

image

Файл с "чистой" структурой (вместе с сайтами связывания, которые были сочтены AutoDock наиболее интересными) был сохранён как 4eiy_clean.pdb.

Ввиду проблем с AutoDock было принято решение использовать Schrodinger Maestro.

Schrodinger Maestro

Ligand Preparation

Импортируем структуры из файла tanimoto_smiles.txt и обрабатываем при помощи LigPrep:

Screenshot 2022-08-24 at 19 19 16

Protein Preparation

При помощи Protein Wizard Preparation оптимизируем структуру 4EIY:

Screenshot 2022-08-24 at 19 22 26

Screenshot 2022-08-24 at 19 22 26

Посмотрим заодно на лиганд:

Screenshot 2022-08-24 at 19 34 05

И его позу:

standard_ligand_interaction_map

Генерация решётки

Screenshot 2022-08-24 at 19 40 16

Screenshot 2022-08-24 at 19 42 28

Параметры докинга

Screenshot 2022-08-24 at 19 57 48

Screenshot 2022-08-24 at 19 57 52

Полученные результаты находятся в файле mols_docking.csv.

Карты взаимодействия кандидатов

COc1ccc(-c2nn(CCCC(=O)NCCc3ccc(Cl)cc3)c(=O)c3noc(C)c23)cc1

COc1ccc(-c2nn(CCCC(=O)NCCc3ccc(Cl)cc3)c(=O)c3noc(C)c23)cc1

Cn1ncc2c(NCc3ccccc3)nc(N3CCN(CCO)CC3)nc21

Cn1ncc2c(NCc3ccccc3)nc(N3CCN(CCO)CC3)nc21

About

Репозиторий тестового задания

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published