Skip to content

alyferryhalo/AChE_inhibitor_predictor

Repository files navigation

AChE_inhibitor_predictor

Идея: построить классификационную модель, которая сможет определять, является ли молекула потенциальным ингибитором человеческой ацетилхолинэстеразы.

Данные были взяты из базы данных chembl. Были выбраны все молекулы, связанные с ацетилхолинэстеразой, и записаны в ache_data.csv

Препроцессинг данных

Файл: data_preprocessing.ipynb

Результат: data.csv

Для препроцессинга было сделано следующее:

  1. Выбраны все строки, содержащие значения IC50 (полуингибирующая концентрация)
  2. Выбраны все значения IC50, выраженные в наномолярной концентарции
  3. Удалены все отсутствующие значения ( ! попробовать восстановить классы по индексу Танимото ! )
  4. Удалены дубликаты по уникальному айди
  5. Расставлены метки классов (активные 1 и неактивные 0) по правилу: активными молекулами считаются те, чьи IC50 меньше или равны 500 нМ

Неактивных молекул — 3646

Активных молекул — 1993

About

Final course ptoject

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published