Skip to content

Latest commit

 

History

History
23 lines (14 loc) · 1.86 KB

README.md

File metadata and controls

23 lines (14 loc) · 1.86 KB

AChE_inhibitor_predictor

Идея: построить классификационную модель, которая сможет определять, является ли молекула потенциальным ингибитором человеческой ацетилхолинэстеразы.

Данные были взяты из базы данных chembl. Были выбраны все молекулы, связанные с ацетилхолинэстеразой, и записаны в ache_data.csv

Препроцессинг данных

Файл: data_preprocessing.ipynb

Результат: data.csv

Для препроцессинга было сделано следующее:

  1. Выбраны все строки, содержащие значения IC50 (полуингибирующая концентрация)
  2. Выбраны все значения IC50, выраженные в наномолярной концентарции
  3. Удалены все отсутствующие значения ( ! попробовать восстановить классы по индексу Танимото ! )
  4. Удалены дубликаты по уникальному айди
  5. Расставлены метки классов (активные 1 и неактивные 0) по правилу: активными молекулами считаются те, чьи IC50 меньше или равны 500 нМ

Неактивных молекул — 3646

Активных молекул — 1993