проект по обработке данных и применению моделей машинного обучения и нейронных сетей для нахождения синергетического эффекта между металлическими наночастицами и антибиотиками против резистентных бактерий.
Основной код в главном файле - _Хакатон.ipynb
Исходные данные представленны в папке raw_data
data.csv
bacterial_descriptors.csv
drug_descriptors.csv
Датасет data.csv был дополнен информацией о бактериях и антибиотиках, представленных в датасетах bacterial_descriptors.csv и drug_descriptors.csv соответственно. Данные о бактериях были закодированы расстоянием на филогенетическом дереве:
Итоговый датасет: Imputed_data.csv
Для выбора оптимальных алгоритмов машинного обучения использовались методы AutoML PyCaret, LazyPredict LasyRegressor. Была обучена нейронная сеть состоящая из 2 полносвязных слоев, включающих 64 нейрона каждый.
Для обученных моделей машинного обучения были визуализированы важности владов признаков в предсказания МЛ.