(зоны ингибирования роста бактерий)
- Team 5: Кулаев Кирилл, Алтышева Мария, Дедова Анастасия, Обухова Арина, Потуданская Мария
Резистентность к антибиотикам — серьезная проблема современной медицины. Заболевания, которые вызваны резистентными бактериями, с трудом поддаются лечению, а иногда и вовсе не лечатся. Для борьбы с такими бактериями биологи и медики постоянно ищут новые подходы, и один из вариантов — терапия металлическими наночастицами. Металлические наночастицы могут как воздействовать на бактерии самостоятельно (повреждая мембраны бактерий и генерируя радикальные частицы), так и усиливать эффект антибиотиков.
Задание состоит в построении предсказательной модели регрессии для прогнозирования ZOI - зоны игибирования роста бактерий - для комплексов лекарство-наночастицы.
https://github.com/MariaAltisheva/hackathon/blob/main/DC_team_5.ipynb
https://docs.google.com/presentation/d/1PE2hwT6_obFj18qIl-fcInDLH_cO0Hslj-w15GeXdgg/edit#slide=id.p
- Удалены столбцы Unnamed: 0.1, Drug_dose, NP_concentration, fold_increase_in_antibacterial_activity.
- Объединялись датасеты по колонкам Drug и Bacteria
- После построения heat map, анализа свойств некоторых фич, удалены колонки: subkingdom, clade, kingdom, phylum, class, order, family, species, Tax_id, isolated_from.
- В столбце ZOI_drug пропущенные значения были заменены на среднее.
- Пустые строки method, shape, NP_Syntesis, NP size_min, NP size_max, NP size_avg, ZOI_NP были удалены.
- Строки с пропущенными значениями по столбцам min_Incub_period, avg_Incub_period, max_incub_period, growth_temp, biosafety_level были заменены средними значениями.
- Были удалены max_incub_period, min_Incub_period и NP size_max как максимально коррелирующие признаки.
- Были подсчитаны все дескрипторы для всех молекул антибиотиков.
До удаления сильно коррелирующих признаков
После удаления сильно коррелирующих признаков, добавления новых дескрипторов
До удаления ['fr_nitro_arom', 'MDR_check']
После удаления ['fr_nitro_arom', 'MDR_check']






