Первая часть проекта: работа с табличными данными

Heart_Failure_EDA_and_Train_Test_Split.ipynb - Разведочный анализ данных + базовая подготовка данных БЕЗ масштабирования и кодирования категориальных признаков. Разбиение данных на трейн и тест. На выходе: полученные выборки данных - в папке data.
Heart_Failure_Preprocessing.ipynb - Подготовка пайплайнов для обработки данных. На выходе: два сохраненных пайплайна - prep_with_cat.dill (с обработкой категориальных признаков) и prep_without_cat.dill (без обработки категориальных признаков)
prep_with_cat.dill и prep_without_cat.dill - Пайплайны для предобработки данных

Get_RF_feature_importances_from_pipeline.ipynb - Пример, как доставать названия категориальных признаков из пайплайна.
Get_cat_features_for LIME+Pipeline_using_example.ipynb - Примеры, как использовать препроцессинг, как доставать названия категориальных признаков и как использовать все это в модели. На выходе: model_LR_example.dill - сохраненная обученная тестовая модель(логистическая регрессия без подбора гиперпараметров просто для примера)

data - Итоговые выборки, с которыми работаем
models - Итоговые модели, результаты которых будем интерпретировать
Heart_Failure_Discovering_causal_dependencies.ipynb - Поиск причинно-следственных связей
Heart_Failure_SHAP_LIME.ipynb - SHAP и LIME анализ
requirements.txt - Необходимые версии библиотек

Provide feedback

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
.github		.github
EDA_and_Preprocessing		EDA_and_Preprocessing
Examples		Examples
data		data
models		models
.gitignore		.gitignore
Heart_Failure_Discovering_causal_dependencies.ipynb		Heart_Failure_Discovering_causal_dependencies.ipynb
Heart_Failure_SHAP_LIME.ipynb		Heart_Failure_SHAP_LIME.ipynb
README.md		README.md
requirements.txt		requirements.txt