ML Models: Прогнозування підвищення кредитного ліміту

Опис проекту

Проект аналізує дані клієнтів для прогнозування ймовірності підвищення кредитного ліміту протягом 30 днів після оцінки.

Бізнес-завдання Визначити клієнтів, яким з високою ймовірністю підвищать ліміт, щоб оптимізувати кредитну політику та зменшити ризики.

Дані Кредитна історія, поведінка, демографія тощо. Формат файлу має бути - feather-файл (data/dataset.feather).

Таргет Бінарний клас: підвищення ліміту на ≥ 5000 грн (абсолютний приріст). Дисбаланс: ~2.61 % позитивного класу.

Основні етапи пайплайну

Завантаження даних
Оптимізація типів даних (зменшення обсягу пам'яті)
Аудит категоріальних ознак
Аналіз лімітів (pre vs in30d)
Формування таргету
Видалення leakage-колонок
Аналіз та обробка пропусків
Кореляційний аналіз з таргетом
Інженерія ознак → 10 фінальних фіч
Тренування вибраної моделі (або кількох)
Розрахунок метрик (AUC, Gini, Precision, Recall, F1, F2)
Пошук оптимального порогу за F2
Precision при фіксованому Recall = 0.8
Збереження моделі, графіків ROC/PR, порівняльної таблиці

Структура проекту

Як запустити

Створіть загальну папку DATA SCIENCE
Скопіюйте папку з проектом ML_models
Додайте в папку відповідний датасет dataset.feather
Перейдіть у загальну папку cd "/Users/.../..../DATA SCIENCE
Активуйте віртуальне середовище source ML_models/.venv/bin/activate
Встановіть необхідні пакети ``
Запустіть пайплайн python -m ML_models.main
Спочатку програма оптимізує датасет для побудови моделей.
Після чого оберіть модель:
- logreg
- xgboost
- lightgbm
- histgb або all щоб тренувати всі (рекомендовано)

Результати

Після виконання в папці ML_models/reports/ з'являться:

{model_name}.pkl — збережені моделі
{model_name}_baseline_curves.png — графіки ROC та Precision-Recall
model_comparison.csv — порівняльна таблиця
model_comparison.png — візуальна таблиця

Використані технології

Python 3.14
pandas, numpy, scikit-learn, logging, importlib, matplotlib, joblib
XGBoost, LightGBM

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
metrics		metrics
models		models
reports		reports
.gitignore		.gitignore
README.md		README.md
Structure.png		Structure.png
__init__.py		__init__.py
audit_categorical.py		audit_categorical.py
config.py		config.py
correlation_analysis.py		correlation_analysis.py
create_target.py		create_target.py
drop_leakage.py		drop_leakage.py
feature_engineering.py		feature_engineering.py
handle_missing_values.py		handle_missing_values.py
limit_stats.py		limit_stats.py
load_data.py		load_data.py
main.py		main.py
metrics_report.py		metrics_report.py
missing_analysis.py		missing_analysis.py
model_comparison.py		model_comparison.py
model_selector.py		model_selector.py
optimize_numerical.py		optimize_numerical.py
task.md		task.md
train_model_base.py		train_model_base.py
validate_columns.py		validate_columns.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ML Models: Прогнозування підвищення кредитного ліміту

Опис проекту

Основні етапи пайплайну

Структура проекту

Як запустити

Результати

Використані технології

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ML Models: Прогнозування підвищення кредитного ліміту

Опис проекту

Основні етапи пайплайну

Структура проекту

Як запустити

Результати

Використані технології

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages