| name | credit-model-validation-banking |
| description | Автоматизация процесса валидации моделей кредитного риска в банковской сфере. Используется для полного цикла валидации - от загрузки pickle модели и анализа данных до генерации детального отчета с метриками (AUC, Gini, Recall, Precision, F1, KS, PSI, CSI), визуализациями и соответствием регуляторным требованиям Казахстана. |
Валидация моделей кредитного риска
Этот skill автоматизирует полный процесс валидации моделей машинного обучения для оценки кредитного риска в банковской сфере.
Цель
Провести независимую валидацию модели кредитного риска, включая:
- Анализ качества и предобработки данных
- Оценку производительности модели на новых данных
- Проверку стабильности модели во времени
- Генерацию полного отчета о валидации
- Проверку соответствия регуляторным требованиям
Когда использовать
Используйте этот skill когда необходимо:
- Провести валидацию новой или обновленной модели кредитного риска
- Проверить модель на новых данных (не использованных при разработке)
- Сгенерировать отчет о валидации для регуляторов
- Провести код-ревью модели разработки
- Проверить стабильность существующей модели
Процесс валидации
1. Инициализация валидации
Начать с создания структуры проекта валидации с помощью скрипта init_validation_project.py. Скрипт создаст необходимые директории для данных, результатов и конфигурации.
2. Загрузка и проверка модели
Использовать скрипт load_and_inspect_model.py для безопасной загрузки pickle модели и извлечения метаданных. Скрипт проверяет тип модели, параметры, список признаков, версии библиотек и предупреждения о безопасности.
3. Анализ качества данных
Провести автоматический анализ предобработки данных с помощью data_quality_check.py. Проверки включают пропущенные значения, выбросы, распределения признаков, корректность типов данных, наличие необходимых признаков, дубликаты и дисбаланс целевой переменной.
4. Расчет метрик производительности
Рассчитать все ключевые метрики модели используя calculate_metrics.py:
- AUC-ROC (Area Under ROC Curve)
- Gini коэффициент (2*AUC - 1)
- KS статистика (Kolmogorov-Smirnov)
- Recall (Чувствительность, TPR)
- Precision (Точность)
- F1-score (Гармоническое среднее Precision и Recall)
- Accuracy (Общая точность)
- Specificity (Специфичность, TNR)
- Confusion Matrix (Матрица ошибок)
5. Анализ стабильности (PSI/CSI)
Проверить стабильность модели во времени с помощью stability_analysis.py. Анализ включает PSI для каждого признака (PSI < 0.1 стабильная популяция, 0.1 ≤ PSI < 0.25 умеренное изменение, PSI ≥ 0.25 значительное изменение), CSI для скоров модели, сравнение распределений признаков и временной анализ.
6. Бизнес-метрики
Рассчитать бизнес-метрики для разных порогов отсечения с помощью business_metrics.py:
- Approval Rate (процент одобрений) по порогам
- Bad Rate (процент дефолтов среди одобренных)
- Expected Loss (ожидаемые потери)
- Оптимальный порог (максимизация F1 или бизнес-метрики)
7. Визуализация результатов
Генерировать все необходимые графики с помощью generate_visualizations.py:
- ROC-кривая с AUC
- Precision-Recall кривая
- Confusion Matrix (тепловая карта)
- KS статистика график
- Распределение скоров (Good vs Bad)
- Калибровочная кривая
- Feature Importance (если доступно)
- PSI по признакам (bar chart)
- Lift Chart и Gain Chart
8. Код-ревью
Проанализировать код разработки модели (если доступен): проверить воспроизводимость (random seeds), валидировать split данных (train/test), проверить предобработку (pipelines), оценить качество кода (PEP8, документация), проверить версионирование зависимостей. Использовать references/code_review_checklist.md как гайд.
9. Соответствие регуляторным требованиям
Проверить модель по чеклисту регуляторных требований с помощью regulatory_compliance.py. Проверка включает требования Национального Банка Казахстана для моделей кредитного риска.
10. Генерация финального отчета
Автоматически сгенерировать полный отчет о валидации с помощью generate_validation_report.py. Структура отчета включает: Глоссарий, Абстракт, Методология валидации, Цель моделей, Разработка моделей, Объем валидационных данных, Результаты валидации моделей, Визуализация результатов, Confusion Matrix, PSI анализ, Интерпретация результатов, Код-ревью, Заключение и рекомендации, Соответствие регуляторным требованиям, Рекомендации.
Интерактивный режим
Для пошагового процесса с объяснениями использовать interactive_validation.py. Скрипт проведет через каждый этап, задаст вопросы о специфике модели, покажет промежуточные результаты, позволит корректировать параметры и сгенерирует отчет в конце.
Bundled Resources
Scripts (scripts/)
- init_validation_project.py - Инициализация проекта
- load_and_inspect_model.py - Загрузка pickle модели
- data_quality_check.py - Анализ качества данных
- calculate_metrics.py - Расчет метрик производительности
- stability_analysis.py - PSI/CSI анализ
- business_metrics.py - Бизнес-метрики
- generate_visualizations.py - Создание графиков
- regulatory_compliance.py - Проверка compliance
- generate_validation_report.py - Генерация отчета
- interactive_validation.py - Интерактивный режим
- utils/ - Вспомогательные утилиты
References (references/)
- validation_checklist.md - Полный чеклист валидации
- kz_regulator_checklist.md - Требования НБ РК
- metrics_guide.md - Подробное описание метрик
- code_review_checklist.md - Гайд по код-ревью
- interpretation_guide.md - Интерпретация результатов
Assets (assets/)
- report_template.docx - Шаблон отчета Word
- plots_styles.json - Стили для графиков
- glossary.yaml - Глоссарий терминов
Примеры использования
Пример 1: Быстрая валидация
Проведи валидацию модели PD_Retail_v2.pkl на данных validation_q4_2025.csv
Пример 2: Полная валидация с отчетом
Выполни полную валидацию модели согласно регуляторным требованиям НБ РК. Модель: models/pd_model.pkl, Данные: data/validation_2025_h1.csv. Нужен полный отчет на русском языке.
Пример 3: Анализ конкретной проблемы
Модель показывает низкий Gini на новых данных. Помоги найти причину - проверь PSI по признакам и stability.
Пример 4: Код-ревью
Проведи код-ревью разработки модели в файле model_development.py
Best Practices
- Всегда сохраняйте исходные данные - не перезаписывайте raw данные
- Используйте version control - храните config.yaml в git
- Документируйте отклонения - если модель не прошла валидацию
- Проверяйте воспроизводимость - результаты должны повторяться
- Храните артефакты - все графики и метрики для аудита
- Обновляйте чеклист - при изменении регуляторных требований
Ограничения
- Pickle модели должны быть безопасными (проверка перед загрузкой)
- Данные должны содержать все признаки, использованные при обучении
- Для PSI анализа нужны данные обучающей выборки
- Большие модели (>1GB) могут требовать дополнительной памяти