Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

-колонка ML-инженера билайна описывает, как автоматизировать контроль деградации скоринговых моделей из-за feature/concept drift. В основе — перевод метрик стабильности и качества в временные ряды по партициям (месяц/квартал) и их единая автооценка. Помимо PSI автор использует пул метрик распределений: KS, KL, Jensen–Shannon, Wasserstein; метрики качества (Gini, F1, ROC AUC; для регрессии — MAE/MSE/RMSE/MAPE) и калибровку по ECE/Calibration curve.

Далее строится «оценщик графиков»: для каждой метрики обучаются две простые модели — классификатор стабильности (0/1) и регрессор (балл 1–5). Итоговый скор — взвешенная комбинация двух оценок. Фичи для оценщика извлекаются из ряда: стационарность (ADF), тренд (линейная регрессия), волатильность/выбросы, экстремумы и технические индикаторы (например, «golden cross» пересечения скользящих средних). Для Precision Macro применяют экспоненциально взвешенную оценку монотонности вместо ML.

В проде система подсвечивает «уехавшие» признаки и помогает ранжировать модели близкого качества; её можно включать в отбор фич и тюнинг гиперпараметров с учётом стабильности. Ограничения: шум разметки, риск «переобучения на стабильность», поэтому нужен баланс между качеством и устойчивостью и пороговые политики алертов.

Ключевые инсайты из новости (по версии ChatGPT)
  • Композитный мониторинг дрейфа признаков: PSI недостаточно для уверенного контроля стабильности. Надёжнее смотреть на ансамбль метрик распределений (PSI, KS, Jensen–Shannon/JH, KL, Wasserstein), где каждая «ловит» свой тип смещения. Такой композит снижает риск пропустить деградацию модели в проде.
    [процесс]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!