Вопрос проверяет понимание методов мониторинга и обнаружения снижения производительности модели машинного обучения в продакшене.
Деградация модели машинного обучения — это снижение её точности и качества предсказаний со временем. Это происходит из-за изменения распределения данных (data drift) или изменения взаимосвязей между признаками и целевой переменной (concept drift). Обнаружение деградации критически важно для поддержания надежности ML-систем в продакшене.
import numpy as np
from scipy.stats import ks_2samp
# Исходные данные (обучающая выборка)
train_data = np.random.normal(0, 1, 1000)
# Новые данные (продакшен)
new_data = np.random.normal(0.5, 1.2, 100)
# KS-тест для обнаружения дрейфа
stat, p_value = ks_2samp(train_data, new_data)
if p_value < 0.05:
print("Обнаружен дрейф данных!")
else:
print("Распределения не изменились")Вывод: Обнаружение деградации модели — обязательная часть MLOps. Регулярный мониторинг метрик и дрейфа данных позволяет своевременно переобучать или заменять модель, обеспечивая стабильную работу ML-системы в продакшене.