Вопрос проверяет практический опыт эксплуатации ML-сервисов и умение находить причины нестабильной работы моделей в продакшене.
Короткий ответ
Утечки памяти диагностируются через метрики потребления RAM и GPU во времени. Важно отличать рост памяти при загрузке модели от неконтролируемого накопления. Используются профилировщики, логи и health-check’и. Падения часто связаны с OOM, некорректными входными данными или ошибками нативных библиотек. Диагностика требует комбинации мониторинга и локального воспроизведения проблемы.
Длинный ответ
Зарегистрироваться
Развернутый ответ доступен только зарегистрированным пользователям.