Логотип YeaHub

База вопросов

Собеседования

Тренажёр

База ресурсов

Обучение

Навыки

Войти

Выбери, каким будет IT завтра — вместе c нами!

YeaHub — это полностью открытый проект, призванный объединить и улучшить IT-сферу. Наш исходный код доступен для просмотра на GitHub. Дизайн проекта также открыт для ознакомления в Figma.

© 2026 YeaHub

Документы

Медиа

Назад
Вопрос про TensorFlow : tf.transform, data preprocessing, apache beam, training-serving skew, feature scaling

Что такое TensorFlow Transform (tf.Transform) и какие проблемы он решает?

Этот вопрос проверяет понимание библиотеки tf.Transform, её роли в обработке данных и устранении несоответствий между обучением и инференсом.

Короткий ответ

TensorFlow Transform (tf.Transform) — это библиотека для предварительной обработки данных в TensorFlow. Она позволяет применять те же преобразования данных как во время обучения, так и при инференсе, что устраняет несоответствия между обработкой данных в разных этапах. tf.Transform особенно полезен при работе с большими наборами данных, так как выполняет масштабируемые преобразования, которые не помещаются в память. Основное преимущество — автоматическое включение предобработки в экспортированную модель, что делает её консистентной.

Длинный ответ

tf.Transform используется для создания и автоматического применения предобработки данных, обеспечивая её идентичность на этапах обучения и инференса. Это решает одну из распространённых проблем машинного обучения — несовместимость обработанных данных при развертывании модели.

Основные возможности tf.Transform:

  • Консистентность данных – Все преобразования применяются одинаково как при обучении, так и при инференсе.

  • Оптимизация вычислений – Выполняет предобработку данных с использованием Apache Beam, что позволяет работать с огромными объёмами данных.

  • Автоматизация – Упрощает рабочий процесс, устраняя необходимость вручную копировать логику предобработки из кода обучения в код инференса.

Пример использования tf.Transform:

import tensorflow as tf
import tensorflow_transform as tft
import tensorflow_transform.beam.impl as tft_beam

# Определяем функцию обработки данных
def preprocessing_fn(inputs):
    	outputs = {}
    	outputs["normalized_feature"] = tft.scale_to_z_score(inputs["feature"])
    	return outputs

Этот код выполняет стандартизацию входных данных, а затем tf.Transform автоматически включает её в экспортированную модель
Использование tf.Transform позволяет добиться стабильности данных между этапами обучения и инференса, а также эффективно обрабатывать большие объёмы информации.

Уровень

  • Рейтинг:

    2

  • Сложность:

    6

Навыки

  • TensorFlow

    TensorFlow

Ключевые слова

#tf.transform

#data preprocessing

#apache beam

#training-serving skew

#feature scaling

Подпишись на Data Science в телеграм