Вопрос проверяет понимание области применения линейной регрессии как базового метода машинного обучения для прогнозирования числовых значений.
Линейная регрессия — это статистический метод, который моделирует связь между зависимой переменной (целью) и одной или несколькими независимыми переменными (признаками) с помощью линейного уравнения. Она применяется в задачах регрессии, то есть когда нужно предсказать числовое значение, а не категорию. Основное условие — предполагается, что связь между признаками и целью приблизительно линейна.
from sklearn.linear_model import LinearRegression
import numpy as np
# Данные: площадь (кв.м) и цена (тыс. долл.)
X = np.array([[50], [60], [70], [80], [90]])
y = np.array([150, 180, 210, 240, 270])
# Создание и обучение модели
model = LinearRegression()
model.fit(X, y)
# Предсказание для дома 75 кв.м
predicted_price = model.predict([[75]])
print(predicted_price) # ~225Линейная регрессия хороша для начального анализа данных, когда важна интерпретируемость модели и есть основания полагать, что зависимость линейна. Она проста в реализации, быстро обучается и даёт понятные коэффициенты влияния признаков. Однако если связь нелинейна или данные содержат сложные взаимодействия, стоит рассмотреть более продвинутые методы, такие как полиномиальная регрессия или деревья решений.
Вывод: Линейная регрессия — это базовый инструмент для прогнозирования числовых значений, который следует применять при линейной зависимости и необходимости простого, интерпретируемого решения.