Проверяет понимание методов анализа и обработки последовательных данных, собранных через равные промежутки времени.
Временной ряд — это набор наблюдений, сделанных последовательно во времени. Примеры: цены акций, температура, количество посетителей сайта. Основная задача — прогнозирование будущих значений на основе прошлых.
import pandas as pd
from statsmodels.tsa.arima.model import ARIMA
# Загрузка данных
data = pd.read_csv('sales.csv', parse_dates=['date'], index_col='date')
# Проверка стационарности (тест Дики-Фуллера)
from statsmodels.tsa.stattools import adfuller
result = adfuller(data['sales'])
print('p-value:', result[1])
# Если p-value > 0.05, применяем дифференцирование
data_diff = data.diff().dropna()
# Обучение модели ARIMA
model = ARIMA(data, order=(1,1,1))
model_fit = model.fit()
# Прогноз
forecast = model_fit.forecast(steps=10)
print(forecast)Обработка временных рядов требует понимания стационарности, сезонности и выбора подходящей модели. Это ключевой навык для задач прогнозирования в финансах, логистике и аналитике.
Уровень
Рейтинг:
4
Сложность:
6
Навыки
Python
Аналитика данных / BI
Ключевые слова
Подпишись на Python Developer в телеграм