Вопрос проверяет понимание метрик оценки качества AI-ассистентов, что важно для разработки и улучшения таких систем.
Оценка качества AI-ассистента требует комплексного подхода, так как он должен не только давать правильные ответы, но и быть полезным и удобным для пользователя. Метрики делятся на объективные (автоматические) и субъективные (основанные на отзывах пользователей).
from sklearn.metrics import f1_score
# Пример: истинные метки и предсказания
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 0, 1, 0, 0, 1]
f1 = f1_score(y_true, y_pred)
print(f"F1-score: {f1:.2f}") # Вывод: F1-score: 0.80Выбор метрик зависит от целей ассистента: для чат-ботов поддержки важны CSAT и время решения, для образовательных — точность и полнота. Комбинируйте автоматические и пользовательские метрики для полной картины качества.