Логотип YeaHub

База вопросов

Собеседования

Тренажёр

База ресурсов

Обучение

Навыки

Задачи

Войти

Выбери, каким будет IT завтра — вместе c нами!

YeaHub — это полностью открытый проект, призванный объединить и улучшить IT-сферу. Наш исходный код доступен для просмотра на GitHub. Дизайн проекта также открыт для ознакомления в Figma.

© 2026 YeaHub

AI info

Карта сайта

Документы

Медиа

Назад
Вопрос про JavaScript: LLM, text classification, zero-shot, few-shot, fine-tuning

Какие существуют подходы к категоризации текстов с помощью LLM?

Вопрос проверяет знание методов классификации текстов с использованием больших языковых моделей (LLM) и их практическое применение.

Короткий ответ

Существует несколько подходов к категоризации текстов с помощью LLM: zero-shot классификация (без примеров), few-shot классификация (с несколькими примерами) и fine-tuning (дообучение модели на размеченных данных). Zero-shot подходит для быстрых задач без размеченных данных, few-shot — для улучшения точности с минимальными примерами, а fine-tuning — для максимальной точности на специфических доменах.

Длинный ответ

Основные подходы к категоризации текстов с помощью LLM

Большие языковые модели (LLM) предоставляют гибкие методы для классификации текстов, которые отличаются по сложности и требованиям к данным. Основные подходы включают zero-shot, few-shot и fine-tuning. Каждый из них имеет свои преимущества и ограничения.

Zero-shot классификация

Этот подход не требует размеченных примеров. Модели, такие как GPT или BERT, используют предобученные знания для отнесения текста к заданным категориям на основе их описания. Например, можно задать промпт: "Определи категорию текста: спорт, политика или технологии".

from transformers import pipeline
classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")
text = "Новый рекорд в беге на 100 метров"
categories = ["спорт", "политика", "технологии"]
result = classifier(text, categories)
print(result['labels'][0])  # спорт

Few-shot классификация

Здесь в промпт добавляется несколько примеров размеченных данных для повышения точности. Это полезно, когда категории специфичны или модель плохо справляется с zero-shot.

prompt = """Классифицируй текст:
Пример 1: "Футбольный матч завершился" -> спорт
Пример 2: "Выборы президента" -> политика
Текст: "Запуск нового iPhone" -> """
# Используется с LLM API

Fine-tuning (дообучение)

Этот подход требует размеченного датасета и дообучает модель на конкретной задаче. Он обеспечивает наивысшую точность, особенно для узких доменов, но требует больше ресурсов и времени.

from transformers import AutoModelForSequenceClassification, Trainer
model = AutoModelForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=3)
# Далее загрузка данных и обучение

Вывод

Выбор подхода зависит от доступности размеченных данных и требуемой точности. Zero-shot подходит для быстрых прототипов, few-shot — для улучшения без больших затрат, а fine-tuning — для продакшн-систем с высокими требованиями к качеству.

  • Аватар

    Python Guru

    Sergey Filichkin

    Guru – это эксперты YeaHub, которые помогают развивать комьюнити.

Уровень

  • Рейтинг:

    4

  • Сложность:

    6

Навыки

  • JavaScript

    JavaScript

  • Python

    Python

Ключевые слова

#LLM

#text classification

#zero-shot

#few-shot

#fine-tuning

Подпишись на Python Developer в телеграм

  • Аватар

    Python Guru

    Sergey Filichkin

    Guru – это эксперты YeaHub, которые помогают развивать комьюнити.