Что произойдёт, если вызвать len() на строке с многобайтовыми символами — вернёт ли функция количество символов?

Question

Функция len() в Python возвращает количество символов в строке, а не количество байтов. Для строк с многобайтовыми символами (например, эмодзи или кириллица) len() вернёт количество символов, так как Python использует Unicode для представления строк. Каждый символ считается за один элемент, независимо от его размера в байтах.

YeaHub · Accepted Answer

Как работает len() с многобайтовыми символамиВ Python строки хранятся как последовательности Unicode-символов. Функция len() возвращает количество этих символов, а не количество байтов, которые они занимают в памяти. Это означает, что для строки с многобайтовыми символами, такими как эмодзи или символы кириллицы, len() вернёт количество символов, а не байтов.Пример# Строка с эмодзи (многобайтовый символ)
s = "Привет 😊"
print(len(s))  # Выведет 8: 6 букв + пробел + эмодзи

# Строка с кириллицей
t = "Привет"
print(len(t))  # Выведет 6, хотя каждый символ занимает 2 байта в UTF-8
Практическое применениеЭто важно при обработке текста, где нужно считать символы, а не байты, например, при валидации длины ввода пользователя или работе с текстовыми данными в веб-приложениях. Если нужно узнать размер в байтах, используйте len(s.encode('utf-8')).Выводlen() всегда возвращает количество символов, что удобно для работы с текстом на разных языках. Используйте её, когда нужно считать символы, а не байты.

Что произойдёт, если вызвать len() на строке с многобайтовыми символами — вернёт ли функция количество символов?

Короткий ответ

Длинный ответ

Как работает len() с многобайтовыми символами

Пример

Практическое применение

Вывод

Что произойдёт, если вызвать len() на строке с многобайтовыми символами — вернёт ли функция количество символов?

Короткий ответ

Длинный ответ

Как работает len() с многобайтовыми символами

Пример

Практическое применение

Вывод