Как обеспечить отказоустойчивость системы при падении backend, frontend или БД?

Question

Отказоустойчивость достигается за счёт избыточности и автоматического восстановления. Backend масштабируется горизонтально и перезапускается автоматически. Frontend разворачивается через CDN и балансировщики. Базы данных используют репликацию и бэкапы. Важно избегать единственных точек отказа.

YeaHub · Accepted Answer

Отказоустойчивость — это свойство системы продолжать работу при частичных сбоях.

Определение

Отказоустойчивость — способность системы сохранять работоспособность при выходе из строя отдельных компонентов.

Backend

Для backend-сервисов критичны:

Горизонтальное масштабирование
- несколько инстансов
- stateless-сервисы
Автоматическое восстановление
- health checks
- рестарты контейнеров
Изоляция ошибок
- таймауты
- circuit breaker

Frontend

Frontend защищается иначе:

CDN
- кеширование
- геораспределение
Балансировка
- несколько origin-серверов
- failover

Базы данных

Наиболее чувствительный компонент:

Репликация
- primary / replica
- автоматический failover
Бэкапы
- регулярные снапшоты
- проверка восстановления
Шардинг
- распределение нагрузки
- снижение blast radius

Общие меры

устранение single point of failure
мониторинг и алерты
chaos-тестирование

Вывод

Отказоустойчивость достигается не одной технологией, а комплексом архитектурных решений.

Как обеспечить отказоустойчивость системы при падении backend, frontend или БД?

Короткий ответ

Длинный ответ

Определение

Backend

Frontend

Базы данных

Общие меры

Вывод

Как обеспечить отказоустойчивость системы при падении backend, frontend или БД?

Короткий ответ

Длинный ответ

Определение

Backend

Frontend

Базы данных

Общие меры

Вывод