Skip to content

Commit

Permalink
Merge pull request #2555 from flant/localize_chaos-engineering
Browse files Browse the repository at this point in the history
[ru] Localize chaos-engineering.md
  • Loading branch information
tym83 authored Apr 1, 2024
2 parents f56ddf3 + 4d5b329 commit c08c2e6
Showing 1 changed file with 30 additions and 0 deletions.
30 changes: 30 additions & 0 deletions content/ru/chaos-engineering.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,30 @@
---
title: Хаос-инженерия
status: Completed
category: concept
tags: ["methodology", "", ""]
---

Хаос-инженерия (_chaos engineering_, CE) — подход, при котором над [распределенной](/distributed-systems/) production-системой проводятся различные эксперименты,
цель которых — убедиться, что она способна противостоять турбулентным и неожиданным ситуациям.

## Какую проблему решает

Практики [SRE](/site-reliability-engineering/) и [DevOps](/ru/devops/) концентрируются на
методах повышения отказоустойчивости и надежности систем.
Способность системы выдерживать сбои, обеспечивая при этом надлежащее качество обслуживания,
как правило, является одним из требований при разработке программного обеспечения.
Перебои в работе (основанного на [микросервисах](/microservices/)) приложения могут быть связаны с различными аспектами:
инфраструктурой, платформой и другими компонентами, которые могут изменяться.
Частое развертывание новых функций в production-окружении повышает вероятность критического инцидента
и простоя со значительными негативными последствиями для бизнеса.

## Как именно решает проблему

Хаос-инженерия помогает удовлетворить требования к живучести систем.
Она используется для проверки устойчивости инфраструктуры, платформ и приложений к сбоям.
В рамках хаос-экспериментов в систему вводятся случайные «поломки», чтобы проверить, способны ли приложение,
инфраструктура или платформа самовосстанавливаться, и убедиться, что сбой не оказывает значимое негативное влияние на потребителей.
Хаос-эксперименты направлены на выявление «слепых зон» (например, в мониторинге или при автомасштабировании)
и на улучшение коммуникаций между командами во время критических инцидентов.
Такой подход позволяет повысить отказоустойчивость сложных систем (в том числе production-уровня) и уверенность команд в них.

0 comments on commit c08c2e6

Please sign in to comment.