«Хаос-інжиніринг» — сучасний посібник, що пояснює, як тестувати стійкість систем шляхом контрольованого внесення збоїв. Це ключова методика для компаній, які працюють із високонадійними сервісами, хмарною інфраструктурою та мікросервісами.
Основні теми:
- принципи хаос-інжинірингу та fault injection;
- виявлення слабких місць у складних системах;
- експерименти з відмовами: мережа, затримки, ресурси, падіння вузлів;
- каскадні збої та способи їх запобігання;
- інструменти: Chaos Monkey, Gremlin, Litmus, Chaos Mesh;
- побудова стійких архітектур і протоколів відновлення.
Це must-have для DevOps-інженерів, SRE, архітекторів та команд, що прагнуть безвідмовності та стабільності сервісів.