Heutige Systeme stehen vor großen Herausforderungen: hohe Latenzen, Ausfälle von Komponenten und unerwartetes Nutzerverhalten führen zu unvorhersehbaren Effekten. Schnell kommt es dabei zu Ausfällen, die im schlimmsten Fall zu Kaskadeneffekten führen und das ganze System zum Erliegen bringen können. Frustrierte Nutzer, gestresste Mitarbeiter und nicht zuletzt Umsatzeinbußen sind die Folge. Diese Herausforderung stellt sich ganz besonders im Zuge einer Cloud-Migration.
Mit Maßnahmen wie Timeouts, Circuit Breakers, Retries and Fallbacks lässt sich zwar in vielen Fällen das Schlimmste verhindern. Doch sind diese Mechanismen schwer zu konfigurieren und deren Effektivität schwer zu evaluieren. Mit Chaos Engineering wird versucht, durch zufällige Verhaltensmuster möglichst viele potentielle Fehlerszenarien zu testen. Doch ist dieses Verfahren in der Regel sehr unspezifisch und ineffizient.
Mittels Observability und Application Performance Monitoring (APM) werden Metriken und Architekturinformationen erfasst, die ebenso dazu geeignet sind, mögliche Flaschenhälse und Risikopotentiale zu finden und an diesen Stellen gezielt Experimente durchzuführen. Dies ist erheblich effizienter, als das System randomisiert auf Schwachstellen abzutasten und führt zu relevanteren und schnelleren Tests zur Widerstandsfähigkeit bzw. Resilienz des Systems. Ein Experiment ist dann erfolgreich, wenn es den Verdacht bestätigt und möglichst viele Schwachstellen exponiert. Im Gegenzug erhält man einen zusätzlichen Feedback-Kanal für die Qualität des APMs.
Erfahren Sie in unserem kostenfreien Webinar, wie Sie moderne Systeme auf Ihre Widerstandsfähigkeit und Ausfallsicherheit testen und damit die Stabilität Ihrer Systeme erhöhen können. Wir beleuchten dieses komplexe Themenfeld nicht nur aus Sicht unserer praktischen Expertise, sondern gehen auch auf Erkenntnisse aus der aktuellen Forschung ein.
Was lernen Sie im Webinar?
- Was bedeutet eigentlich Resilience? Wie unterscheidet es sich von Zuverlässigkeit und Robustheit?
- Warum brauchen wir Resilience Engineering?
- Was ist Resilience Engineering?
- Wie hängt es mit Chaos Engineering zusammen?
- Was sind aktuelle Grenzen?
- Wie kann Resilience Engineering effizienter gestaltet werden durch:
- Architektur- und Risikoanalysen
- Observability bzw. Application Performance Management (APM)
- Maschinelles Lernen
Unsere Trainer

