Künstliche Intelligenz (KI) wird zunehmend zur Unterstützung des IT-Betriebs eingesetzt, wobei diese Praxis mittlerweile als AIOps bekannt ist. Bei einigen IT-Teams ist AIOps auf erheblichen Widerstand gestoßen, andere konnten sich dafür begeistern. Und was bringt AIOps? Wie können IT-Mitarbeiter und das Unternehmen von diesem Ansatz profitieren?
Lassen Sie uns zunächst mit einem weit verbreiteten Vorurteil aufräumen. Angesichts des disruptiven Charakters der Digitalisierung für andere Arbeitsbereiche sind viele IT-Mitarbeiter verständlicherweise besorgt, dass ihre Jobs mittels AIOps automatisiert und durch Computer ersetzt werden.
Die Botschaft an alle IT-Teams lautet: Ruhe bewahren. AIOps bedeutet nicht, dass die Roboter im Anmarsch sind, um Ihnen den Job wegzunehmen. Ganz im Gegenteil.
AIOps existiert in der einen oder anderen Form schon seit Langem. Vor einigen Jahren hat sich die Bezeichnung „AIOps“ eingebürgert und seither gehört diese Technologie zunehmend zum Portfolio führender Anbieter, darunter auch Juniper Networks. Zu den Grundsätzen des AIOps-Konzepts liegen ausreichend Daten vor und eines ist ganz klar: Die wesentlichen Triebfedern für diesen Ansatz sind Skalierbarkeit bzw. Wachstumsfähigkeit und nicht etwa die Forderung nach Personalkürzungen.
Menschliche Grenzen erkennen
Kein menschliches Gehirn kann unendlich viele Informationen speichern, unzählige Variablen berücksichtigen oder beliebig schnell auf neue Probleme reagieren. Dieser Einschränkung kann man bis zu einem gewissen Punkt durch Neuzugänge und Erweiterungen des Teams entgegenwirken, aber auch das hat seine Grenzen.
Wenn das System einen gewissen Komplexitätsgrad überschritten hat oder sehr schnell wächst, schaffen zusätzliche Arbeitskräfte keine nennenswerte Abhilfe. Eine komplexe IT-Landschaft erfordert Systemdenken und dafür muss man die meisten oder gar alle Variablen bedenken. Bis zu einem gewissen Grad lässt sich das durch eine strikte Aufgabentrennung umgehen, aber letztendlich muss eine Person oder Personengruppe das Gesamtbild sehen und die Zusammenhänge zwischen Ursache und Wirkung erkennen.
Wir abstrahieren komplexe Zusammenhänge, um sie erfassen zu können. Moderne IT-Teams verlassen sich dabei auf Verwaltungsschnittstellen, Automatisierung, Orchestrierung, Visualisierung, Analysen und Berichte. Allerdings erscheinen mehrfach virtualisierte Speicher-, Rechen- und Netzwerkressourcen derart komplex und abstrakt, dass in größeren IT-Organisationen regelmäßig (und zunehmend programmgesteuert) ganze virtuelle Datencenter erstellt und wieder gelöscht werden.
Durch diese mehrschichtige Abstraktion wird die Gefahr von Fehlerkaskaden durch Veränderungen im System verschleiert. Bei aller Abstrahierung der Speicherinfrastruktur können durch bestimmte SAN-Einstellungen dennoch Fehlkonfigurationen entstehen, die den Produktivbetrieb beeinträchtigen.
Diese Probleme werden mit zunehmendem technologischem Reifegrad immer seltener. Wenn sie dann doch auftreten, sind sie umso schwerer nachvollziehbar bzw. so sporadisch, dass sie kaum zu lösen sind.
IT-Teams unterstützen
AIOps-Technologien schließen Wissenslücken, die durch die Abhängigkeit von Verwaltungstools und die damit einhergehende Abstraktion von Komplexitäten, Wachstum und Skalierung entstehen. In der einen oder anderen Form erlernen alle AIOps-Algorithmen den „Normalzustand“ der Systemlandschaft und sind danach in der Lage, auf Anomalien hinzuweisen. In dieser Hinsicht ähneln sie einem herkömmlichen SIEM-System (Security Information & Event Management System).
Allerdings können SIEM-Systeme lediglich erkannte Fehlerzustände melden. Mit AIOps-Lösungen wie dem virtuellen Netzwerkassistenten Marvis von Juniper Networks lassen sich nicht nur auftretende Probleme, sondern auch die zugehörigen Lösungsmethoden nachverfolgen. Der Algorithmus lernt, dass das Fehlverhalten X der Komponente A durch die Lösung Y behoben werden kann. Und dieses Wissen bleibt erhalten, auch wenn das Problem seit Jahren nicht mehr aufgetreten ist.
Auch dieser Ansatz wird schon seit Jahrzehnten erfolgreich angewendet, und zwar in Form von Ticketsystemen. Dafür wird jedoch eine durchsuchbare Datenbasis benötigt und das erfordert die Erstellung relevanter Metadaten, eine semantische Verschlagwortung usw. Das Auffinden der benötigten Daten setzt eine genaue Protokollierung und umfassende Dokumentation von Incident-Tickets voraus und darin sind „menschliche“ Nutzer bekanntermaßen nicht besonders gut.
Im Vergleich dazu sind AIOps-Algorithmen die besten Schriftführer. Wenn sie auf alle Statistiken, Protokolle, Tickets, Hilfeanfragen usw. zugreifen können, die mit einem bestimmten Vorfall zusammenhängen, dann werden diese Daten für immer gespeichert und mit der betreffenden Art von Vorfall in Verbindung gebracht. Bei jeder erkannten Anomalie kann die KI den gesamten Datenbestand nach relevanten Informationen durchsuchen, das Ereignis mit früheren Vorfällen vergleichen und innerhalb kürzester Zeit Lösungsvorschläge unterbreiten.
Wenn das für Sie interessant klingt, dann bleiben Sie dran, denn es wird noch besser.
Mit AIOps die Zukunft verändern
Ein AIOps-Algorithmus, der mit der Zeit aus IT-Vorfällen lernt, wird vermutlich zunehmend leistungsfähiger, aber der Prozess dauert wohl oder übel entsprechend lange. Es ist gemeinhin bekannt, dass KI-Algorithmen mit großen Datenmengen trainiert werden müssen. Wenn man aber mittels AIOps das Problem zu lösen versucht, dass Menschen keine guten Protokollführer sind, dann kann man keine Wunder erwarten, wenn der Algorithmus einfach auf das Ticketsystem angesetzt wird.
Was aber passiert, wenn sich die KI nicht auf die Daten eines Systems beschränken muss, sondern auf das gesammelte Wissen aus ALLEN Unternehmen zugreifen kann? Was wäre, wenn der Anbieter der KI-Lösung den Informationsbestand kontinuierlich erweitert, und das sowohl durch neue, fest einprogrammierte Lösungen für bekannte Probleme als auch durch den Ausbau der angebundenen Wissensdatenbank in Zusammenarbeit mit anderen Unternehmen, die ebenfalls daran interessiert sind, die KI zu verbessern?
Auf einmal wird der Algorithmus exponentiell leistungsfähiger und bietet bewährte Lösungen für ominöse Probleme mit der IT-Infrastruktur, die nicht nur auf internen Daten, sondern auf dem Wissen aller beteiligten Unternehmen basieren. Und wenn das Vertrauen in die Lösung entsprechend hoch ist, lassen sich die Algorithmen so konfigurieren, dass erkannte Fehler ohne jeden Eingriff durch IT-Mitarbeiter automatisch behoben werden.
Kann sich dabei das Team weiterhin seinen Kernaufgaben widmen? Ja. Gleichzeitig werden jedoch unliebsame Arbeiten automatisiert, die niemand besonders gut beherrscht. AIOps ist also kein Codename für Roboter, die uns die Jobs wegnehmen werden. Vielmehr soll uns die Technologie durch die Automatisierung lästiger Aufgaben freispielen, damit das Unternehmen ein größeres, komplexeres und schneller wachsendes Netzwerk verwalten kann, als dies mit ausschließlich menschlichen Arbeitskräften möglich wäre.