Bob Friday, Chief KI Officer von HPE Networking, und ich haben kürzlich an einem Podcast mit Tech Field Day teilgenommen. Die Ausgangsposition des Podcasts lautete: „Datencenter-Netzwerke brauchen KI.“ Dem stimmen wir voll und ganz zu. Bob hat die letzten 10 Jahre als Pionier damit verbracht, AIOps in Unternehmensnetzwerke zu integrieren. Zu Beginn der Diskussion hat er den Weg von HPE Networking zum Self-Driving Network™ beschrieben, eine Vision, die er in seiner jüngsten 6-teiligen Blogserie näher erläutert hat. Anschließend haben wir uns näher mit der Bedeutung der KI für Datencenter-Netzwerke befasst und einige unserer Arbeiten in diesem Bereich vorgestellt. Das werden wir in dieser kurzen, zweiteiligen Blogserie behandeln.
Gibt es ein Problem, das gelöst werden muss?
Die Menschen haben Angst, ihre Netzwerke anzutasten. Es klingt lächerlich, aber die meisten Netzwerktechniker sind vor, während und nach einer Änderung nervös, sei es die Bereitstellung eines neuen Services, ein Firmware-Upgrade o. Ä. Der Prozess ist mühsam und Betreiber befürchten, dass sie das Netzwerk beschädigen könnten, wenn sie etwas ändern.
Das Grundproblem, das dieser Entwicklung bei Datencenter-Netzwerken zugrunde liegt, ist die Komplexität: der Buchstabensalat von Dutzenden von Protokollen, die es zu verstehen gilt, Konfigurationen von vielleicht Tausenden von physischen und logischen Geräten, die Handhabung mehrerer Infrastrukturanbieter. Die Liste ließe sich beliebig fortsetzen. Kombiniert man diese Komplexität mit der unaufhörlichen Datenflut, der die Betreiber ausgesetzt sind, und mit den vielen unzureichenden Tools zur Fehlerbehebung, die heute auf dem Markt sind, sind die Netzwerkteams in Datencentern oft überfordert. Sie versinken in Daten, aber es mangelt ihnen an verwertbaren Einblicken.
Dies ist genau die Art von Situation, in der clevere KI und Algorithmen für maschinelles Lernen nützlich sein können: Berge von Daten, die für den Menschen nur schwer zu durchschauen, aber größtenteils recht gut strukturiert sind.
Es geht nicht um die Technologie, sondern darum, was man braucht
Allzu oft beginnen Diskussionen über Technologie an der falschen Stelle: bei der Technologie selbst. Viele von uns haben diese Anweisung von oben in unseren Unternehmen schon gehört: „Wir als Unternehmen müssen KI nutzen, sonst werden wir abgehängt.“ Oder vielleicht hören Sie es von einem Anbieter: „Sie müssen KI in Ihrem Datencenter-Netzwerk einsetzen.“ Dies sind jedoch planlose Ausgangspunkte. Am Anfang einer jeden Diskussion über Technologie sollte die Frage stehen: Was sind Ihre Ziele? Welche Probleme haben Sie, die gelöst werden müssen?
Unser Ziel war schon immer ganz klar – die bestmögliche Benutzererfahrung zu bieten, egal, ob es sich bei diesen „Benutzern“ um Betreiber von Datencenter-Netzwerken handelt oder um Endbenutzer, die für die von ihnen verwendeten Anwendungen – ob sie es wissen oder nicht – auf das Datencenter angewiesen sind. In den letzten 10 Jahren hat Juniper KI entwickelt und mit großem Erfolg zunächst bei WLAN und dann bei den übrigen Campus- und Zweigstellen-Domänen eingesetzt. Im Datencenter haben wir einen Second-Mover-Wettbewerbsvorteil und können alle Erkenntnisse aus den Erfahrungen auf dem Campus nutzen.
Betriebliche Herausforderungen des Datencenter-Netzwerks
Wenn es darum geht, die Benutzererfahrung zu optimieren, dann müssen die Herausforderungen für die Praktiker im Datencenter in enger Zusammenarbeit mit unseren Kunden gelöst werden. Wir teilen diese Herausforderungen in drei Kategorien ein: begrenzte Einblicke, unzureichende Geschwindigkeit und schlechte Zuverlässigkeit.
- Einblicke. In einem typischen Szenario erhält der Netzwerkverantwortliche eines Unternehmens einen Anruf von einer sehr unzufriedenen Führungskraft, die sich darüber beschwert, dass die CRM-Anwendung, das ERP-System oder eine andere wichtige Anwendung ausgefallen ist. Es muss am Netzwerk liegen, oder? Nun, nicht unbedingt. Oft haben Netzwerkteams nur einen begrenzten Einblick in die Anwendungen, die über ihr Netzwerk laufen. Aber eins ist klar: Der Sinn eines Datencenters besteht darin, Anwendungen zu hosten und bereitzustellen, die die Endbenutzer benötigen, ganz gleich, ob es sich um etwas relativ Banales für einen Verbraucher oder eine geschäftskritische Anwendung für ein Unternehmen handelt.
- Geschwindigkeit. Ein weiteres Problem, das wir sehen, ist unzureichende Geschwindigkeit oder Agilität bei der Verwaltung der IT-Infrastruktur. Wenn eine dringende neue Geschäftsanforderung auftaucht, wie z. B. eine schnelle Kapazitätserweiterung für eine unvorhergesehene Nachfragespitze, reichen die standardmäßigen Änderungsmanagementprozesse oder Wartungsfenster eines Unternehmens nicht aus – der Prozess ist nicht schnell genug oder zu starr.
- Zuverlässigkeit. Schließlich sind mangelnde Zuverlässigkeit und Ausfallzeiten ein anhaltendes Problem. Fast jedes Unternehmen kann durch eine einzige hastige Änderung oder einen manuellen Konfigurationsfehler das gesamte Netzwerk zum Erliegen bringen, was enorme Auswirkungen auf den Ruf und die Finanzen des Unternehmens hat. Ganz zu schweigen von den negativen Auswirkungen auf Ihre Karriere. Ohne eine schnelle, ausfallsichere automatische Wiederherstellung und ein Rollback kann es Stunden oder Tage intensiver Arbeit erfordern, bis die Dienste wiederhergestellt sind. Betreiber von Datencenter-Netzwerken befinden sich allzu oft im reaktiven Modus, in dem sie sich ständig mit diesen Notfällen auseinandersetzen, anstatt sich auf proaktive strategische IT-Initiativen zu konzentrieren, die das Unternehmen weiterbringen.
Bevor wir uns blindlings auf KI als Allheilmittel stürzen, müssen wir diese Probleme gründlich verstehen und uns fragen, ob KI zu ihrer Lösung beitragen kann. Die Antwort lautet: Ja, absolut.
KI ist notwendig, aber nicht ausreichend
KI kann jedoch nicht jedes NetOps-Problem lösen. KI ist notwendig, aber nicht ausreichend. Wir brauchen Systeme, die sowohl die grundsätzlich probabilistische KI als auch andere deterministische Ansätze wie Intent-based Networking nutzen.
Ist es in Ordnung, bei einer Konfiguration zu 99 % richtig zu liegen? Nein – man will zu 100 % richtig liegen, was eine regelbasierte, deterministische Software erfordert. Aber an Tag 2, wenn das Datencenter unter realen Bedingungen in unvorhersehbaren Umgebungen arbeitet, sieht die Rechnung anders aus. Wenn ein System Ihnen auf der Grundlage einer Vielzahl von Symptomen mit 99-prozentiger Genauigkeit die Grundursache eines Problems nennen kann, dann ist das eine Lösung, die wahrscheinlich besser ist als das, was Sie heute haben. Und genau darin liegt die Stärke der KI: riesige Datenmengen zu sichten und Zusammenhänge zu erkennen, die Menschen nicht so einfach herstellen können.
Kombinieren Sie die beiden Technologien, KI und Intent-based Networking, können Sie eine unschlagbare Erfahrung für Netzwerkbetreiber und Endbenutzer bieten.
Im zweiten und letzten Teil dieser Blogserie gehen wir genauer darauf ein, wie wir mithilfe von AIOps hartnäckige Herausforderungen bei Datencenter-Netzwerken lösen.