J’ai récemment participé, aux côtés de Bob Friday, directeur de l’IA chez HPE Networking, à un podcast avec Tech Field Day. Le sujet était « Les réseaux de datacenters ont besoin de l’IA », une affirmation avec laquelle nous sommes entièrement d’accord. Bob, pionnier de l’intégration de l’AIOps aux réseaux depuis dix ans, a lancé la discussion en présentant le parcours de HPE Networking vers le réseau autonome (Self-Driving Network™), une vision qu’il a détaillée dans une série de 6 articles sortie il y a peu. Nous avons ensuite exploré l’IA pour les réseaux de datacenters et exposé certains de nos travaux en la matière. Ce sera donc le sujet principal de cette courte série de deux articles.
Quel est le problème à résoudre ?
Les équipes techniques hésitent à modifier leurs réseaux. Cela peut paraître absurde, mais la plupart des ingénieurs réseau sont nerveux avant, pendant et après un changement, qu’il s’agisse du provisionnement d’un nouveau service ou de la mise à jour d’un firmware. Ce processus est stressant et les opérateurs redoutent que la moindre action sur le réseau ne le perturbe.
La réalité derrière cette inquiétude, c’est que les réseaux de datacenters sont souvent très complexes. Les techniciens doivent gérer des dizaines de protocoles différents, configurer des milliers d’équipements physiques et logiques et coordonner plusieurs fournisseurs en même temps. Et ça ne s’arrête pas là. Ajoutez à ce cocktail explosif un flux constant de données et des outils de dépannage peu performants, et vous obtenez des équipes réseau incapables de garder la tête hors de l’eau. À terme, elles croulent sous les données, mais manquent de solutions concrètes.
C’est exactement dans ce genre de cas qu’une IA avancée et des algorithmes de machine learning trouvent leur utilité : face à des volumes massifs de données trop complexes à analyser manuellement, mais généralement très bien organisées.
La technologie doit servir vos besoins, pas l’inverse
Bien trop souvent, la technologie prend le pas sur les vrais objectifs. On entend souvent cette phrase dans les plus hautes sphères des entreprises : « Nous devons absolument utiliser l’IA pour ne pas nous laisser distancer ». Ou même dans la bouche d’un fournisseur : « Votre réseau de datacenter doit intégrer l’IA ». Mais ces approches sont vouées à l’échec. Une discussion autour de la technologie doit d’abord poser la question suivante : quels sont vos objectifs et quels problèmes cherchez-vous à résoudre ?
Notre objectif a toujours été le même : offrir la meilleure expérience possible à chaque utilisateur, qu’il s’agisse d’un opérateur réseau ou de l’utilisateur final, conscient ou non que les applications qu’il utilise dépendent du datacenter. Depuis dix ans, Juniper développe et intègre l’IA avec succès, d’abord dans ses solutions Wi-Fi, puis pour tous les campus et sites distants. Malgré notre arrivée tardive dans le secteur des datacenters, nous avons un avantage de taille : notre vaste expérience avec les campus.
Opérations de datacenter : des défis de taille
Si l’objectif est d’optimiser l’expérience utilisateur, relever les défis des réseaux de datacenters exige une collaboration étroite avec nos clients. Nous regroupons ces défis en trois catégories : visibilité limitée, vitesse insuffisante et manque de fiabilité.
- Visibilité. Imaginons la scène : le responsable réseau d’une entreprise reçoit l’appel d’un cadre furieux. Le CRM, l’ERP ou une autre application critique est hors service. Le coupable ? Le réseau, évidemment. Eh bien… pas forcément. Souvent, les équipes réseau disposent d’une visibilité limitée sur les applications transitant par leur réseau. Mais soyons clairs : la raison d’être d’un datacenter, c’est d’héberger et de fournir les applications dont les utilisateurs finaux ont besoin, qu’il s’agisse d’un service grand public peu important ou d’une application métier absolument critique.
- Rapidité. La seconde difficulté tient au manque de réactivité et d’agilité dans la gestion de l’infrastructure IT. Face à des besoins métiers urgents, comme la nécessité d’augmenter rapidement la capacité pour répondre à un pic d’activité inattendu, les processus habituels se révèlent inadaptés. Les protocoles de gestion des changements et les fenêtres de maintenance existants sont trop rigides et trop lents pour répondre efficacement à ces situations.
- Fiabilité. Enfin, le manque de fiabilité et les temps d’arrêt restent une préoccupation majeure. Il suffit souvent d’un changement précipité ou d’une erreur de configuration manuelle pour mettre tout le réseau à l’arrêt, avec des conséquences financières et réputationnelles considérables pour l’entreprise… sans parler de l’impact sur votre carrière. Sans mécanismes rapides et fiables pour automatiser le retour arrière et la restauration, il peut falloir des heures, voire des jours de travail acharné pour rétablir les services. Les opérateurs réseau doivent trop souvent réagir en mode pompier au lieu de se concentrer sur des initiatives informatiques stratégiques qui ont une réelle utilité pour l’entreprise.
Avant d’adopter l’IA comme solution miracle, nous devons nous pencher sur ces problèmes pour mieux les comprendre, et nous demander si l’IA peut réellement les résoudre. La réponse est oui, sans aucun doute.
L’IA est nécessaire, mais pas suffisante
L’IA ne peut pas résoudre tous vos problèmes NetOps. Elle est nécessaire, mais elle ne suffit pas. Nous avons besoin de systèmes qui combinent l’IA, fondamentalement probabiliste, avec des approches déterministes, comme les réseaux basés sur l’intention.
Faut-il se contenter de 99 % de bonnes configurations ? Non, vous devez viser un niveau de précision à 100 %. Et pour cela, il vous faut un logiciel basé sur des règles strictes et déterministes. Cependant, dans un datacenter confronté à des conditions variables et imprévisibles, la réalité est différente. Un système qui identifie la cause racine d’un problème avec 99 % de certitude, en analysant de nombreux indicateurs, est généralement plus efficace que les solutions que vous utilisez actuellement. C’est là que l’IA excelle, car elle traite d’énormes volumes de données pour trouver des corrélations qui échappent à l’analyse humaine.
Combinez ces deux technologies, à savoir l’IA et les réseaux basés sur l’intention, pour offrir aux utilisateurs finaux une expérience réseau et applicative inégalée.
Dans la deuxième et dernière partie de cette série, nous verrons comment l’AIOps résout les problèmes persistants des réseaux de datacenters.