Le recours à l’intelligence artificielle (IA) en appui des équipes IT opérationnelles ne cesse de gagner du terrain. Cette pratique, communément appelée AIOps, s’est heurtée à une forte résistance de la part de certains professionnels IT, tandis que d’autres l’ont adoptée avec enthousiasme. Alors de quoi s’agit-il ? Et surtout, quels sont les avantages de l’AIOps pour l’entreprise et les équipes IT ?
Commençons par déconstruire un préjugé tenace. Voyant l’effet disruptif de la digitalisation dans d’autres métiers, certaines équipes IT redoutent que l’AIOps ne les mettent au chômage en les remplaçant par des machines.
Même si ces inquiétudes peuvent se comprendre, je m’adresse à toutes les équipes IT : n’ayez pas peur. L’AIOps ne déploie pas des armées de robots pour vous prendre votre travail. Bien au contraire.
L’AIOps existe depuis des années, sous une forme ou sous une autre. Il a reçu son nom de baptême il y a quelques années et depuis, il commence à s’imposer dans le portefeuille des grands acteurs de la tech, à commencer par Juniper. L’origine et la raison d’être de l’AIOps sont bien documentées : l’engouement est très clairement associé à la volonté de gérer l’expansion et la croissance rapides des environnements IT. Son ambition n’est pas de tailler dans les effectifs. Voilà qui est dit.
Les limites de l’humain
Chacun d’entre nous a une capacité limitée d’assimilation de l’information, notamment dans le nombre de variables que nous pouvons suivre simultanément et notre réactivité face aux nouveaux problèmes. Jusqu’à un certain point, on peut repousser les limites des individus en agrandissant l’équipe. Mais seulement jusqu’à un certain point.
Arrivé à un certain degré de complexité (ou de croissance) d’un système, l’augmentation des effectifs ne sert plus à rien. Car l’informatique nécessite une approche systémique, qui passe par la capacité de mémoriser la plupart, voire toutes les variables. On peut à la rigueur contourner le problème en fractionnant les équipes par domaine de responsabilité. Mais au final, collectivement ou individuellement, il faut bien que quelqu’un dispose d’une vision globale et cerne les interdépendances de chaque variable.
Lorsque la complexité dépasse un certain stade, on fait appel à l’abstraction. C’est ainsi que les interfaces de gestion, l’automatisation, l’orchestration, la visualisation, les analyses et les rapports sont devenus les meilleurs alliés des équipes IT d’aujourd’hui. Les complexités du stockage, du calcul et des fonctionnalités réseau ont toutes été abstraites sous forme de virtualisations à des degrés variables. À tel point que les grandes équipes IT vont jusqu’à créer et décommissionner régulièrement des datacenters virtuels entiers, et de plus en plus dans un cadre programmatique.
Le problème de ces couches d’abstraction, c’est qu’elles masquent les effets en cascade des modifications apportées au système. Vous pouvez abstraire votre stockage tant que vous voulez, mais le SAN n’est jamais à l’abri d’un dysfonctionnement, avec des conséquences négatives sur la production.
Certes, plus nos technologies mûrissent, plus ces problèmes se font rares. Mais lorsqu’ils se produisent, leur origine est encore plus difficile à cerner, sachant qu’un problème peu fréquent est toujours plus difficile à résoudre.
L’AIOps en renfort des équipes IT
Les technologies AIOps comblent l’écart de connaissances qu’introduisent nos outils de gestion lorsqu’ils nous rendent dépendants de l’abstraction, elle-même introduite en réponse aux problèmes de complexité, de croissance et/ou d’évolutivité. Par une méthode ou une autre, toutes les IA de l’AIOps apprennent à quoi ressemble un statut « normal » et s’inquiètent lorsqu’une situation paraît anormale. En ce sens, elles ressemblent fort à un système de gestion des événements et des informations de sécurité (SIEM).
En revanche, là où les SIEM se bornent à envoyer des alertes après un incident, les produits AIOps en général, et l’assistant réseau virtuel Marvis de Juniper Networks en particulier, conservent une trace non seulement de l’incident, mais aussi de la manière dont le problème a été résolu. Ils apprennent que si A se comporte comme X, alors l’application de la solution Y résout le problème. Et ils s’en souviennent même si l’événement ne se reproduit pas avant plusieurs années.
Là encore, les équipes IT pratiquent ainsi depuis des décennies au moyen de systèmes de tickets. Malheureusement, ces systèmes s’articulent autour d’une fonction de recherche, qui requiert donc des métadonnées appropriées, un balisage sémantique, etc. Par conséquent, trouver les données recherchées dépend intégralement de la précision avec laquelle la personne consigne les informations et du niveau de détail du ticket sur l’incident précédent. Or, les humains sont notoirement médiocres en documentation.
Les IA de l’AIOps, elles, excellent dans ce domaine. Si elles ont accès à la totalité des statistiques, journaux, tickets, demandes d’aide et autres informations associés à un incident donné, elles peuvent enregistrer toutes ces données comme étant liées à ce type particulier d’incident pour l’éternité. Dès qu’un événement sort de la norme, l’IA peut passer en revue tout ce qu’elle a appris, vérifier si ce nouvel événement s’apparente de près ou de loin à des incidents antérieurs, puis fournir aux équipes IT des éclairages pour une résolution rapide.
Si ce genre de choses vous intéresse, alors lisez ce qui va suivre, parce que c’est là que ça devient fascinant.
L’avenir de l’AIOps
Si une IA de l’AIOps se forme progressivement à partir des événements gérés par votre équipe IT, on peut en conclure qu’elle deviendra de plus en plus efficace au fil de son apprentissage. Mais en parallèle, on peut aussi craindre qu’il lui faille beaucoup de temps pour en arriver là. Il est de notoriété publique que les IA doivent s’entraîner sur des jeux de données volumineux. Mais si on part de l’idée que les humains ne savent pas bien documenter les événements, il serait saugrenu d’attendre des miracles de l’AIOps en entraînant l’IA sur le système de tickets tel qu’il est.
Et si on ne limitait pas l’IA à votre seule entreprise ? Et si l’IA apprenait de TOUTES les entreprises ? Et si le fournisseur de cette IA l’alimentait constamment en données, avec des solutions codées en dur aux problèmes connus, mais aussi avec la force collective d’entreprises acceptant de participer à l’amélioration de l’IA pour enrichir sa base de connaissances ?
Tout à coup, les capacités de l’IA progressent à un rythme exponentiel. Les équipes IT n’ont plus seulement accès aux solutions aux problèmes obscurs d’infrastructure rencontrés uniquement dans leur entreprise, mais aussi à ceux de toutes les entreprises participantes. Et une fois un certain seuil de confiance franchi, ces IA peuvent même appliquer automatiquement le correctif, sans intervention humaine.
Est-il question d’exécuter des tâches qui incombaient auparavant aux équipes IT ? Absolument. Mais elles ne font qu’automatiser les aspects du métier qui, de toute façon, nous rebutent tous et pour lesquels nous sommes notoirement médiocres. L’AIOps n’est pas un mot tendance inventé pour masquer sa soi-disant vocation à nous remplacer par une armée de robots. Le terme qualifie des produits qui nous libèrent des tâches rébarbatives de notre quotidien et donnent aux entreprises les moyens de gérer des réseaux encore plus étendus, complexes et dynamiques, bien au-delà des capacités intellectuelles et cognitives de l’humain.