Par Guy Grieve, LogPoint Presales Manager, EMEA
Une différence clé entre l’ordinateur et les humains est que l’humain apprend de ses expériences passées, ou du moins nous prétendons que c’est effectivement le cas. Les machines, en revanche, ont besoin d’instructions strictes et doivent savoir exactement quoi faire et comment le faire, en s’appuyant sur ce qu’elles ont déjà réalisé. Le Machine Learning (apprentissage automatique) élargit les possibilités d’action des machines.
Qu’est-ce que le Machine Learning ?
L’apprentissage automatique est un sous domaine technologique au sein de l’intelligence artificielle (IA). Une définition simple de l’IA et du Machine Learning est un ordinateur qui tente d’exécuter des tâches et des missions aussi proches que possible de la manière de faire d’un être humain. Les missions et les tâches consistent non seulement à répondre comme un humain, mais aussi à se souvenir des expériences précédentes. La machine utilise la compréhension des ensembles de données (datasets) précédents et fournit une réponse en constante évolution, fiable et rapide.
Cependant, nous attendons souvent toujours plus du Machine Learning. Alors que ce dernier a fait progresser notre vie, constamment en mouvement et axée sur la technologie, à pas de géant sans que nous nous en rendions compte, le Machine Learning n’est pas une solution miracle pour mettre fin à la faim dans le monde et apporter une réponse à tous les maux de l’univers. Il est simplement là pour remplacer nos tâches répétitives, chronophages et fastidieuses. Au lieu d’utiliser des commandes statiques préprogrammées pour fournir des résultats, il adopte une approche dynamique pour comprendre le contexte afin de pouvoir fournir des informations précises, aidant ainsi à définir ce qui est normal et ce qui est anormal. Bien sûr, au cours de ces tâches, il peut détecter une anomalie qu’un humain n’a pas vue. L’apprentissage automatique peut traiter les données à une vitesse beaucoup plus élevée, avec une plus grande précision que nous. En effet, les simples humains que nous sommes ne pourraient jamais passer au crible des données sur une plateforme d’analyse ou via une feuille de calcul sans succomber rapidement à la fatigue et à l’ennui.
Il existe souvent deux catégories d’algorithmes d’apprentissage automatique, supervisés ou non. Bien qu’il semble qu’elles soient très similaires, il existe de légères différences entre les deux technologies. Explorons donc ensemble ces deux catégories.
Machine Learning supervisé
Dans le Machine Learning supervisé, l’ordinateur apprend par l’exemple. Un exemple est un ensemble spécifique de données conçu pour entraîner le système et connu sous le nom de «training dataset», et associé à un certain contexte, comme par exemple ce qui est correct et ce qui ne l’est pas. Le ML supervisé continue d’apprendre des données précédentes, en appliquant l’apprentissage aux données actuelles pour prédire les événements futurs. Dans ce cas, les données d’entrée et de sortie souhaitées aident à la prédiction d’événements futurs. Bien sûr, le Machine Learning supervisé a traditionnellement un «superviseur», sous la forme d’une interaction humaine par exemple. Le superviseur guide et corrige les résultats, «approuvant» essentiellement ce que les algorithmes et les données ont initialement prédit.
Imaginez le Machine Learning supervisé comme une piste de bowling et le superviseur comme une barrière de protection. Dans un premier temps, la barrière a son utilité et jouent même souvent un rôle dans le jeu. Mais, avec le temps, le besoin de cette protection diminue.
Supervised machine learning algorithms ingests labelled data in conjunction with a training dataset and a desired output from a supervisor in order to understand how to categorize the data in the future.
Machine Learning non supervisé
Les algorithmes de Machine Learning non supervisés sont, en revanche, nécessaires lorsque les informations utilisées pour entraîner le système ne sont ni classées ni labélisées. En l’absence d’ensembles de données d’entraînement, nous alimentons tout simplement les algorithmes de ML non supervisés avec une énorme quantité de données et leur permettons de comprendre et d’interpréter les informations sans interaction humaine.
Comme mentionné précédemment, le Machine Learning n’est pas une solution miracle. L’idée est d’exposer les algorithmes à de grandes quantités de données et de leur permettre de suivre un parcours d’apprentissage allant de l’inconnu à l’identification de modèles. Dans le ML non supervisé, il n’y a pas nécessairement de résultats prédéfinis ou statiques, tels que vrai ou faux et oui ou non, comme c’est le cas pour le Machine Learning supervisé. Le modèle non supervisé nous fournit des informations sur ce qui peut être potentiellement intéressant, ce qui est différent, une anomalie ou une valeur aberrante.
En utilisant la même métaphore de la piste de bowling, au lieu des barrières de protection le long de la piste, les données que nous fournissons sont comme un manuel des différentes techniques de bowling que la machine doit lire dans le but qu’elle apprenne par elle-même avant de lancer la boule.
Les algorithmes de Machine Learning non supervisés s’entraînent sans supervision pour comprendre les données brutes et non labélisées afin de découvrir des modèles non identifiés, des anomalies et de catégoriser les données.
Exemples de Machine Learning dans votre vie quotidienne
Maintenant que nous comprenons un peu mieux le fonctionnement du Machine Learning à un niveau plus élevé, nous pouvons reconnaître et comprendre comment certains aspects de notre vie quotidienne utilisent cette technologie.
Un exemple classique utilisé pour montrer comment le ML est utilisé au quotidien est le fil d’actualité sur les réseaux sociaux. Si vous arrêtez de faire défiler le contenu au niveau de la publication de votre ami ou d’une information particulière, les algorithmes reconnaissent cette action, apprennent et vous fourniront à l’avenir encore plus de contenu du même type ou du même ami.
Bien sûr, les réseaux sociaux sont un exemple parmi tant d’autres que nous pourrions passer des jours à énumérer, tels que la protection contre la fraude de votre banque, l’analyse de votre panier, la détection de spam par email et même la reconnaissance faciale de votre téléphone que vous avez utilisée pour ouvrir votre téléphone et lire cet article.
Le Machine Learning à des fins de cybersécurité
En découvrant comment le Machine Learning peut avoir un impact positif sur vous personnellement, nous pouvons commencer à réfléchir à la manière dont le ML peut être mis en œuvre au sein de votre entreprise à des fins de sécurité et de prévention des menaces.
Pour commencer, nous avons besoin principalement de données à analyser. Les entreprises produisent une énorme quantité de données de sécurité et opérationnelles, faisant ainsi de l’outil centralisé d’analyse SIEM (Security Information and Event Management) une solution idéale pour renforcer le ML. Chez LogPoint, nous utilisons le Machine Learning pour analyser le comportement des utilisateurs.
Lorsque vous fournissez un ensemble de données volumineux à des algorithmes de ML, tels que la solution UEBA (User Entity and Behavior Analytics) de LogPoint, vous pouvez comprendre simplement ce qui est normal et ce qui ne l’est pas. Fournir des informations exploitables, utilisables et pertinentes est essentiel pour vous permettre de détecter ce qui est peut-être passé inaperçu. L’identification des inconnues vous permet de réagir, d’investiguer et de mitiger rapidement.