Pourriez-vous vivre sans le Machine Learning ?

Quand on y pense :

Vous vous imaginez avant que le Machine Learning ne soit arrivé dans votre vie ?

Les changements apportés jusqu'à présent sont énormes !

Au sommaire :

Google et le Machine Learning

L’immense majorité des gens se tourne généralement vers les moteurs de recherche, comme Google, pour obtenir un large éventail d'informations et de réponses.

Que fait ce moteur de recherche ?

Il recueille toutes les informations basées sur votre requête de recherche. Et il vous présente les résultats les plus pertinents.

Franchement ?

Sans Google ou Bing, la tâche serait fastidieuse, car il vous faudrait parcourir des dizaines ou des centaines de livres et d'articles, vous êtes d’accord ?

C’est tout le travail de l’apprentissage automatique qui simplifie cette tâche auparavant assommante.

Reconnaissance vocale et visuelle

Il y a fort longtemps, dans une lointaine galaxie…

La reconnaissance vocale et visuelle n'était qu'un concept montré dans les films de SF. Le Machine Learning l'a rendue possible aujourd'hui.

D’ailleurs, savez-vous que vous l’utilisez peut-être à votre avantage bien plus souvent que vous ne pensez ?

Par exemple, Facebook reconnaît automatiquement les personnes présentes sur une photo et les étiquette pour vous, ce qui vous fait gagner beaucoup de temps. Ou alors votre smartphone qui est capable de retrouver un chien parmi toutes vos photos…

Sans le Machine Learning, Siri, Cortana ou Iris ne seraient pas en mesure de répondre à vos questions en temps réel.

Qu’est-ce que le Machine Learning ?

En une phrase ?

Le Machine Learning ou apprentissage automatique est un terme générique désignant un ensemble de techniques et d'outils qui aident les ordinateurs à apprendre et à s'adapter par eux-mêmes.

Les algorithmes d'apprentissage automatique aident des machines à apprendre en partie par elles-mêmes. Elles peuvent prédire et exécuter des tâches sur la base du ou des modèles appris.

Grâce à l'apprentissage automatique, notre monde a vu naître des systèmes qui facilitent le travail humain.

Le Machine Learning : comment ça marche ?

La tâche consistant à conférer de l'intelligence aux machines peut être décomposée en 7 étapes majeures :

1. Collecte de données :

Comme vous le savez, les machines apprennent initialement à partir des données que vous leur fournissez.

Attention :

Vous devez disposer de données fiables afin que votre modèle d'apprentissage automatique puisse trouver les bons spécimens. La qualité des données que vous fournissez à la machine déterminera la précision de votre modèle.

Si vous disposez de données incorrectes ou périmées, vous obtiendrez des résultats erronés ou des prédictions qui ne sont pas adéquates.

Qu’est-ce que de bonnes données ?

Elles sont pertinentes, contiennent très peu de valeurs manquantes et répétées, et présentent une bonne représentation des différentes sous-catégories/classes présentes.

2. Préparation des données :

Une fois que vous avez vos données, vous devez les préparer. Vous pouvez le faire en :

  • Rassemblant toutes les données que vous avez et en les rendant aléatoires. Cela permet de s'assurer que les données sont réparties de manière homogène et que l'ordre n'affecte pas le processus d'apprentissage.
  • Nettoyant les données pour supprimer les valeurs indésirables ou manquantes, les lignes et les colonnes, les valeurs en double, la conversion des types de données, etc. Vous devrez peut-être même restructurer l'ensemble de données et modifier les lignes et les colonnes ou l'index des lignes et des colonnes.
  • Visualisant les données pour comprendre comment elles sont structurées et comprendre la relation entre les différentes variables et classes présentes.
  • Divisant les données nettoyées en deux ensembles : un ensemble d'apprentissage et un ensemble de test. L'ensemble d’apprentissage est celui à partir duquel votre modèle apprend. Un ensemble de test est utilisé pour vérifier la précision de votre modèle après la formation.

3. Choix d'un modèle :

Un modèle de Machine Learning détermine les résultats que vous obtenez après avoir exécuté un algorithme sur les données collectées.

Les algorithmes les plus couramment utilisés sont les suivants :

  • forêts aléatoires,
  • arbres de décision,
  • régression linéaire,
  • boosting de gradient,
  • régression logistique,
  • algorithme de Naïve Bayes,
  • machine à vecteurs de support (SVM),
  • algorithme K-NN (k-Nearest Neighbors)…

Il est important de choisir un modèle pertinent pour la tâche à accomplir.

Au fil des ans, les scientifiques et les ingénieurs ont développé divers modèles adaptés à différentes tâches, comme la reconnaissance vocale, la reconnaissance d'images, la prédiction, etc.

Un dernier détail :

Vous devez également déterminer si votre modèle est adapté aux données numériques (ici les données d’entrées sont des chiffres) ou catégorielles (là il s’agit de lettres ou d’images) et choisir en conséquence.

4. Entraînement du modèle :

La formation est l'étape la plus importante du Machine Learning.

Lors de la formation, vous transmettez les données préparées à votre machine d'apprentissage automatique pour qu'elle trouve des « patterns » ou schémas répétitifs, ou des caractéristiques et fasse des prédictions.

Comment ?

Les paramètres sont les variables du modèle définies par le programmeur. La précision sera maximale avec une valeur particulière d’un de vos paramètres. Le réglage des paramètres consiste à trouver ces valeurs.

Elle apprend de cette façon à partir des données pour pouvoir accomplir la tâche qui lui a été confiée.

En fonction de l’algorithme choisi, les hyperparamètres vont être ajustés au fur et à mesure de cet apprentissage.

5. Évaluation du modèle :

Après avoir formé votre modèle, vous devez vérifier ses performances.

Pour ce faire, vous testez les performances du modèle sur des données inédites.

Si le test est effectué sur les mêmes données que celles utilisées pour l’entraînement, vous n'obtiendrez pas une mesure précise. Car votre modèle est déjà habitué aux données et y trouve les mêmes caractéristiques que précédemment.

Lorsqu'il est utilisé sur des données de test, vous obtenez une mesure précise de la performance et de la vitesse de votre modèle.

6. Ajustement des paramètres :

Une fois que vous avez créé et évalué votre modèle, voyez si sa précision peut être améliorée d'une quelconque manière.

Pour ce faire, ajustez les paramètres présents dans votre modèle.

Ensuite, vous réentraînez votre modèle jusqu’au résultat souhaité.

7. Faire des prédictions :

Enfin, vous pouvez utiliser votre modèle sur des données non observées pour faire des prédictions précises.

Un exemple concret regroupant ces étapes ?

Considérons un système dont les données d'entrée contiennent des photos de différentes sortes de fruits. Vous souhaitez que le système regroupe les données en fonction des différents types de fruits.

Tout d'abord, le système va analyser les données d'entrée. Ensuite, il essaie de trouver des modèles, comme les formes, la taille et la couleur.

Sur la base de ces modèles, le système va essayer de prédire les différents types de fruits et de les séparer.

Enfin, il garde trace de toutes les décisions prises au cours du processus pour s'assurer qu'il apprend.

La prochaine fois que vous demanderez au même système de prédire et de séparer les différents types de fruits, il n'aura pas à repasser par tout le processus.

C'est ainsi que fonctionne le Machine Learning.

Combien y a-t-il de Machine Learning ?

Bonne question !

Car il existe plusieurs « familles » de Machine Learning :

  • Avec apprentissage supervisé.
  • Avec apprentissage non-supervisé.
  • Avec apprentissage par renforcement.

Apprentissage supervisé

L’apprentissage supervisé utilise des données étiquetées (des exemples labellisés) pour former des modèles d’apprentissage automatique.

Dans les données étiquetées, le résultat est déjà connu. Le modèle a juste besoin de faire correspondre les entrées aux résultats respectifs.

Cette méthode a besoin d’une supervision externe pour former des modèles d’apprentissage automatique. D’où le nom de supervisé. Ces machines ont besoin d’être guidée avec des informations supplémentaires pour obtenir le résultat souhaité.

Regardez :

Si vous devez former un modèle ou un système avec vision par ordinateur pour reconnaître une pomme.

Tout d’abord, vous devez fournir un ensemble de données contenant des images d’un type de fruit, par exemple des pommes.

Ensuite, vous fournissez un autre ensemble de données qui permet au modèle de savoir qu’il s’agit d’images de pommes.

Ensuite, fournissez un nouvel ensemble de données contenant uniquement des images de pommes. À ce stade, le système peut reconnaître le fruit en question et s’en souviendra.

C’est ainsi que fonctionne l’apprentissage supervisé. Vous entraînez le modèle à effectuer une opération spécifique par lui-même.

Où trouverez-vous des machines avec apprentissage supervisé ?

Elles sont généralement utilisées pour résoudre des problèmes de classification et de régression.

Parmi leurs principales applications, vous trouverez :

  • le traitement automatique du langage,
  • les prévisions météorologiques,
  • l’analyse du cours des actions,
  • la reconnaissance vocale,
  • la vision par ordinateur,
  • la bio-informatique…

Existe-t-il du Machine Learning sans supervision ?

Oui. Et vous allez découvrir que cela fonctionne plutôt bien…

Apprentissage non-supervisé

L’apprentissage non-supervisé utilise des données non étiquetées (des exemples non labellisés) pour former des machines.

Les données non étiquetées n’ont pas de variable de sortie fixe. Le modèle apprend à partir des données, découvre les modèles et les caractéristiques dans les données, et renvoie le résultat.

Comment fonctionne-t-il ?

L’apprentissage non supervisé trouve des modèles et comprend les tendances dans les données pour découvrir le résultat. Ainsi, le modèle tente d’étiqueter les données en fonction des caractéristiques des données d’entrée.

Le processus de formation utilisé dans les techniques d’apprentissage non-supervisé ne nécessite aucune supervision pour construire des modèles. Ils apprennent par eux-mêmes et prédisent les résultats.

L’apprentissage non-supervisé permet aux systèmes d’identifier, à l’aide d’algorithmes d’IA, des modèles dans des ensembles de données qui, autrement, ne seraient pas étiquetés ou classés.

Creusons un peu…

Illustrons avec une machine d’apprentissage non-supervisé qui utilise des images de véhicules pour déterminer s’il s’agit d’un bus ou d’un camion.

Le modèle apprend en identifiant les parties d’un véhicule, comme la longueur et la largeur du véhicule, les capots avant et arrière, les capots de toit, les types de roues utilisées, etc.

Sur la base de ces caractéristiques, le modèle détermine si le véhicule est un bus ou un camion.

Pour quelles applications ?

L’apprentissage non-supervisé est utilisé pour résoudre les problèmes de regroupement et d’association.

Vous le trouverez dans un large éventail de secteurs, notamment la finance, le e-commerce, les soins de santé, l’ingénierie, l’industrie 4.0, la sécurité et les jeux.

Un exemple : La segmentation de la clientèle.

Sur la base du comportement du client, de ses goûts et de ses intérêts, vous pouvez segmenter et regrouper des clients similaires dans un groupe.

Voyons maintenant le troisième type de Machine Learning : l’apprentissage par renforcement.

Apprentissage par renforcement

L'apprentissage par renforcement est un mode d’apprentissage statistique.

Il forme une machine à prendre des mesures appropriées et à maximiser ses récompenses dans une situation particulière. (Comme si l’IA voulait améliorer et optimiser ses notes.)

Il utilise un agent et un environnement pour produire des actions et des récompenses.

Cet agent a un état initial et un état final. Mais il peut y avoir différents chemins pour atteindre l'état final, comme dans un labyrinthe.

Dans cette technique d'apprentissage, il n'y a pas de variable cible prédéfinie.

Comment cette machine apprend ?

L'apprentissage par renforcement suit des méthodes d'essai et d'erreur pour obtenir le résultat souhaité. Après avoir accompli une tâche, l'agent reçoit une récompense.

On pourrait comparer cela à l’entraînement d’un chien à attraper la balle. Si le chien apprend à attraper la balle, vous lui donnez une récompense, comme un biscuit.

Ces méthodes d'apprentissage par renforcement n'ont pas besoin de supervision externe pour former les modèles.

Un exemple ?

Vous voulez former une machine capable d'identifier la forme d'un objet à partir d'une liste d'objets différents.

Vous fournissez à cette machine un ensemble de données et vous lui demandez d'identifier un type d’objet particulier (dans ce cas, une valise). La machine vous dit que c'est une boite, mais c'est une mauvaise réponse.

En guise de retour d'information, vous dites au système qu'il a tort : ce n'est pas une boite, c'est une valise. La machine apprend alors de ce retour et garde cela en tête.

La prochaine fois que vous poserez la même question, le système vous donnera la bonne réponse ; il sera capable de vous dire que c'est une valise. Il s'agit d'une réponse renforcée.

C'est ainsi que fonctionne l'apprentissage par renforcement : le système apprend de ses erreurs et de ses expériences.

Ce modèle est utilisé dans le monde des jeux. Avec l’apprentissage par renforcement, le niveau de difficulté augmente à mesure que vous vous améliorez.

Plus sérieusement ?

Ce type de Machine Learning est utilisé pour programmer par exemple des robots.

Vous n’avez plus besoin d'un long et fastidieux travail de développement. L'ordinateur apprendra à opérer, à réagir à tel ou tel événement ou requête par lui-même.

Que le robot soit physique (pour l’industrie ou un véhicule autonome) ou virtuel (pour la finance ou la gestion de la sécurité), la phase d’apprentissage sera exécutée sous forme de simulations numériques.

Le Machine Learning : Une technologie unique ?

Le Machine Learning existe depuis des décennies maintenant.

Et son rôle ne fait que croître dans notre vie quotidienne.

Comment ?

  • La puissance de calcul s'accroît.
  • Le volume de données augmente.
  • La bande passante d’Internet s'élargit.
  • Les scientifiques spécialisés dans les données améliorent leur expertise…

Résultat ?

Les ordinateurs peuvent davantage apprendre, mémoriser et générer des résultats précis grâce à l'apprentissage automatique.

Ces machines renforcent l'efficacité et la sécurité au travail et à la maison.

Elles permettent aux entreprises de prendre des décisions essentielles :

  • Pour analyser et rationaliser leurs actions.
  • Pour optimiser leurs opérations actuelles.
  • Et rechercher de nouvelles méthodes afin d’améliorer leurs performances.

Besoin de creuser davantage ce sujet ?

Alors, approfondissez vos connaissances avec l’un des articles suivants :

  • Computer Vision : comment l’IA voit-elle ?
    [article à venir]
  • Deep Learning : est-ce un monde d’IA autonomes ? Pourquoi cette technologie devient indispensable pour votre organisation ?
    [article à venir]

Quand voulez-vous commencer ?

DEMANDER UNE DEMONSTRATION