Le machine learning – ou apprentissage automatique – est un type d’intelligence artificielle consistant à entraîner un modèle en lui faisant analyser une grande quantité de données. Par exemple, on alimente le modèle avec un jeu de photos de chats ; à force d’en visionner, l’algorithme saura les reconnaître. On réplique ainsi l’intelligence humaine non pas par le raisonnement (ensemble de règles logiques permettant de réaliser des déductions) mais par l’apprentissage statistique. Le machine learning appartient de ce fait à la branche connexionniste ou statistique de l’intelligence artificielle.
Le machine learning a permis de confier à des ordinateurs une grande variété de tâches : vision par ordinateur pour identifier tel ou tel objet sur une image (dont par exemple la reconnaissance faciale), détection de fraude ou de spam, etc.
Apprentissage supervisé, apprentissage non supervisé
Un modèle de machine learning peut être entraîné de manière supervisée ou non supervisée. On parle d’apprentissage supervisé lorsque les données d’entraînement du modèle sont étiquetées (ou annotées) – si par exemple on alimente l’algorithme avec des photos de chats, étiquetées comme étant des photos de chats.
On parle d’apprentissage non supervisé lorsque les données d’entraînement ne sont pas étiquetées : on ne fournit au modèle que des photos brutes, sans indiquer si elles contiennent un chat ou non ; l’algorithme regroupera de lui-même en une seule catégorie les photos contenant un animal présentant les caractéristiques d’un chat.
On parle enfin d’apprentissage semi-supervisé lorsqu’un modèle est entraîné avec une combinaison de données étiquetées et non étiquetées.
Extraction de caractéristiques
L’une des limites fréquentes d’un algorithme d’apprentissage automatique est que pour l’entraîner, il ne faut pas seulement lui fournir des données (étiquetées ou non) ; il faut encore lui indiquer les caractéristiques auxquelles il pourra identifier ces données.
Reprenons notre exemple – un peu simplifié, je vous l’accorde : si l’on veut construire un modèle capable de reconnaître les chats, il faudra ainsi fournir non seulement un jeu de photos de chats, mais aussi les principales caractéristiques auxquelles on veut que le modèle puisse reconnaître un chat : ses moustaches, ses oreilles, etc. Cette extraction de caractéristiques (features extraction) peut être réalisée par un humain ou un algorithme dédié… lequel devra bien avoir été rédigé par un humain au préalable ! Pour pallier cette limite, il faudra recourir à une sous-branche de l’apprentissage automatique, appelée apprentissage profond, ou deep learning.
Pour en savoir plus sur l'IA dans le Product Management : téléchargez gratuitement notre bibliothèque de prompts.