INTELLIGENCE ARTIFICIELLE GÉNÉRATIVE
Réseaux antagonistes génératifs (GAN)
Décrits pour la première fois en 2014 (I. J. Goodfellow et al.), les réseaux antagonistes génératifs reposent sur la combinaison et la mise en compétition de deux réseaux de neurones formels – l’un appelé discriminateur et l’autre générateur – qui sont entraînés par apprentissage profond. Le fonctionnement de l’ensemble se déroule en deux phases.
Au cours de la première, le discriminateur est entraîné par apprentissage profond supervisé à caractériser des images. À supposer que l’on souhaite faire des tableaux dans le style de Pablo Picasso ou des natures mortes, on commencera par fournir un ensemble d’images réelles étiquetées « style Picasso » ou « nature morte », de sorte que le discriminateur indique de façon fiable, pour n’importe quelle image, si elle correspond, oui ou non, à un tableau « style Picasso » ou à une « nature morte ».
Lors de la seconde phase d’apprentissage, le générateur fabrique des images à partir d’une entrée aléatoire. Ces images sont ensuite soumises au discriminateur. Selon que la réponse de ce dernier est positive ou négative, c’est-à-dire si les images sont ou ne sont pas du « style Picasso » ou des « natures mortes », le générateur sera modifié, par apprentissage profond supervisé. Ce second cycle, consacré à l’apprentissage du générateur, se poursuit jusqu’à ce que la plupart des images engendrées « satisfassent » le discriminateur, autrement dit, qu’elles soient classées dans le « style Picasso » ou qu’elles correspondent à des « natures mortes ». Même si les techniques mises en œuvre pour que le générateur apprenne correspondent à celles utilisées pour l’apprentissage supervisé, il n’est pas nécessaire de recourir à une supervision humaine, puisque c’est le discriminateur qui entre en jeu pour catégoriser les images. Cela permet donc de poursuivre l’apprentissage sur de très grandes masses d’exemples.
Les résultats obtenus par les GAN sont impressionnants : ils génèrent des images convaincantes dans un style donné qui intègrent éventuellement des objets ou des symboles décrits par avance avec de petits textes en langage naturel. Ainsi, les systèmes DALL-E, Midjourney ou Stable Diffusion créent des images à partir d’une demande exprimée par quelques mots en langage naturel. Les applications sont innombrables, que ce soit pour agrémenter des articles de journaux, fabriquer des infox (en anglais fake news) ou faire montre de fantaisie. Illustration notable de la puissance de ces techniques : le collectif d’artistes français Obvious a utilisé les GAN pour créer un tableau intitulé Portrait d’Edmond de Belamy (personnage fictif) – qui sera vendu 432 500 dollars chez Christie’s en octobre 2018.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Jean-Gabriel GANASCIA : professeur des Universités, faculté des sciences, Sorbonne université, Paris
Classification
Médias
Autres références
-
INTELLIGENCE ARTIFICIELLE (IA)
- Écrit par Jean-Gabriel GANASCIA
- 5 584 mots
- 5 médias
Enfant terrible de l’informatique, l’intelligence artificielle est apparue au milieu des années 1950, soit une dizaine d’années après la fabrication de l’ENIAC (Electronic Numerical Integrator and Computer), premier ordinateur entièrement électronique. À l’origine, elle se proposait de simuler les...
-
APPRENTISSAGE PROFOND ou DEEP LEARNING
- Écrit par Jean-Gabriel GANASCIA
- 2 645 mots
- 1 média
Apprentissage profond, deeplearning en anglais, ou encore « rétropropagation de gradient »… ces termes, quasi synonymes, désignent des techniques d’apprentissage machine (machine learning), une sous-branche de l’intelligence artificielle qui vise à construire automatiquement des connaissances...
-
MOTEURS DE RECHERCHE
- Écrit par Brigitte SIMONNOT
- 4 704 mots
- 2 médias
...la liste des résultats pour résumer les renseignements supposés essentiels : c’est le Knowledge Graph. Une telle fonctionnalité est rendue possible parl’intelligence artificielle générative qui permet de composer des textes ou images à partir de l’analyse d’une importante masse de données.