APPRENTISSAGE PROFOND ou DEEP LEARNING
Rétropropagation de gradient
Il a fallu attendre le début des années 1980 pour que des mathématiciens généralisent le principe d’apprentissage des perceptrons et conçoivent, en s’inspirant de principes mathématiques issus de la physique statistique, une procédure capable d’apprendre sur des réseaux de neurones à plusieurs couches. En termes techniques, on appelle cette procédure la rétropropagation du gradient. Quelques années plus tard, d’autres mathématiciens cherchèrent à déterminer les fondements théoriques de cet apprentissage avec, entre autres, la théorie statistique de l’apprentissage. Cela les conduisit à développer d’autres techniques d’apprentissage supervisé inspirées des principes mathématiques de l’apprentissage sur les réseaux de neurones formels, comme ce que l’on appelle les machines à vecteurs de support (support vectormachines) et les machines à noyaux (kernelmachines), qui furent bien souvent utilisées dans les années 1990 et au début des années 2000 pour effectuer de l’apprentissage supervisé dans de multiples champs d’applications comme la reconnaissance de caractères manuscrits, de visages ou de la parole.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Jean-Gabriel GANASCIA : professeur des Universités, faculté des sciences, Sorbonne université, Paris
Classification
Média
Autres références
-
APPRENTISSAGE, psychologie
- Écrit par Daniel GAONAC'H et Jean-François LE NY
- 5 939 mots
- 2 médias
Ces recherches s’articulent maintenant avec celles qui, en intelligence artificielle, s’appuient sur l’exploitation d’un très grand nombre de données empiriques (big data) : plutôt que d’« instruire » la machine par des règles définies a priori, on cherche à ce que celle-ci se fonde, pour... -
BIG DATA
- Écrit par François PÊCHEUX
- 6 148 mots
- 3 médias
...les progrès réalisés dans le domaine de l’apprentissage automatique (machine learning), encore appelé apprentissage statistique, et de son extension, l’apprentissage profond (deeplearning), qui excelle dans la reconnaissance vocale, la reconnaissance d’images, ou encore le traitement automatique du... -
DÉTERMINATION DE LA STRUCTURE 3D DES PROTÉINES
- Écrit par Beate BERSCH , Juan FONTECILLA-CAMPS et Emmanuelle NEUMANN
- 7 097 mots
- 5 médias
...depuis longtemps, des scientifiques réfléchissent et travaillent sur la prédiction des structures de protéines à partir de leurs séquences. En 2021, un algorithme, nommé AlphaFold et développé par DeepMind, a surpassé tous les autres algorithmes de prédiction de structures 3D des protéines ; il révolutionne,... -
EXPÉRIENCE (notions de base)
- Écrit par Philippe GRANAROLO
- 2 783 mots
...conduisent certains de nos contemporains à « humaniser » nos machines en leur prêtant la capacité d’acquérir de l’expérience ? L’apparition récente du deeplearning tend à rapprocher le fonctionnement mécanique du fonctionnement biologique. Prenons l’exemple de la reconnaissance des formes. Pour « apprendre... - Afficher les 12 références