- 1. Historique
- 2. Quelques définitions
- 3. L'approximation parcimonieuse, une propriété fondamentale des réseaux de neurones
- 4. Réseaux de neurones et régression non linéaire
- 5. L'apprentissage des réseaux de neurones formels
- 6. Quelques exemples d'applications des réseaux de neurones
- 7. Bibliographie
RÉSEAUX DE NEURONES
Quelques définitions
Les neurones formels
Un neurone formel, ou neurone, est une fonction algébrique non linéaire et bornée, dont la valeur dépend de paramètres appelés coefficients ou poids. Les variables de cette fonction sont habituellement appelées « entrées » du neurone, et la valeur de la fonction est appelée « sortie ». Un neurone est donc avant tout un opérateur mathématique, dont on peut calculer la valeur numérique par quelques lignes de programme informatique. Il est très rarement réalisé physiquement sous la forme d'un objet (circuit électronique par exemple). Il est cependant pratique de le représenter graphiquement.
Les neurones les plus fréquemment utilisés sont ceux dont la fonction est calculée en deux étapes :
– calcul de la somme v des entrées pondérées par les paramètres du réseau ;
– calcul d'une fonction non linéaire (y) de cette somme (dite « fonction d'activation »), par exemple une fonction sigmoïde. y = (1/(1 + e(—v))) ou encore y = th v.
Les {xi} sont les variables (ou entrées) du neurone, les {ci} sont des paramètres ajustables (coefficients ou poids).
Les réseaux de neurones formels
Un neurone réalise une fonction non linéaire de ses entrées. Ces dernières peuvent être les sorties d'autres neurones : on réalise ainsi un réseau de neurones, qui n'est donc rien d'autre que la composition de fonctions non linéaires élémentaires constituées par les neurones individuels.
La manière dont on « relie » entre elles les sorties des neurones aux entrées d'autres neurones définit l'architecture du réseau. Rappelons toutefois que ces « connexions » entre neurones sont purement métaphoriques, puisque les neurones ne sont généralement pas des objets physiques mais des entités mathématiques. Néanmoins, il est commode d'utiliser cette métaphore ; cette notion de connexion a d'ailleurs donné naissance à l'expression trompeuse de « modèles connexionnistes » pour désigner les réseaux de neurones.
On distingue deux types d'architectures de réseaux de neurones : les réseaux de neurones « non bouclés » et les réseaux de neurones « bouclés ».
Les réseaux de neurones non bouclés
Un réseau de neurones non bouclé réalise une ou plusieurs fonctions algébriques de ses entrées, par composition des fonctions réalisées par chacun de ses neurones. Il est représenté graphiquement par un ensemble de neurones connectés entre eux, l'information circulant des entrées vers les sorties sans retour en arrière. Un « Perceptron multicouche » est un réseau de neurones non bouclé qui a une structure particulière, très fréquemment utilisée : il comprend des entrées, une couche de neurones intermédiaires, dits neurones cachés, et des neurones de sortie. Les neurones de la couche cachée ne sont pas connectés entre eux.
Les réseaux de neurones non bouclés sont statiques : si les entrées sont indépendantes du temps, les sorties le sont également. Ils sont utilisés principalement pour effectuer des tâches d'approximation de fonction non linéaire, de modélisation statique de processus non linéaires ou de classification.
Les réseaux de neurones bouclés
Contrairement aux précédents, les réseaux de neurones bouclés peuvent avoir une topologie de connexions quelconque, comprenant des boucles qui ramènent aux entrées d'un neurone la valeur de sa sortie, éventuellement par l'intermédiaire d'autres neurones. Pour qu'un tel système soit causal, il faut évidemment qu'à toute boucle soit associé un « retard » : un réseau de neurones bouclé est donc un système dynamique, régi par des équations différentielles. Comme l'immense majorité des applications sont réalisées par des programmes informatiques, on se trouve dans le cadre des systèmes à temps discret, c'est-à-dire des systèmes où les valeurs des[...]
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Gérard DREYFUS : Professeur à l'E.S.P.C.I.
Classification
Médias
Autres références
-
ANTHROPOLOGIE COGNITIVE
- Écrit par Arnaud HALLOY
- 5 810 mots
...succinctement, les modèles connexionnistes décrivent les phénomènes mentaux et comportementaux comme le produit émergeant d’activation et de création de réseaux de neurones. Ils se distinguent ainsi assez radicalement des modèles « classiques » qui envisagent le cerveau à l’image d’un ordinateur qui... -
APPRENTISSAGE PROFOND ou DEEP LEARNING
- Écrit par Jean-Gabriel GANASCIA
- 2 646 mots
- 1 média
...techniques variées fondées sur la logique ou la statistique et s’inspirant de modèles psychologiques, physiologiques ou éthologiques. Parmi celles-ci, des techniques anciennes reposant sur un modèle très approximatif du tissu cérébral – les réseaux de neurones formels – ont obtenu depuis les... -
AUTOMATISATION
- Écrit par Jean VAN DEN BROEK D'OBRENAN
- 11 885 mots
- 12 médias
...fin des années 1980, les travaux scientifiques aboutissant au concept d'une logique « non classique », la logique floue, d'une part, et au concept des réseaux de neurones, adaptés à la modélisation et à la commande des processus non linéaires, d'autre part, trouvèrent des applications dans l'automatisation... -
AUTO-ORGANISATION
- Écrit par Henri ATLAN
- 6 258 mots
- 1 média
...intelligence artificielle destinées à fabriquer des machines à apprendre et à mémoire distributive (cf. F. Fogelman-Soulié, 1991 ; T. Kohonen). Ce calcul est effectué en parallèle par un grand nombre d'unités, dites neurones formels, qui effectuent chacune des opérations élémentaires simulant... - Afficher les 27 références