AUTOMATISATION

Article modifié le 29/01/2025

Rôle de la logique floue et des réseaux de neurones

À la fin des années 1980, les travaux scientifiques aboutissant au concept d'une logique « non classique », la logique floue, d'une part, et au concept des réseaux de neurones, adaptés à la modélisation et à la commande des processus non linéaires, d'autre part, trouvèrent des applications dans l'automatisation (le vocable neurone ainsi que celui de synapse qui lui est associé sont issus d'une tentative d'identification de l'opérateur mathématique dit « neurone formel » à la cellule nerveuse biologique ; ce rapprochement, peu opportun, n'a plus aujourd'hui qu'une connotation historique). Ainsi se sont ouvertes de nouvelles perspectives dans la commande des procédés.

Pour situer de telles applications, on peut se référer à un problème de tri d'objets en fonction de critères qui ne peuvent pas être formulés avec précision. Imaginons, par exemple, une machine à classer des fruits. Elle doit non seulement les répartir en trois classes différentes, en fonction du calibre, mais aussi extraire les fruits trop ou insuffisamment mûrs qui seront destinés à des industries de transformation et éliminer ceux qui sont nettement tachés. Soit sept classes au total.

Les fruits ont une forme incertaine et la coloration, signe de maturité, va du vert au rouge en passant par le jaune, avec d'éventuelles taches marron.

Les critères de tri sont flous et il est convenu que la machine puisse se référer à des lots types préparés intentionnellement par l'entreprise qui l'exploite, lesquels ont été « présentés » à la machine avant la campagne d'exploitation.

La machine comporte un dispositif qui immobilise chaque fruit dans le champ d'une caméra qui enregistre son image dans un champ de 512 × 512 pixels (2⁹ × 2⁹). L'analyse de l'image doit permettre, par un traitement approprié, de déterminer la classe dimensionnelle et l'état de maturité du sujet, voire son rejet. Le système ainsi constitué est caractérisé par :

– le manque de précision de l'information de commande qui est exprimée en termes linguistiques (gros, moyens, petits ; pas mûrs, mûrs, trop mûrs, tachés) ;

– la richesse potentielle de l'information d'état, puisque celle-ci forme un ensemble de 2¹⁸ éléments distincts (2⁹ × 2⁹) ;

– le manque de rigueur des critères de sélection ; il est demandé simplement d'apporter une réponse plausible au problème posé.

Cet exemple permet d'introduire les notions :

– de logique floue appliquée à la commande de processus ;

– de classement à partir d'un processus de reconnaissance des formes ;

– d'apprentissage, la machine devant optimiser elle-même ses réglages au cours d'un nombre approprié de passages des éléments des lots types (appelés exemples, dans ce contexte).

La reconnaissance des formes peut faire appel à des réseaux de neurones comprenant des moyens d'apprentissage. Ces réseaux sont généralement des logiciels, mais ils peuvent être, au besoin, « gravés » matériellement sur le silicium en circuits V.L.S.I. (circuits à très large intégration). Cette forme électronique n'est justifiée que dans des cas spécifiques (grande répétitivité, miniaturisation en technique spatiale).

L'exposé qui suit se réfère aux applications de la logique floue à la commande, aux applications des réseaux de neurones en automatisation et à l'association éventuelle des deux. Il faut préciser que l'association de la logique floue et des réseaux de neurones n'est pas systématique : il existe de nombreux exemples de pure logique floue ou de réseaux de neurones indépendants de toute logique floue. Mais la promotion commerciale de certaines applications grand public, et aussi de systèmes de commande industriels, a donné lieu à une médiatisation précoce, parfois tendancieuse, de ces avancées de la technique en automatisation. Ainsi y-a-t-il lieu de se demander si l'expression de commande de processus neuro-floue a réellement un sens.

La logique floue

La logique floue (fuzzy logic) a été notamment développée par le professeur Lofti A. Zadeh, à l'université de Berkeley (Californie), qui lui a donné, depuis 1985, une nouvelle direction en vue de son application au contrôle des processus industriels. Le but de la logique floue est de parvenir à traiter des connaissances par nature imparfaites, du fait d'un manque de précision dans l'expression d'une dimension, ou de l'impossibilité de chiffrer une notion telle que, par exemple, la maturité d'un fruit : incertitudes, imprécisions et « incomplétudes » (absence d'un certain nombre de renseignements) caractérisent cette logique. La solution proposée sera de préserver les imperfections dans le traitement logique, jusqu'à un certain stade, jusqu'à ce qu'on dispose d'une représentation manipulable de façon automatique.

La logique floue est fondée sur la théorie des ensembles classiques qu'elle a étendue aux ensembles flous.

Sous-ensembles flous

Un sous-ensemble flou A se déduit d'un ensemble X par une fonction d'appartenance qui associe à chaque élément x de X le degré f_A(x), compris entre 0 et 1, avec lequel x appartient à A. Si f_A(x) ne peut prendre que les valeurs 0 ou 1, A est un sous-ensemble classique.

Si on constitue un sous-ensemble des éléments x pour lesquels f_A(x) a une valeur α, comprise entre 0 et 1, on a défini une α-coupe de A, et cette coupe est un sous-ensemble classique. On définit le support de A comme étant la partie de X pour laquelle f_A(x) n'est pas nulle et la hauteur de A comme la plus grande valeur prise par f_A(x). Si la hauteur atteint 1, A est dit normalisé. À partir de ces définitions et de quelques autres, notamment le produit cartésien, on a transposé l'algèbre des ensembles classiques à celle des sous-ensembles flous en associant les fonctions d'appartenance et en déterminant les propriétés des α-coupes, qui sont des sous-ensembles classiques.

Relation floue

La notion de relation floue entre ensembles généralise la notion de relation classique définie sur les ensembles. Une relation floue R entre deux ensembles de référence X et Y peut être représentée par une fonction caractéristique χ_R définie sur le produit cartésien X ⊗ Y avec χ_R(x, y) = 1 si x et y sont en relation par l'intermédiaire R, et avec χ_R(x, y) = 0 dans le cas contraire. S'il existe une liaison entre les éléments x et les éléments y qui soit imprécisément connue, ou graduelle, et que x et y aient une appartenance approximative à X et Y, cette liaison n'est pas représentable par une relation classique. On définit donc une relation floue R en assouplissant la définition de la fonction caractéristique χ_R classique. La relation floue entre X et Y sera un sous-ensemble flou de X ⊗ Y, de fonction d'appartenance f_R.

Théorie des possibilités

Elle permet de formaliser des incertitudes subjectives sur des événements, c'est-à-dire dans quelle mesure la réalisation d'un événement est possible et dans quelle mesure on en est certain, sans avoir à sa disposition l'évaluation de la probabilité de cette réalisation (par exemple, on ne connaît aucun événement analogue, ou, par manque de moyens d'observation, on ne dispose d'aucune mesure).

Étant donné un ensemble de référence X, on attribue à chaque événement défini sur X, c'est-à-dire à tout élément de l'ensemble P(X) des sous-ensembles ordinaires de X, un coefficient π compris entre 0 et 1 évaluant à quel point cet événement est possible. On définit une distribution de possibilité. Prenons par exemple un ensemble de référence X : mes comportements en face de ceux de mon voisin, et un élément défini sur l'ensemble : je ne le dénonce pas à la police bien qu'il ait tenté de voler ma voiture. Cet élément est une possibilité, mais il aurait pu être nécessaire de le dénoncer à la police.

Comme une mesure de possibilité ne donne qu'une information sur l'occurrence d'un événement A relatif à un ensemble de référence X, mais ne suffit pas pour décrire l'incertitude existante sur cet événement, il faut compléter l'information. On indique le degré avec lequel la réalisation de A est certaine, par l'intermédiaire d'une mesure de nécessité, grandeur duale d'une mesure de possibilité. Elle attribue un coefficient N, compris entre 0 et 1, à toute partie de X, mais elle possède des propriétés différentes de celles d'une mesure de possibilité.

Prenons, par exemple, l'ensemble de référence X : mes comportements en face de ceux de mon voisin, et l'élément défini sur l'ensemble : je le dénonce à la police car il a tenté de voler ma voiture. Ce n'est plus une possibilité mais une nécessité, quand il n'y a pas d'autres méthodes dissuasives dans ce cas particulier.

Plus un événement est nécessaire, moins l'événement complémentaire est possible. On écrit N(A) = 1 — π (A^c), A^c étant le complément de A.

Les distributions de possibilité et de nécessité se distinguent de celles de probabilité du fait qu'elles relèvent de mesures floues, lesquelles font appel à des fonctions de croyance et de plausibilité, alors que les distributions de probabilité font appel à des épreuves, c'est-à-dire à des mesures exactes. Par exemple, les cas de propriétaires qui dénoncent leur voisin parce qu'il tente de voler leur voiture sont répertoriés par la police et les occurrences peuvent être étudiées statistiquement. On peut calculer une distribution de probabilité.

Variable linguistique

Zadeh a introduit la notion de possibilité à propos de la caractérisation de variables par des descriptions linguistiques imprécises, représentées par des sous-ensembles flous. Il a créé la notion de variable linguistique et de proposition floue avec la distribution de possibilité associée à une proposition floue.

Une variable linguistique est un triplet (V, X, T_V), dans lequel V est une variable définie sur un ensemble de référence X et T_V est un ensemble contenant des sous-ensembles flous normalisés de X utilisables pour caractériser V.

Atelier flexible d'usinage - crédits : Encyclopædia Universalis France — Atelier flexible d'usinage
Encyclopædia Universalis France

Par exemple, si V est la surface d'un appartement que l'on veut décrire et X l'ensemble des nombres entiers réels positifs, les sous-ensembles flous sont T_V = {minuscule, petite, moyenne, grande, immense}. La surface définie par ces mots sera placée dans un des T_V, ce qui lui donne une expression numérique floue.

Raisonnement en logique floue

Le raisonnement de la logique classique ne s'applique pas à la logique floue. En effet, en logique classique, des propositions telles que p ou q ne peuvent avoir que deux valeurs de vérité : le vrai ou le faux. Des opérateurs dont les principaux sont la conjonction (ET), la disjonction (OU), la négation (NON), et la règle de déduction ci-après : si p implique q vrai, et p vrai, alors q vrai (prémisse vraie : modus ponens), si p implique q vrai, et q faux, alors p faux (conclusion fausse : modus tollens) constituent les fondements de la logique classique.

Mais, en logique floue, l'incertain est présent. Il faut donc traiter trois valeurs possibles : le vrai, le faux et l'incertain. Certains auteurs ont proposé de donner à l'incertain une valeur intermédiaire (logiques ternaires) standard, mais l'école de Zadeh a proposé des règles de raisonnement en logique floue plus subtiles : donner à l'incertain une quantification floue. La logique floue définit des implications floues et un modus ponens généralisé. De même, on propose un raisonnement en logique possibiliste fondé sur le modus ponens et le modus tollens possibilistes.

Application de la logique floue à la commande

En se référant à la structure générale des processus d'action (chap. 2 et ), on remarque qu'il est concevable d'introduire la notion de flou dans l'information de commande et ses critères, son traitement et le modèle. En revanche, il est habituel que l'information d'état provenant de capteurs soit non floue, de type numérique ou analogique. Il y a donc passage du flou (fuzzy en anglais) au non-flou, opération que les spécialistes appellent « défuzzification ». La transposition de cette structure au cas où l'information de commande, les critères et le modèle sont flous s'applique à la notion de bases de connaissances en intelligence artificielle dans la commande des processus.

La commande floue est plus simple, plus rapide et plus efficace dès lors que la modélisation est très complexe ou incertaine et qu'elle peut être remplacée par ce que l'on pourrait appeler des témoignages d'experts, et que l'on ne dispose que d'informations imprécises. On constate aussi qu'elle est moins sensible aux perturbations, plus économe en énergie que la commande classique.

L'interface avec le non-flou peut être réalisée avec les réseaux de neurones.

Parmi les applications de la logique floue en automatisation, on peut citer :

– la transposition en flou du classique régulateur P.I.D. (proportionnel intégral différentiel), analogique, sujet au phénomène de saturation lorsque l'écart entre la consigne et le signal de contre-réaction est important (un P.I.D. analogique saturé se comporte comme un régulateur tout ou rien dont l'amortissement est faible) ; en réalisation « flou », l'amortissement du P.I.D. est assuré même en cas d'écart important ;

– le réglage du recyclage des fines de criblage des agglomérés dans une chaîne d'agglomération (exemple type de maîtrise des instabilités complexes causées par le concept de recyclage, à partir de prédictions d'opérateurs expérimentés, sans modélisation mathématique) ;

– le réglage du programme de machines à laver, la régulation de température des douches, etc. ;

– la stabilisation de l'image de caméscopes, par comparaison de l'image actuelle à la précédente et décision floue sur l'origine du « bougé » (tremblement de la main ou mouvement du sujet ?) ;

– la gestion de batteries d'ascenseurs ;

– plusieurs prototypes de commande automatique et personnalisée de boîtes de vitesses d'automobiles ;

– le pilotage de rames de métro et d'hélicoptères.

Des microprocesseurs réalisant des algorithmes de déduction floue et des logiciels de développement sont commercialisés.

Réseaux de neurones

Alors que l'automatique linéaire traite efficacement des processus dynamiques linéaires que l'on peut décrire notamment par des équations différentielles, alors que la logique floue est dédiée aux processus que l'on ne sait décrire que par une expertise linguistique imprécise, les réseaux de neurones ont pour objectif la modélisation et la commande de processus dynamiques non linéaires.

En pratique, on ne cherche généralement pas à réaliser une approximation d'une fonction non linéaire connue. Le plus souvent, le problème est de trouver une fonction qui s'ajuste le mieux possible à des données, dont on suppose qu'elles résultent d'un processus déterministe non linéaire entaché de bruit. Un réseau de neurones est alors une fonction non linéaire paramétrée qu'il convient d'ajuster aux données disponibles.

Un « neurone formel », ou neurone, est un opérateur mathématique simple que l'on peut mettre en œuvre par quelques lignes de logiciel ou sous forme d'un processeur matériel. Il possède des entrées, qui peuvent être la sortie d'autres neurones ou des entrées de signaux extérieurs au réseau, et une sortie. La valeur de la sortie résulte du calcul de la somme des entrées, pondérées par des coefficients (dits « poids synaptiques »), et d'une fonction non linéaire bornée de cette somme pondérée (). Cette fonction, dite d'activation, est le plus souvent une fonction sigmoïde : par exemple, la tangente hyperbolique.

Dans un réseau de neurones, il y a des neurones d'entrée, des neurones de sortie et des neurones cachés (formant éventuellement des « couches »), qui traitent l'information avec d'autres neurones.

On distingue deux architectures de réseaux de neurones :

– Le réseau de neurones non bouclé où l'information circule de l'entrée vers la sortie. Ce type de réseau, statique, est approprié pour les tâches d'approximation de fonction non linéaire, classification de données, modélisation de processus statiques.

– Le réseau de neurones bouclé dans lequel une part de l'information de sortie retourne vers l'entrée. Ce type de réseau, dynamique, est approprié pour l'identification ou la commande de systèmes dynamiques non linéaires.

La propriété fondamentale des réseaux de neurones est celle d'approximation universelle parcimonieuse. Plus précisément, « toute fonction suffisamment régulière peut être approchée dans un domaine borné, avec précision arbitraire, par un réseau de neurones formels non bouclé, comprenant une couche de neurones cachés à fonction d'activation sigmoïdale, en nombre fini, et un neurone de sortie à fonction d'activation linéaire » (K. Hornik et al., cités par G. Dreyfus, 1996).

L'adjectif parcimonieux fait allusion à d'autres familles de fonctions paramétrées, possédant la même propriété qui, toutes, à précision égale, nécessitent l'ajustement d'un plus grand nombre de paramètres.

Ici, les paramètres ajustables sont les poids des connexions.

La classification par un réseau de neurones

Supposons que l'on désire classer des « formes » en deux catégories (A ou B) en fonction de certaines caractéristiques de ces formes, on peut définir une fonction ϕ qui prend la valeur + 1 pour toutes les formes de la classe A et — 1 pour toutes les formes de la classe B. On peut démontrer que cette approximation constitue une probabilité d'appartenance de la forme inconnue à la classe A.

Les classifieurs à réseaux de neurones fournissent cette information très riche, qui est loin d'être une simple réponse binaire. Ils ont la forme de réseaux non bouclés et l'ajustement de leurs paramètres se fait par « apprentissage ».

L'apprentissage consiste à calculer les coefficients de telle manière que les sorties du réseau de neurones soient, pour les exemples utilisés lors de l'apprentissage, aussi proches que les sorties désirées, lesquelles, dans le cas d'une classification, sont la reconnaissance de la classe d'appartenance.

Les algorithmes d'apprentissage sont généralement des algorithmes d'optimisation : ils cherchent à minimiser une fonction « de coût » qui mesure l'écart entre les réponses réelles et les réponses optimisées. L'optimisation se fait de manière itérative. Il existe des algorithmes d'optimisation non linéaire extrêmement rapides qui permettent de faire des développements industriels sur de simples ordinateurs de bureau. Ces algorithmes sont génériques, c'est-à-dire indépendants de la structure du réseau. Un classifieur connu, le Perceptron, est réalisé en réseau de neurones.

Dans l'exemple de cet article, le classement des fruits sera obtenu à partir d'images, grâce à trois traitements logiciels : le premier, « extraction de contour », qui détermine le calibre, comporte une définition floue de ce calibre ; le deuxième, « codage de la couleur », s'intéresse à la maturité des fruits ; le troisième, qui détectera la « présence de taches brunes », comporte une définition floue de la tache. Les sorties seront au nombre de sept.

Il doit rester clair que ces traitements, formant un ensemble neuronal, se font à partir de variables mises en forme, c'est-à-dire traduites en signaux numériques, et nullement en éléments appartenant à des sous-ensembles flous. Le traitement « flou », qui transcrit l'expertise de l'opérateur (calibre, maturité) en variables linguistiques, puis en formes, ne peut se faire qu'en amont. Les réseaux de neurones sont incapables de traiter de manière satisfaisante des données linguistiques. Peut-on vraiment parler de commande neuro-floue sans abus de langage ?

Réalisation et application des réseaux de neurones

L'arrivée sur le marché de microprocesseurs très performants a donné de puissants moyens de réaliser économiquement des réseaux de neurones très efficaces implantés sur des cartes à microprocesseurs. Les réalisations de neurones électroniques en circuits V.L.S.I., c'est-à-dire à très large intégration, spécifiques, restent exceptionnelles.

Une application classique des réseaux de neurones est la reconnaissance des formes : lettres, voix, images. Ils sont donc utilisés en vision industrielle et en robotique. Ils sont aussi employés en automatisme industriel, notamment pour la modélisation en commande des processus. Ils peuvent se trouver associés à la logique floue mais ne peuvent traiter directement les données linguistiques issues d'une expertise imprécise.

Leurs principales applications sont :

– la réalisation du classique régulateur P.I.D. handicapé par les phénomènes de saturation en cas de grandes erreurs ; l'appareil est réglé pour une utilisation donnée par apprentissage à partir d'un modèle réalisant les conditions de fonctionnement souhaitées (réseau à 16 neurones en couche intermédiaire) ;

Industrie automobile: chaîne de montage - crédits : ABB — Industrie automobile: chaîne de montage
ABB

– la modélisation de l'actionneur d'un bras de robot ;

– la recherche et l'élimination des inclusions de pièces de cuivre dans la ferraille destinée au four à arc de sidérurgie ;

– la surveillance de la coulée continue d'acier (prévention des criques) ;

– la conduite de machines utilisées dans l'industrie du papier ;

– la régulation de four à arc de sidérurgie ;

– la modélisation d'un processus de calcination ;

– l'asservissement d'un véhicule à une trajectoire de consigne.

Une discipline, le « neuromimétisme », regroupe les connaissances relatives aux neurones formels et leurs applications ; l'adjectif neuromimétique qualifie les réseaux et les systèmes qui en relèvent.

— Jean VAN DEN BROEK D'OBRENAN

Accédez à l'intégralité de nos articles

Des contenus variés, complets et fiables
Accessible sur tous les écrans
Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

Jean VAN DEN BROEK D'OBRENAN : ingénieur conseil

Carte mentale
Élargissez votre recherche dans Universalis

Classification

Médias

Variable linguistique - crédits : Encyclopædia Universalis France — Variable linguistique

Encyclopædia Universalis France

Processus d'action : structure - crédits : Encyclopædia Universalis France — Processus d'action : structure

Encyclopædia Universalis France

Circuit logique : représentation symbolique - crédits : Encyclopædia Universalis France — Circuit logique : représentation symbolique

Encyclopædia Universalis France

Afficher les 12 médias de l'article AUTOMATISATION

Autres références

AGHION PHILIPPE (1956- )
- Écrit par Olivier MARTY
- 1 173 mots
- 1 média
Une deuxième idée-force de l’économiste concerne leseffets de l’automatisation. À rebours des thèses pessimistes véhiculées tant dans le débat public que par une partie du monde académique, Aghion voit dans celle-ci une source d’efficacité, de profits et donc de développements favorables à l’emploi....
ALGORITHME
- Écrit par Alberto NAIBO et Thomas SEILLER
- 5 919 mots
- 4 médias
La notion d’algorithme a envahi nos discours et nos pratiques, en raison surtout de la diffusion massive d’applications informatiques dédiées à l’exécution automatisée de certaines tâches, ou à la résolution de certains problèmes. On trouve en effet les algorithmes non seulement dans de nombreux domaines...
ANALYTIQUE CHIMIE
- Écrit par Alain BERTHOD et Jérôme RANDON
- 8 890 mots
- 4 médias
Les progrès de la chimie, de la biochimie, de l'électronique, de la micro-informatique, de la robotique et de la miniaturisation permettentd'automatiser un grand nombre de procédures d'analyse autrefois longues et laborieuses. L'utilisation de l'appareillage devient plus simple et plus fiable. Par...
AUTOMATIQUE
- Écrit par Hisham ABOU-KANDIL et Henri BOURLÈS
- 11 647 mots
L' automatique est la science des systèmes. Ce dernier terme doit être entendu ici non pas comme une totalité close sur elle-même, mais au contraire comme un ensemble d'éléments (dits « sous-systèmes ») en interaction, ensemble qui est lui-même en interaction avec un environnement constitué d'autres...
Afficher les 38 références

Voir aussi

Pays	Indicateurs	Années	Graphe
Jusqu'à 12 pays	Toutes les données	De 1960 à nos jours	Affiché en courbe Affiché en barre
De 13 à 50 pays	5 données simultanées	De 1960 à nos jours	Masqué en courbe Affiché en barre
51 pays et plus	1 seule donnée	Sur une durée de 25 ans maximum	Masqué en courbe Masqué en barre