Abonnez-vous à Universalis pour 1 euro

TRAITEMENT AUTOMATIQUE DES LANGUES

Les grands domaines d’application du traitement automatique des langues

Le traitement automatique des langues ne constitue pas un domaine monolithique : de nombreuses applications ont vu le jour au fur et à mesure que la technologie s’améliorait. Certaines applications sont connues du grand public (comme la traduction automatique, la correction orthographique ou encore, avec le développement des téléphones mobiles, la reconnaissance vocale), et d’autres moins (l’apprentissage en ligne, les agents conversationnels…).

Les moteurs de recherche

Le principe du moteur de recherche est à la fois simple et bien connu. Il s’agit de retrouver, à partir d’un fonds documentaire, les documents pertinents pour une requête donnée. En général, ceux-ci sont hiérarchisés, c’est-à-dire que les plus pertinents doivent figurer en tête de liste. Le fonds documentaire le plus connu aujourd’hui est bien sûr Internet, mais il existe de nombreux autres fonds documentaires, spécifiques, de Gallica à la Bibliothèque nationale de France jusqu’aux fonds d’archives d’entreprises ou d’associations particulières (un fonds documentaire est traditionnellement un ensemble de documents choisis sur un sujet donné, mais il semble intéressant d’élargir cette définition et de l’adapter au contexte du traitement des langues pour désigner ce qu’on appelle aussi parfois une archive).

La fouille d’opinion

Les outils de fouille d’opinion sont sans doute moins connus du grand public que les moteurs de recherche et ils sont surtout moins accessibles. La fouille d’opinion est la tâche qui vise à capter, analyser et synthétiser les opinions exprimées en ligne sur un sujet donné. Les critiques de films constituent, par exemple, un domaine d’exploration privilégié pour les chercheurs dans ce secteur.

La classification de documents

La classification de documents est très complémentaire des moteurs de recherche. Une fois qu’un moteur de recherche classique a identifié des pages Internet pertinentes par rapport à une requête, il peut chercher à les classer en fonction de leur contenu informationnel, afin de privilégier par exemple des pages montrant différentes facettes d’un même événement. Autrement dit, si deux pages expriment un contenu jugé similaire, une seule sera montrée à l’utilisateur par défaut, la deuxième n’ayant pas d’intérêt puisqu’elle n’apporte pas d’information supplémentaire. Un exemple typique est celui des sites agrégeant les flux d’information : seuls quelques articles, les plus représentatifs, sont mis en avant pour un événement donné.

La traduction automatique

La traduction est une application phare pour le traitement automatique des langues, pour plusieurs raisons : la tâche est bien identifiée et facilement compréhensible par le grand public ; elle est extrêmement complexe et recouvre en fait l’ensemble des problématiques du domaine du traitement automatique des langues (analyse de la langue source, transfert d’une langue à l’autre et production d’un texte cohérent dans la langue cible) ; enfin, elle répond à des besoins pratiques avérés. Certains outils en ligne offrent plus de 100 langues possibles (comme langue source ou langue cible), mais les traducteurs automatiques sont surtout efficaces pour une vingtaine de langues, et en pratique donnent les meilleurs résultats si l’anglais est soit la langue source, soit la langue cible. Signalons enfin la traduction de la parole (conversation en direct), qui n’est pas encore complètement opérationnelle, mais est appelée à faire rapidement de grands progrès.

La correction orthographique et grammaticale

La correction de textes est une autre application très populaire du domaine du traitement automatique des langues, du fait de l’intégration d’outils relativement performants dans tous les logiciels de traitement de textes grand public (Microsoft Word, Open Office, etc.).[...]

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

Classification

Médias

Texte analysé par un analyseur morphosyntaxique - crédits : Encyclopædia Universalis France

Texte analysé par un analyseur morphosyntaxique

Analyse syntaxique d’une même phrase dans quatre langues différentes - crédits : Encyclopædia Universalis France

Analyse syntaxique d’une même phrase dans quatre langues différentes

Analyse sémantique des prédicats et de leurs arguments selon la théorie Frame Semantics - crédits : Encyclopædia Universalis France

Analyse sémantique des prédicats et de leurs arguments selon la théorie Frame Semantics

Autres références

  • LANGAGE ACQUISITION DU

    • Écrit par
    • 4 950 mots
    • 3 médias
    ...s’ajoutent des indications concernant les gestes et les regards ainsi que les phénomènes d’interaction avec l’entourage. L’informatique permet le stockage, le traitement automatique et le transfert des données, entraînant un véritable changement d’échelle dans les pratiques de recherche. L’étude des productions...
  • COGNITIVES SCIENCES

    • Écrit par
    • 19 262 mots
    • 4 médias
    ...scinder en une branche théorique proche de la logique appliquée et une branche d'ingénierie informatique, divisée à son tour en spécialités telles que le traitement automatique des langues (T.A.L.), la vision artificielle, les images de synthèse, la reconnaissance vocale, et différentes techniques de ...
  • DICTIONNAIRE

    • Écrit par
    • 7 965 mots
    • 1 média
    Les progrès de l'informatique éditoriale et destraitements automatiques de la langue et des textes ont bouleversé le travail des dictionnaristes autant que leurs produits dans les dernières années du xxe siècle. Ces transformations, plus profondes encore que celles entraînées par l'imprimerie,...
  • HARRIS ZELLIG SABBETAI (1909-1992)

    • Écrit par
    • 1 063 mots

    La recherche de Zellig Sabbetai Harris est intimement liée aux travaux de l'école américaine d'analyse distributionnelle qui a élaboré son programme pour la linguistique dans les années 1930 et 1940, sous l'impulsion de E. Sapir et L. Bloomfield. Ce dernier avait proposé d'abstraire...

  • Afficher les 12 références