Abonnez-vous à Universalis pour 1 euro

INDEXATION

L'indexation automatique

Assez tôt dans l'histoire de l'automatisation, on s'est rendu compte qu'on pourrait se servir de machines pour indexer. Les premiers procédés, qui convenaient particulièrement à des index de petite dimension, utilisaient des fiches sur lesquelles on avait imprimé un quadrillage de perforation. Ces fiches à perforation centrale ou marginale se répartissent en deux types : les fiches par terme, où chaque fiche représente un mot clé, et les fiches par item, où chaque fiche représente un document numéroté. Sur les fiches par terme, on perfore les cases correspondant aux numéros des documents qui traitent du sujet évoqué par le terme. Sur les fiches par item, on perfore les cases correspondant aux divers sujets dont traite le document (item) fiché. Certaines fiches sont destinées à être perforées sur les bords, d'autres dans les cases d'un quadrillage couvrant toute la fiche. Il existe plusieurs façons d'utiliser les fiches pour une recherche ; pour les fiches à perforations marginales, on repère le trou correspondant au numéro du sujet recherché, on y enfonce une aiguille qui embroche toutes les fiches, et on soulève le paquet : on voit alors tomber les fiches où ce trou a été découpé. Ces procédés permettent de faire une recherche croisée sur plusieurs mots clés en une seule opération de recherche, mais risquent d'aboutir à de « fausses chutes » si l'on n'a pas pris la précaution de codifier également les relations entre les mots clés et d'échancrer les trous correspondant aux relations. Car il faut pouvoir faire la distinction entre « l'action de A sur B » et « l'action de B sur A ». Certaines fiches à trous centraux ont été conçues pour une sélection visuelle, mais le triage de la plupart des fiches à perforations centrales se fait mécaniquement. On glisse les fiches entre deux rouleaux métalliques reliés à un circuit électrique. Des brosses métalliques sont adaptées à l'un des rouleaux. Là où un trou a été percé, les rouleaux font contact, bouclant un circuit électrique qui active un mécanisme expulsant cette fiche du paquet. Ces machines peuvent aussi servir à imprimer un fichier complet sous forme de livre.

L'automatisation a désormais permis, pour l'essentiel, de remplacer ces procédés par l'utilisation d'ordinateurs, dans lesquels les fichiers-index sont entrés par l'intermédiaire d'un clavier et stockés sur des bandes magnétiques ou des disques. La recherche se fait au moyen du même clavier, et les résultats de chaque opération de recherche s'affichent sur un écran vidéotexte. Les progrès de la technologie informatique ont bien évidemment influé sur l'indexation, tant au niveau des pratiques d'indexation et de recherche qu'au niveau des théories traitant des divers langages documentaires.

Au début, quand l'ordinateur semblait offrir un potentiel de consultation et de recherche presque illimité grâce à la coordination de plusieurs termes ou mots clés distincts, beaucoup d'auteurs ont soutenu que les langages normalisés ou contrôlés n'étaient plus nécessaires pour les systèmes de codification et d'indexation : ils croyaient qu'une indexation « libre » par terme, à partir du langage naturel des auteurs, permettrait une consultation efficace. Sur ces bases ont été publiés certains index de types nouveaux. Le premier à connaître un succès appréciable s'appelait KWIC (key word in context : mot clé dans le contexte). Ce type d'index utilise les titres des documents tels qu'ils sont donnés par les auteurs, ce qui permet de se passer de spécialistes de l'indexation. Chacun des mots clés du titre est, tour à tour, placé au centre de la page, et chaque entrée ne comporte qu'une seule ligne dactylographiée ; les autres mots sont déplacés[...]

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

  • : (formerly) director of central library services and Goldsmith'Librarian, University of London, England.
  • : agrégé de l'Université, docteur en linguistique

Classification

Médias

Maison des sciences de l'homme - crédits : C. Mouly

Maison des sciences de l'homme

SYNTOL - crédits : Encyclopædia Universalis France

SYNTOL

Algèbre de Boole - crédits : Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.

Algèbre de Boole

Autres références

  • BIBLIOTHÈQUES NUMÉRIQUES

    • Écrit par
    • 5 199 mots
    • 1 média
    Les bibliothèques trouvent ici une confirmation de leur vocation première : à savoir décrire et signaler les collections,indexer leur contenu, tenir des bases d'autorité concernant une discipline ou un auteur, classer les documents dans des systèmes normés (Décimal, Dewey) et encyclopédiques....
  • HUMANITÉS NUMÉRIQUES

    • Écrit par
    • 5 372 mots
    • 2 médias
    ...souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus. Plus récemment, il a été souligné, à juste titre, que...
  • MOTEURS DE RECHERCHE

    • Écrit par
    • 4 699 mots
    • 2 médias
    Lespages Web collectées sont analysées par un logiciel qui procède à leur indexation. L'indexation consiste à caractériser les pages par des mots clés pour permettre de les retrouver. Dans le cas des moteurs de recherche, l'extraction de mots ou de groupes de mots à partir des documents est automatisée....
  • MOYEN ÂGE - La pensée médiévale

    • Écrit par
    • 22 217 mots
    ...Saint-Cher, les dominicains de Saint-Jacques mettent en chantier une grande Concordance de la Bible(achevée vers 1240), véritable ouvrage de référence, où chaque mot est indexé du nom du livre dans lequel il est employé, d'un numéro de chapitre, enfin d'une lettre (de A à G) y notant sa place relative....