Abonnez-vous à Universalis pour 1 euro

BIBLIOTHÈQUES NUMÉRIQUES

Choix techniques, nouveaux enjeux

La numérisation du patrimoine pose d'emblée des problèmes de formats ou de mode de stockage, image ou texte. Dans le mode image, une page est analysée en points (pixels) auxquels correspond un codage numérique permettant de reproduire fidèlement le document. Dans le mode texte, on code les caractères en attribuant à chacun une valeur numérique déterminée. La décision de privilégier la première technique ne répond pas seulement à un critère économique : du texte saisi coûte environ dix fois plus cher qu'une scannérisation.

Elle marque aussi le souci de conserver la structure physique et visuelle du document original, élément essentiel de la bibliographie matérielle et de l'histoire du livre. Enfin, elle va dans le sens d'une logique de conservation relativement traditionnelle de documents statiques.

Certes, le pari sur l'avenir, à la fin des années 1980, était de préjuger d'une double avancée technologique, aujourd'hui près d'être atteinte : d'une part, des progrès dans les techniques de reconnaissance optique de caractères (OCR) permettant de passer du mode image au mode texte, et dans les performances de formats comme PDF (portable document format, Acrobat d'Adobe) ; d'autre part, des possibilités accrues de diffuser en réseau ces « images » avec des temps d'accès raisonnables. L'évolution récente et rapide des formats de compression graphique et d'image – MPEG –, encapsulant des métadonnées complexes, va dans le sens de cette intégration des documents textuels scannérisés. Actuellement, si l'OCR reste parfois approximative, elle s'avère suffisante pour des moteurs de recherchestatistique qui localiseront ensuite l'information dans le mode image ; de même, les réseaux connaissent des accroissements de débit. Mais l'évolution des bibliothèques se situe ailleurs. Il semble significatif, notamment pour ce qui concerne la seconde phase du National Digital Library Project américain, en 1998, que les projets numériques des grandes bibliothèques universitaires changent de nature (University of Illinois Urbana-Champaign, Carnegie-Mellon University, Stanford University, University of California at Berkeley, University of California at Santa Barbara et University of Michigan). C'est moins l'accès à des contenus patrimoniaux qui compte désormais que le type d'usage heuristique, de services coopératifs permis par la dynamique des documents numériques. Les bibliothèques numériques sont alors définies par l'ensemble des interactions qu'elles permettent, et par les nouvelles façons de travailler, d'enseigner, de communiquer, qu'elles induisent. Des projets comme ceux de l'université d'Illinois, Interspace, sont significatifs : comment construire le prototype des systèmes coopératifs, où c'est non seulement le document qui est modélisé, mais aussi les agents et les actions d'un travail coopératif ? Comment non seulement élargir l'accès aux documents, mais approfondir, raffiner l'accès aux concepts et aux connaissances ? Ce modèle, on le voit, ne se limite plus à la seule offre documentaire devant une demande abstraite. Il rend possible des services complexes où, par exemple, la notion de recherche d'information est corrélée à la nature des profils d'interrogation, et aux types de travaux à partir desquels indexer ces recherches. Les enjeux techniques changent de nature, comme on le voit pour des outils tels ceux du Networked Computer Science Technical Reports Library de Cornell University, de l'accès en ligne aux cours de Berkeley, ou encore pour les articles scientifiques de l'université Los Alamos, ou l'indexationautomatique des millions d'entrées de Medline dans le projet de B. Schatz.

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

  • : enseignant de philosophie, École normale supérieure, lettres et sciences humaines, Lyon

Classification

Média

Gallica, bibliothèque numérique de la B.N.F. - crédits : Gallica

Gallica, bibliothèque numérique de la B.N.F.

Autres références

  • CULTURE NUMÉRIQUE

    • Écrit par
    • 4 509 mots
    • 1 média
    ...digital immigrants est éclairant de ce point de vue, puisque les forts lecteurs de livres et de revues passent aujourd'hui une partie de leur temps à naviguer sur la Toile, à aller de Gallica 2 vers la Bibliothèque électronique du Québec ou Google Print afin d'y puiser la nourriture spirituelle qu'ils...
  • DARNTON ROBERT (1939- )

    • Écrit par
    • 1 024 mots

    L’historien américain spécialiste du xviiie siècle Robert Darnton a entrepris dès les années 1960 une grande recherche sur les Lumières et leur rôle dans la fin de l'Ancien Régime.

    Diplômé de Harvard et d'Oxford, Robert Darnton, après avoir enseigné l'histoire européenne à Princeton de...

  • ÉDITION ÉLECTRONIQUE

    • Écrit par
    • 4 014 mots
    • 3 médias
    ...distributeur de la marque d’une liseuse donnée. Elles ne tiennent pas compte non plus des pratiques de partage, d’échange et de don symboliquement liées au livre. Nombreux sont les lecteurs qui s'interrogent sur la patrimonialisation possible de ces bibliothèques numériques. De nouvelles structures d’édition...
  • INFORMATION : L'UTOPIE INFORMATIONNELLE EN QUESTION

    • Écrit par
    • 8 126 mots
    • 1 média
    « Notre mission est d'organiser l'information du monde et de la rendre universellement accessible et utile ». C'est ainsi que la firme Google annonçait en décembre 2004 son méga-projet d'une nouvelle bibliothèque d'Alexandrie en numérisant les fonds de quelques-unes des plus grandes bibliothèques...