INDEXATION
SYNTOL
L'analyse par facettes fut l'aboutissement d'une longue histoire, celle des systèmes de classification et des index matières dans les bibliothèques ; et il a été prouvé que l'analyse catégorielle s'adapte aisément aux systèmes automatisés tels que les enregistrements MARC. Le système appelé SYNTOL (Syntagmatic Organisation Language, langage systématique d'organisation) fut conçu par J.-C. Gardin et ses collègues du C.N.R.S. et de la Maison des sciences de l'homme, avec le soutien de l'Euratom, précisément en tant que modèle général d'un système d'indexation automatique. Il s'appuie sur les théories fondamentales de la structure des langues, notamment celle de F. de Saussure, et donc peut tout aussi bien s'appliquer aux systèmes non automatisés. J.-C. Gardin, en tant qu'archéologue, a été conduit à utiliser l'analyse catégorielle pour identifier les artefacts. Contrairement à la plupart des autres systèmes, il part d'une analyse des relations entre sujets et ne cherche pas à dresser des listes de termes telles qu'on en trouve dans les classifications conventionnelles, mais plutôt à établir un métalangage auquel on puisse relier d'autres systèmes. Il consiste en une ossature linguistique codifiée servant à représenter les données, et en un ensemble d'opérations logiques permettant de stocker les descriptions de documents et de les retrouver.
SYNTOL a été l'un des premiers systèmes à expliciter la distinction entre deux modes d'organisation des termes signifiants, le mode sémantique et le mode syntaxique. À l'exemple de Saussure, il utilise les deux adjectifs « paradigmatique » et « syntagmatique » pour exprimer cette distinction. Les relations paradigmatiques sont a priori et existent dans le monde réel ; celui des phénomènes, indépendamment de la présence d'aucun énoncé ou document. Elles sont reflétées par la structure des systèmes précoordonnés tels que les classifications ou les listes de vedettes matières. Les relations syntagmatiques sont a posteriori et s'appliquent à des énoncés spécifiques ou à des descriptions spécifiques de documents, comme les énoncés et les descriptions que fournit l'analyse par facettes de la C.C. ou d'autres systèmes similaires. Les tables de la C.C. comportent une seule relation entre genre et espèce, entre partie et tout, entre objet et processus ; l'action de classer un document exprime les relations syntagmatiques entre les diverses facettes du sujet de ce document.
Au début, SYNTOL ne fut appliqué qu'à un petit nombre de disciplines : la physiologie, la psychologie, la sociologie et l'anthropologie culturelle. Mais il est vrai, comme l'affirment ses auteurs, qu'un système d'analyse documentaire qui réussit dans des disciplines dont le langage est loin d'être standardisé se montrera probablement utile dans les domaines où la terminologie est plus précise. SYNTOL spécifie en outre deux groupes de facettes distincts : Source et Thématiques. Dans Source, les rubriques se réfèrent à des attributs physiques comme la forme, la langue et la date ; la facette Thématiques inclut les Êtres (personnes ou groupes), le Thème (catégorie de phénomènes telle que la parenté ou la religion), le Temps (évoque des événements), l'Espace (lieu où se manifestent les personnes ou les événements) et le Mode (la manière générale d'aborder le sujet : historique, critique, etc.). Cette terminologie fait ressortir l'intention qui anime l'analyse, comme dans les catégories fondamentales de Ranganathan, et ce système a influencé une grande partie des recherches ultérieures, en particulier pour l'indexation des objets archéologiques.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Douglas J. FOSKETT : (formerly) director of central library services and Goldsmith'Librarian, University of London, England.
- Jacques MANIEZ : agrégé de l'Université, docteur en linguistique
Classification
Médias
Autres références
-
BIBLIOTHÈQUES NUMÉRIQUES
- Écrit par Yannick MAIGNIEN
- 5 199 mots
- 1 média
Les bibliothèques trouvent ici une confirmation de leur vocation première : à savoir décrire et signaler les collections,indexer leur contenu, tenir des bases d'autorité concernant une discipline ou un auteur, classer les documents dans des systèmes normés (Décimal, Dewey) et encyclopédiques.... -
HUMANITÉS NUMÉRIQUES
- Écrit par Thierry POIBEAU
- 5 372 mots
- 2 médias
...souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus. Plus récemment, il a été souligné, à juste titre, que... -
MOTEURS DE RECHERCHE
- Écrit par Brigitte SIMONNOT
- 4 699 mots
- 2 médias
Lespages Web collectées sont analysées par un logiciel qui procède à leur indexation. L'indexation consiste à caractériser les pages par des mots clés pour permettre de les retrouver. Dans le cas des moteurs de recherche, l'extraction de mots ou de groupes de mots à partir des documents est automatisée.... -
MOYEN ÂGE - La pensée médiévale
- Écrit par Alain de LIBERA
- 22 217 mots
...Saint-Cher, les dominicains de Saint-Jacques mettent en chantier une grande Concordance de la Bible(achevée vers 1240), véritable ouvrage de référence, où chaque mot est indexé du nom du livre dans lequel il est employé, d'un numéro de chapitre, enfin d'une lettre (de A à G) y notant sa place relative....