MOTEURS DE RECHERCHE
Article modifié le
Moteurs spécialisés
Recherche multimédia
Les premiers moteurs ont été développés pour la recherche de textes. Les documents publiés sous forme d'images, de sons ou de vidéos ont nécessité d'autres principes de repérage et d'indexation. En effet, en dehors du nom des fichiers, ces documents ne comportent pas de chaînes de caractères pour en caractériser le contenu. Les moteurs spécialisés dans la recherche d'images, de vidéos ou de fichiers son s'appuient principalement sur les mots qui environnent le média dans la page Web où il est présenté et sur les textes alternatifs fournis par les concepteurs de page.
Pour les images, la recherche à partir de reconnaissance automatique de formes s’est développée. Par exemple, dans sa recherche avancée, Google Images propose une option pour détecter les images correspondant à des visages. Il est aussi possible d’interroger le moteur en lui fournissant une représentation graphique.
Dans le domaine du son ou de la vidéo, la reconnaissance automatique de la parole permet de retranscrire les dialogues pour en extraire des termes d'indexation. Ces technologies ne sont mises en œuvre pour l'instant que dans des applications très ciblées.
Moteurs verticaux
Un moteur vertical n'indexe que certains sites spécialisés, de manière plus approfondie que ne le ferait un moteur généraliste. L'index est restreint aux documents concernant certains sujets (par exemple, l’actualité journalistique, la santé, les jeux, les compagnies aériennes) dans un ensemble prédéterminé de sites. Certains moteurs verticaux reposent sur une base spécifique de données, comme Legifrance pour les textes législatifs français.
Métamoteurs
Un métamoteur est une application qui ne dispose pas de son propre index. Il ne collecte donc pas les documents de manière autonome mais permet d'interroger simultanément un ou plusieurs moteurs existants. Sa valeur ajoutée tient soit à sa portée – il bénéficie de la couverture des différents moteurs interrogés (par exemple, dogpile.com) –, soit au traitement spécifique des résultats (Copernic Agent) ou encore à leur présentation originale (comme le faisait search-cube.com). Les métamoteurs ont été les premiers à proposer les résultats classés par catégories (clustering), et à fournir une aide à la reformulation de requêtes. Certains se sont spécialisés dans la préservation de la vie privée en masquant l'adresse IP de l'ordinateur qui interroge le moteur (par exemple, Ixquick fusionné en 2016 avec le métamoteur néerlandais Startpage, ou DuckDuckGo).
Moteurs de recherche et Web sémantique
Les documents de première génération publiés sur le Web étaient peu structurés. Des informations importantes – faciles à trouver sur les éditions imprimées – comme le nom de l'auteur, la date de publication ou encore le type de document n'y sont pas forcément repérables de manière automatique. Ainsi, la requête « livres Victor Hugo » sur un moteur de recherche fournit en résultats des pages Web présentant les œuvres de l'écrivain, d'autres évoquant des ouvrages parlant de lui, qu'il s'agisse de biographies ou d'analyses de ses œuvres. Les travaux de recherche sur le Web sémantique visent à doter les documents de données plus précises, celles-ci pouvant être liées entre elles. On parle de métadonnées pour désigner ces qualifications complémentaires qui apportent des informations à propos des documents. Les langages XML (extensible markup language) et RDF (resource description framework) permettent de représenter de telles métadonnées. En exploitant ces informations, les moteurs sont susceptibles de gagner en précision. Dans le domaine de l'information scientifique et technique, la plate-forme de recherche Isidore (isidore.science) met en œuvre de tels traitements.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Brigitte SIMONNOT : professeure des Universités émérite, Université de Lorraine, Nancy
Médias
Autres références
-
BIBLIOTHÈQUES NUMÉRIQUES
- Écrit par Yannick MAIGNIEN
- 5 198 mots
- 1 média
...compression graphique et d'image – MPEG –, encapsulant des métadonnées complexes, va dans le sens de cette intégration des documents textuels scannérisés. Actuellement, si l'OCR reste parfois approximative, elle s'avère suffisante pour des moteurs de recherchestatistique qui localiseront ensuite... -
CONSOMMATION - Comportement du consommateur
- Écrit par Bernard DUBOIS et Marc VANHUELE
- 9 030 mots
- 1 média
...emprise. Mais, dans tous les cas, savoir qui sont les consommateurs ayant considéré qu’ils ont un besoin plus ou moins urgent est évidemment très utile. Les moteurs de recherche sur Internet ont révolutionné le marketing parce que c’est là que les consommateurs signalent de plus en plus souvent leurs besoins.... -
INTERNET - Les applications
- Écrit par Danièle DROMARD et Dominique SERET
- 5 030 mots
Les moteurs de recherche ( Google, Yahoo!, AltaVista...) sont des serveurs spécialisés dans la recherche d'informations sur le Web. Leurs banques de données textuelles sont alimentées en permanence par des programmes automatiques d'indexation qui regroupent par thèmes les informations recueillies.... -
MÉDECINE ET INTERNET
- Écrit par Philippe MARREL , Elisabeth PARIZEL et René WALLSTEIN
- 5 396 mots
- 3 médias
...les recherches. En ce qui concerne Internet, véritable bibliothèque planétaire – on parlerait plutôt de base de données aujourd’hui –, c’est le rôle des moteurs de recherche d’établir le catalogue et d’attribuer les mots clés. Pour cela, le moteur passe systématiquement en revue les millions de sites de...