|
||||||||
|
|
|||||||
Pages
satellites (pages alias, pages miroir):
pages déconnectées du site principal destinées uniquement
à l'indexation par les moteurs de recherche en texte intégral
Pages doublons: pages permettant de mettre en ligne des pages jumelles de la page d'accueil,avec un code optimisé pour l'indexation. Annuaires de recherche : il s'agit de sites qui classent de façon thématique les sites qu'ils sélectionnent. Des éditeurs analysent le contenu des sites et créent des résumés de ce contenu pour orienter leurs visiteurs. Moteurs de recherche en texte intégral :un moteur de recherche comme Altavista permet d'effectuer des recherches en deux étapes. Son spider parcours le web, effectue des copies des pages qu'il trouve sur Internet et analyse les mots-clés contenus dans ces pages. L'indexeur retourne ce fichier, et le structure autour des mots-clés de façon à autoriser des recherches par mots-clés. Moteurs hybrides: certains outils de recherche comme Voilà utilisent à la fois une base de données de type annuaire (Quiquoiou dans le cas de Voilà) et une technologie de recherche en texte intégral (celle d'Echo dans le cas de Voilà). Moteurs sémantiques :certains outils de recherche comme Semio n'effectuent de recherche sur les mots-clés mais sur ces concepts. A partir d'un mot-clé, l'outil de recherche est capable d'élargir le champs de ses recherches à des concepts-liés au moyen d'un thesaurus. Le thesaurus est une liste de mots-clés qui possèdent des relations entre eux (ex : citroen INCLUS DANS automobile INCLUS DANS transport). Popularité: certains outils comme l'agent Alexa ou le moteur Goggle accordent une importance aux sites les plus populaires. Les méthodes utilisées varient largement d'un outil à l'autre. |