Moteurs de recherche

Par moteur de recherche il faut comprendre qu’il s’agit bien d’une application web permettant de trouver des ressources à partir d’une requête sous forme de mots. Ces ressources peuvent alors être des pages web, des articles de forums Usenet, des images, des vidéos, des fichiers. Ces moteurs de recherches sont plus considérés comme des instruments de recherche sur le web sans intervention humaine. Dans la plupart de cas, ces moteurs fonctionnent grâce à des robots qui parcourent les sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses (URL).

South African fashionPour votre information, vous devez savoir que les moteurs de recherche ne s’appliquent pas seulement sur Internet. Certains moteurs sont des logiciels installés sur un ordinateur personnel. Et si l’on s’intéressait à savoir comment fonctionnent ces moteurs de recherche ? Le fonctionnement se décompose en 3 processus principaux.

L’exploration ou encore le crawl : ce processus consiste plus à l’exploration d’un robot d’indexation qui suit tous les liens hyperliens. C’est dans cette logique que vous pouvez comprendre un moteur de recherche comme un outil d’indexation qui dispose en soit une technologie de collecte de documents à distance sur les sites web.

L’indexation des ressources récupérées quant à elle consiste bien à extraire les mots considérés comme significatifs du corpus à explorer. Tous les mots extraits sont à leur tour enregistrés dans une base de données organisée comme un termes non significatifs notamment appelés des mots vides. Mais les termes significatifs sont alors associés à un poids.

La recherche comme dernier processus quant à elle correspond à la partie requêtes du moteur qui restitue les résultats. A ce niveau un algorithme est appliqué pour afin identifier le corpus documentaire. C’est alors que les moteurs de recherche les plus simples se contentent de requêtes booléennes pour comparer les mots d’une requête avec ceux des documents. Quant aux moteurs plus évolués, ils sont plus basés sur le paradigme du model vectoriel, par une similarité cosinus.