Qu’est-ce qui est indexé par un moteur de recherche?

Quand un moteur de recherche a recopié le code HTML de votre page sur son serveur. Il va indexer les pages de votre site.

L’étape d’indexation

Ce processus n’est pas une opération “intégrale”. La performance de son algorithme de recherche est liée à sa capacité de retrouver immédiatement les mots importants correspondant aux requêtes des internautes.

Donc il n’enregistre pas la page entière dans son indexe. Il sauve des informations résumées sur le texte de votre page.

Quels mots, quelles séries de mots ( seul, couple, triplette, …) sont apparues et où ils ont été affichés sur la page.

Images, textes et médias riches peuvent également être indexés et stockés, mais ils ne seront trouvés que par les recherches avancées (exemple : Google image).

Les gens continuent d’utiliser des mots pour exprimer leurs recherches, et les moteurs de recherche se concentrent donc essentiellement sur les mots qui sont sur vos pages.

L’évolution de la recherche mobile

Ce qui change avec les recherches mobiles, c’est la conversion de la voix en texte par le microphone de la tablette ou du téléphone. La formulation de la recherche peut donc être plus complexe.

On dit d’ailleurs que Google est devenu un moteur de réponses. Il se préoccupe plus d’apporter une réponse que de vous aider à chercher.

Outre le texte de votre site, certains moteurs de recherche stockent aussi le contenu de vos balises META. La balise “META Description” est parfois utilisée pour afficher une description de votre page quand un internaute voit les résultats d’une recherche.

Il y a plus d’information sur les balises META dans le Chapitre 5.

Les liens hypertextes

A coté du contenu textuel, un moteur de recherche enregistre les informations sur les liens hypertextes de chaque page.

Cela permet au moteur de recherche de déterminer ce qui est sur la page, parce que les textes de l’ancre des liens hypertextes révèlent souvent quelque chose sur l’objet de la page ciblée.

Cela permet également de déterminer la “popularité des liens” et la “pertinence des pages” pointées par chaque site.

En termes SEO, on parle de “réputation des liens” d’une page. En gros : que disent les liens qui pointent sur une page données. Littéralement : que contiennent les libellés des ancres qui arrivent ici. Et ensuite on analyse la connexion “sémantique” entre les pages de départ et les pages d’arrivées.

Les liens restent le principal moyen des moteurs de recherche de découvrir de nouveaux sites et leurs pages web.

Variations entre les moteurs de recherche

Il y a beaucoup de différences entre les moteurs de recherche pour ce qui est réellement pris en compte comme “contenu” du texte.

Certains moteurs de recherche peuvent indexer le contenu de l’attribut “ALT” de la balise (image) sur la page, qui est souvent appelée à tort comme une balise “ALT”. D’autres font attention au nom des fichiers présents dans les URL qui sont parfois indexés.

Quel délai pour être indexé?

Même si un moteur de recherche trouve votre site tout de suite, il peut se passer plusieurs semaines avant qu’une personne utilisant le moteur de recherche vous trouve dans les résultats de recherche.

En règle générale, il ne faut pas plus de 1 à 2 semaines aux araignées pour vous trouver. Mais le retard est causé par le temps qu’il faut aux moteurs pour mettre à jour leur index avec vos liens.

Des milliers de serveurs voire plusieurs dizaines de milliers de serveurs doivent se synchroniser pour accueillir le résumé de vos pages.

Google n’a pas de programme payant d’inclusion, mais il fait un très bon travail de mise à jour de son index. Il inclut les nouvelles pages et des liens trouvés presque aussi vite qu’il les trouve.