Refonte de votre site web: gérer les erreurs 404 et les redirections 301

Comment gérer vos erreurs 404 et 301?

Les pages d’erreurs 404 sont utilisées pour les ressources disparues

Vous venez de changer de thème pour votre site ou vous avez décidé de réorganiser les catégories.

Il peut arriver que la structure des URL ait été changée.

Et tous les liens internes de votre site ne sont pas automatiquement adaptés.

Si une personne clique dessus, ou un robot essaye de suivre le lien, votre serveur ne trouvant pas de page de destination, enverra un code d’alerte.

Ce code est le 404. (enfin il y a d’autres variantes, mais la plus fréquente est la 404)

Les causes fréquentes qui créent des ressources “manquantes“:

  • Le changement de permalinks peut causer ces erreurs
  • Vous changez la hiérarchie des articles dans vos catégories.
  • Vous changez de thème
  • Vous réorganisez vos catégories
  • Vous changez la logique de stockage de vos médias
  • Vous migrez vers un nouveau domaine

Commencer par vérifier (et créer/adapter) votre template 404

C’est une des choses qu’on oublie fréquemment quand on active un nouveau thème ou même qu’on en crée un nouveau.

On oublie de vérifier le fonctionnement de sa page d’erreur.

La page 404 va accueillir votre visiteur pour lui signaler « le cul-de-sac ».

Il y a moyen d’être créatif pour l’orienter dans sa navigation.

Par exemple en suggérant des articles populaires, derniers articles écrits par catégories, etc.

Aller voir sur le codex de WordPress pour comprendre les différents éléments techniques ingérés pour vos pages 404.

http://codex.wordpress.org/Creating_an_Error_404_Page

Le problème des liens cassé

Pénalités des robots?

Si vous parcourez les blogs, les forums, il ne sera pas rare d’entendre parler de pénalité pour vos liens cassés.

Du point de vue d’un moteur de recherche, il ne s’agit pas d’une pénalité, mais simplement d’une saine gestion de ses ressources.

Oui cela est problématique si vous avez un grand site et beaucoup d’erreurs

Si vous avez un grand site, je parle ici de milliers de pages, alors oui vous pouvez considérer souffrir d’une pénalité.

En réalité vous êtes le seul responsable.

Vous êtes responsable de vos ressources, de leurs disponibilités, la performance de vos serveurs.

Si les robots n’indexent plus vos contenus, vous êtes le principal responsable 🙂

Non ce n’est pas dramatique si vous avez un petit site

Si vous avez un petit site jusque quelques centaines de pages.

Alors vous ne devriez pas trop souffrir de quelques liens cassés.

C’est toujours un désavantage, car vous avez besoin de toutes vos ressources.

Elles vous aident à créer une belle architecture.

Toutes les pages et tous les liens comptent.

Une page manquante et c’est rapidement 20 à 100 liens qui ne seront plus distribués sur votre site.

Pourquoi est-ce un problème pour mon référencement?

Les robots sont des radins

Eh oui, vous ne le savez sans doute pas, mais les robots sont aussi stressés que vous.

Leurs missions sont de passer le moins de temps possible pour indexer le maximum de contenus.

Pour votre information, on estime le Dark Web à une taille 500 fois supérieure à celle du Web connu.

Google dispose d’une force de frappe colossale avec ces robots qui naviguent en continu.

Il approche une indexation en temps réel pour les principales sources d’information qu’il a répertoriées.

Mais il est loin de pouvoir indexer tout le Web.

En conclusion les robots de Google:

  • Ils consacrent peu de temps à votre site, juste ce qu’il faut.
  • S’il y a trop de 404… ils consacreront moins de temps, la prochaine fois, à venir parcourir toutes vos pages
  • Donc vos contenus auront moins de chance d’être bien analysés et bien indexés
  • Ce n’est donc pas une « pénalité » infligée… mais une « cause » qui peut réduire l’intérêt des robots pour votre site

Comment régler cela?

Il existe différentes approches

  • Il est possible que vous ayez beaucoup de travail pour corriger ses ressources cassées.
  • Comme il est possible de ne pas avoir grand-chose à corriger.
  • Suivant la taille de votre site, son historique, les transformations, les changements de thèmes, des restructurations ….

Il existe principalement deux approches :

  1. Faire un état des lieux général
  2. Surveiller par petites périodes les demandes des robots et des visiteurs

Un crawler pour un audit général

  1. Audit et état des lieux
    1. En utilisant un crawler, vous allez stimuler le fonctionnement d’un robot.
    2. Vous n’obtiendrez pas évidemment toutes les informations Google est capable d’obtenir sur votre site.
    3. Mais vous obtiendrez des listings des différents éléments reflétant la qualité de votre site.
  2. Lister l’ensemble des ressources « cassées » : pages, images, fichiers…
    1. Pour les pages 404, not aimerais certainement des listings spécifiques aux ressources manquantes.
    2. En général vous obtenez les pages sources sur lesquels les liens sont cassés.
    3. Vous aurez aussi les images et les fichiers disparus.

Quel crawler utiliser?

SEO screaming frog

C’est certainement l’utilitaire peut plus simple à utiliser.
Son usage gratuit jusqu’à 500 pages. Que vous devrez exporter en csv les listes de fichiers que vous souhaiterez travailler.

Xenu Link Sleuth ..

Il est minimaliste, mais un outil idéal pour checker rapidement les liens cassés sur votre site.

http://home.snafu.de/tilman/xenulink.html

Mitambo

C’est notre logiciel maison qui est réservé à nos clients.

http://www.mitambo.com

Un plugin pour gérer cela directement dans WordPress

Un outil qui va veiller en temps réel

Certains plugins surveillent les en-têtes des pages renvoyées par WordPress.

Ils peuvent intercepter en temps réel les différents messages, dont les erreurs 404.

Vous permettre de créer des redirections manuellement

Plusieurs plugins vous proposent différentes façons de gérer les redirections.

Certains essaient de trouver les bonnes ressources.

D’autres vous demandent de créer manuellement les redirections.

Plusieurs dizaines de plugins existent

Le but n’est pas d’être exhaustif ou de vous recommander stricto-census d’utiliser « ces » plugins là.

Mais cela vous donnera différentes idées sur ce qui peut-être fait pour gérer ce problème.

Redirection

Il surveille en direct les demandes des robots des visiteurs. Il vous liste les erreurs. Que vous pouvez corriger rapidement.

http://urbangiraffe.com/plugins/redirection/

404 Notifier

Il vous notifie les erreurs 404 qui se produisent sur le site.

http://wordpress.org/extend/plugins/404-notifier/

Smart 404

Ce plug-in vous assiste en cherchant la meilleure source à proposer au visiteur qui tomberait sur des ressources 404. Il peut proposer une liste s’il n’a pas de solution unique.

http://atastypixel.com/blog/wordpress/plugins/smart-404/

Google 404

Permets d’embarquer une recherche Google Google sur une page 404 customisée.

https://wordpress.org/plugins/google-404/

Useful 404s

Un plug-in pour créer des pages 404 utiles

http://wordpress.org/extend/plugins/useful-404s/

The Free 404 Plugin

Ce plugin crée une page 404 personnalisée en listant des articles associés aux mots-clés présents dans l’URL demandée [mais disparue]

http://www.404plugin.com/

JH 404 Logger

Un widget pour votre tableau de bord qui vous liste les erreurs 404 rencontrées.

 http://www.joehoyle.co.uk/jh-404-logger/

WP 404 Images Fix

Il remplace les images renvoyant un 404 par une image par défaut.

http://www.htmlremix.com/projects/wordpress-broken-image-fix

Dunstan-style Error Page

Permets de créer une page d’erreur personnalisée en affichant les 5 derniers articles, un zone de recherche et des options pour rapporter les erreurs rencontrées.

http://andrewferguson.net/wordpress-plugins/dunstan-style-error-page/

Permalinks Moved Permanently

Il prend le slug [morceau d’URL] demandé et cherche pour voir où il pourrait se trouver… avant d’envoyer un erreur 404

 https://wordpress.org/plugins/permalinks-moved-permanently/

Les 301 et 302

Les redirections sont donc utiles pour orienter vos visiteurs et pour guider les robots.

Il est même possible de conserver l’influence des liens externes à votre site en les déplaçant sur la « nouvelle » direction.

  • Le statut d’en-tête HTTP utilisé pour rediriger [un robot ou un visiteur]
  • Quand vous demandez une page à un site, ou qu’un robot demande une page, le serveur renvoie d’abord un en-tete avec un statut pour prévenir de ce qu’il a compris.
  • On va expliquer que la ressource manquante a été déplacée à tel endroit
    • Quand on détecte une erreur 404, il existe plusieurs façons d’indiquer où cette ressource a été déplacée. On peut utiliser un fichier. htaccess.
  • 301 => redirection permanente
    • Refonte de votre site web
  • 302 => redirection temporaire
    • exemple en e-commerce, un annuaire de petites annonces,… si un produit n’est plus de stock [mais que vous ne voulez pas utiliser sa page pour d’autre usage]
    • ne pas utiliser cela pour rediriger vers un « domaine externe » [même un nouveau domaine à vous] > c’est une technique fort utilisée par les spammeurs.
  • pour le SEO => faire suivre le « juice link »
    • la force des liens externes au site [pour conserver les liens qui ont été créé pour vous]
    • 301 sera préféré pour « rassurer » un robot

Crédit Photo neekoh.fi