E-commerce : comment préserver votre site des erreurs HTML ?

Les sites e-commerce sont particulièrement concernées par les erreurs html du fait de leur grand volume de pages. Voici quelques outils pour détecter les erreurs et les solutions pour les corriger.

Outils de monitoring et de crawl

Des outils de monitoring et d’exploration sont indispensables pour identifier les erreurs SEO techniques. Voici les plus connus :
  • ScreamingFrog : C’est, de loin, l’un des meilleurs spider SEO.
  • Google Search Console : assurez-vous d’en ouvrir un pour votre site, car il vous informera des erreurs que les outils d’exploration ne pourront pas forcément trouver.
  • Google Analytics : analysez régulièrement vos rapports statistiques afin de vérifier qu’il n’y ait pas de baisses soudaines du trafic SEO, car cela peut parfois être du aux erreurs.
D’autres outils pertinents pour vérifier différents problèmes SEO :
  • W3C Validator : pour valider le code sur votre page d’accueil et vos template de page. Il permet de s’assurer que votre code HTML est valide afin que les moteurs de recherche puissent le lire correctement. Utilisez-le aussi pour valider vos sitemaps XML.
  • WebPageTest : utile pour tester la vitesse de chargement de vos pages. Il vous indique les éléments de vos pages qui ralentissent le plus votre site.
  • MxToolBox DNS Check : pour vérifier les problèmes DNS. S’il y a des erreurs, il faut en parler à votre hébergeur.
  • Pingdom : vérifie la disponibilité de votre site afin que vous soyez averti si votre site ne se charge pas ou a des problèmes de fiabilité.
  • Test SSL Labs : Pour s’assurer que votre SSL fonctionne correctement et qu’il n’est pas obsolète.

Erreurs 404

Les pages 404 nuisent à l’expérience utilisateur mais aussi à votre référencement naturel. Les liens qui pointent vers 404 pages perdent leur puissance.
Pour identifier vos erreurs 404 prioritaires à corriger (erreurs internes, causées via des pages de votre site), commencez par lancer une exploration de site dans ScreamingFrog. Une fois le crawl terminé, allez dans “Codes de réponse”, puis sélectionnez “Erreur client (4xx)” dans le menu déroulant “Filtre”.

Ensuite, exportez la liste pour l’analyser plus tard.
Pour chaque page, identifiez s’il existe une page de remplacement appropriée. Si c’est le cas vous devrez configurer une redirection 301 et mettre à jour vos liens internes. En effet, même si vos liens sont redirigés, ils seront moins puissants que des liens directs.
S’il n’y a pas de pages de remplacement possible, supprimez alors les liens vers la page afin qu’il n’y ait plus de liens brisés. Ne configurez pas simplement les redirections 301 sans mettre à jour les liens.
Ensuite, identifiez vos erreurs 404 de “priorité mineure”. Ce sont des liens brisés que vous ne liez pas à partir de vos propres pages, mais que d’autres sites lient. Cela peut être le résultat d’anciennes pages que vous avez supprimées, ou il se peut que les sites qui vous lient utilisent la mauvaise URL.
Vous pouvez les trouver dans Google Search Console en accédant à “Explorer” suivi de “Erreurs d’exploration” dans la navigation de gauche.

Choisissez “Introuvable” et exportez vos 404.
Éliminez les doublons 404 que vous avez déjà repérés via ScreamingFrog. Maintenant, identifiez si l’un d’entre eux a une page de redirection appropriée. Si c’est le cas, configurez une redirection 301 pour envoyer les utilisateurs vers la nouvelle page.
Surtout, ne définissez pas simplement une règle globale pour rediriger tous les visiteurs vers la page d’accueil. Ceci est considéré comme une erreur soft 404. Et a priori, Google ne les apprécie pas, ceci est le sujet de notre prochain paragraphe…

Softs 404

Une soft 404 est une page d’erreur qui n’apparaît pas comme une 404 aux yeux de Google. Google met explicitement en garde les Webmasters contre les soft 404, qui se présentent sous deux formes :
  • Pages “Page non trouvée” qui ressemblent à 404 aux utilisateurs, mais qui renvoient un code 200 et sont indexables par les moteurs de recherche.
  • 301 ou 302 qui redirige vers des pages non liées, comme la page d’accueil. Une redirection est normalement destinée à envoyer les utilisateurs vers le nouvel emplacement d’une page, et non à une page hors-sujet qui les décevra.
Trop de l’un ou l’autre va nuire à votre autorité auprès des moteurs de recherche.
Vous pouvez trouver ces erreurs soft 404 dans la Google Search Console, également dans la section “Erreurs d’exploration”.
Pour résoudre ce type d’erreur, vous pouvez :
  • Supprimer la règle de redirection qui redirige toutes les erreurs vers la page d’accueil
  • Assurez-vous que vos erreurs renvoient correctement des codes 404.
  • Créez une redirection spécifique à la page si une nouvelle page appropriée est disponible.
  • Republier la page afin qu’elle ne soit plus manquante. Si vous ne savez pas ce qui se trouvait auparavant à cette URL, vous pouvez utiliser la Wayback Machine pour voir ce qui se trouvait sur la page, en supposant qu’elle ait été explorée.
  • Autorisez la page à renvoyer un code d’état 404 s’il n’y a aucune page de remplacement possible, mais assurez-vous qu’aucun lien interne ne renvoie vers elle.
N’abusez pas trop des redirections dans un but SEO, ou vous enverrez un message aux résultats de recherche pour traiter vos 301 comme des 404.

Redirections en boucle

Assurez-vous aussi que votre site n’a pas de chaînes ou de boucles de redirection. Ce sont des séries de redirections, où une redirection mène à une autre, etc. Cela ne renvoie pas un signe positif pour votre SEO et en plus cela créer de la charge sur votre serveur. En plus, les boucles de redirection rendent les pages inaccessibles.

Remplacez toutes les chaînes de redirection par des redirections directement depuis la page déplacée vers son nouvel emplacement.
Une fois que vous avez résolu ce problème, utilisez ScreamingFrog pour identifier vos redirections 301 et 302.

Commencez par traiter vos redirections 302, car celles-ci sont censées être temporaires. Si certaines 302 sont en réalité permanentes, il faut les modifier en 301. Ensuite mettez bien à jour vos liens internes.

Canonical

Le canonical est une méthode de gestion des pages dupliquées, qui sont très courantes sur les sites e-commerce. Cette balise indique aux moteurs de recherche quelle version de la page doit être considérée comme légitime. Voici quelques grands principes sans s’étaler sur le sujet :
  • Utilisez la balise canonical pour adresser les variables d’URL qui re-trient ou filtrent le contenu sans le modifier autrement.
  • Canonicalisez les pages qui sont dupliquées car elles sont répertoriées dans plusieurs catégories.
  • Tout contenu paginé doit être canalisé vers une version complète non paginée.
  • Les pages personnalisées en fonction de l’utilisateur doivent être canonisées en une version non personnalisée.
Pour identifier les pages pouvant nécessiter une canonisation, vous pouvez utiliser ScreamingFrog pour identifier les balises de titre en double :

Ce sont très souvent, mais pas toujours, des doublons de la même page.

Noindex

Beaucoup de sites e-commerce ont souvent des milliers de pages ou plus, et un bon nombre d’entre eux peuvent être très faibles en qualité ou en contenu. Beaucoup peuvent être très semblables les uns aux autres sans être de purs doublons. D’autres peuvent présenter du contenu copié du fabricant qui est identique à ce que l’on trouvera sur d’autres sites e-commerce.
Dans certains cas, c’est une bonne idée de ne pas indexer certaines de vos pages. La balise Robots Noindex indique aux moteurs de recherche de supprimer la page des résultats de recherche. La balise noindex est à utiliser avec précaution.
Voici quelques pages qui devraient certainement être non indexées :
  • Zone admin ou espace client
  • Toute partie du système de paiement”Merci” ou pages de confirmation de paiement
  • Résultats de recherche interne
Quelques avertissements :
  • N’utilisez jamais “nofollow” sur vos propres liens ou contenus. Utilisez toujours <META NAME = “ROBOTS” CONTENT = “NOINDEX, FOLLOW”>. La balise “nofollow” indique aux moteurs de recherche de ne pas suivre vos liens.
  • Ne pas utiliser le canonical et le noindex sur une même page. Google a déjà averti sur ce type de problème. Dans le pire des cas, cela n’indexera pas votre page canonique, même si la balise noindex est seulement sur les doublons. Plus probablement, il traitera la balise canonique comme une erreur, mais cela signifie que le SEO partagé entre les doublons sera perdue.

Schema.org

Schema est un must pour les sites e-commerce, car il permet de fournir aux moteurs de recherche des méta-données utiles sur vos produits comme les évaluations des utilisateurs et les prix qui peuvent s’afficher ensuite dans les résultats des moteurs de recherche (=résultats enrichis).

Conclusion

Le SEO technique est important dans n’importe quelle structure, mais en raison de la taille massive des sites e-commerce, il est encore plus crucial pour les marchands. Gardez vos erreurs sous contrôle et votre SEO ne s’en portera que mieux !
Article inspiré et traduit depuis Searchenginewatch.com