Sitemap et couverture de l’index

  • Episode N° 5
  • Publié le 01/09/2019
  • Dernière mise à jour le 01/09/2019

Maintenant que nous avons vu les principaux formats de présentations dans les résultats de recherche de Google, nous allons nous intéresser à la soumission des pages et la compréhension de ces dernières par le robot d’indexation de Google.

Pour cette partie, il faut que votre site web possède un sitemap (un fichier qui regroupe toutes les URL accessible de votre site internet). Pour les utilisateurs de Wordpress, il existe une multitude d’extensions pour créer votre sitemap XML en un rien de temps et simplement. Vous pouvez utiliser le plugin YoastSEO pour le générer (souvent installé de base sur vos sites WordPress par les agences). Si vous utilisez d’autres outils de conception de site web, référez-vous à la documentation XML, la mise en place d’un sitemap est essentiel pour informer Google de l’ensemble des pages que votre site contient !

Généralement, l’accès au sitemap de votre site se fait par l’URL : mon-site.com/sitemap.xml

Soumettre un Sitemap

Pour optimiser vos chances d’être visible dans les résultats de recherche de Google, vous pouvez lui soumettre un ou plusieurs fichiers sitemap. Pour cela renseignez l’URL de votre sitemap dans la section ‘Ajouter un sitemap’. Ce fichier sitemap peut être un sitemap de sitemap (oui ça fait beaucoup), en clair, un fichier qui regroupe plusieurs adresses de fichiers sitemaps, cela permet d’ordonner différentes parties du site web, ou différentes ressources comme les images par exemple.

Google Search Console soumettre un sitemap

Une fois l’url du fichier soumis à la Search Console, l’outil doit l’analyser, cela peut prendre un peu de temps, je vous conseille donc de soumettre votre fichier le plus rapidement possible après la mise en ligne de votre site internet. A partir de là, les robots de Google iront de manière régulière le fichier sitemap en quête de changements et de nouvelles pages.

Un tableau des sitemaps soumis sera alors affiché dans l’interface, vous permettant de voir combien d’URL google à découvert à l’aide de votre sitemap, mais également la fréquence de lecture du fichier par les robots de Google. Si votre fichier sitemap est invalide on contient des erreurs, vous devrez au plus rapidement corriger ces erreurs.

De même, les techniques de construction et d’optimisation du fichier sitemap font partie d’une formation SEO technique, c’est pour cette raison que nous ne nous soucions ici que de la bonne soumission du fichier à la Search Console.

La couverture de l’index

Cette section de la GSC vous sert de rapport pour observer les évolutions de votre site dans l’index de Google. Chaque fois que vous créez une nouvelle page ou créez un nouvel article, la courbe et le nombre de pages valides devrait augmenter.

Google Search Console couverture de l'index Google

Le rapport vous permet d’afficher les pages avec des erreurs d’indexations, comme par exemple, une page avec code HTTP 500, ou une page bloquée par un fichier robots.txt.

Pour les pages valides, le rapport indique si la page a été envoyée et indexée par le fichier sitemap, ou si la page à été trouvée par Google lui-même. Dans ce dernier cas, il serait judicieux d’ajouter la page découverte à votre fichier sitemap afin de le compléter.

La partie la plus intéressante de cette section est selon moi est la dernière, le rapport sur les pages exclues. Cette partie concerne les pages qui existent ou qui ont existées et qui pour certaines raisons, n’ont pas été ajoutées ou ont été retirées de l’index de Google. Il est très important de comprendre pourquoi ces pages n’ont pas été indexées. Il existe de multiples raisons, par exemple la page n’existe plus, le robot de Google a reçu un code HTTP 404, la page contient une balise noindex interdisant son indexation, est-elle automatiquement redirigée, la page contient des erreurs de conception importante, la page est considérée comme frauduleuse etc…

Dans la prochaine partie nous allons nous intéresser à la compatibilité avec les mobiles et tablettes, une chose primordiale pour le web d’aujourd’hui.