Formation Google Search Console

Sitemap et couverture de l’index

  • Episode N° 5
  • Difficulté facile
  • Publié le 01/09/2019 par
  • Dernière mise à jour le 24/01/2022

Maintenant que nous avons vu les principaux formats de présentations dans les résultats de recherche de Google, nous allons nous intéresser à la soumission des pages et la compréhension de ces dernières par le robot d’indexation de Google.

Pour cette partie, assurez-vous que votre site web dispose d'un sitemap (un fichier qui regroupe toutes les URL accessible de votre site internet). Pour les utilisateurs de Wordpress, il existe une multitude d’extensions pour créer votre sitemap XML en un rien de temps et simplement. Vous pouvez utiliser le plugin YoastSEO pour le générer (souvent installé de base sur vos sites WordPress par les agences).

Si vous utilisez d’autres outils de conception de site web, référez-vous à la documentation XML, la mise en place d’un sitemap est essentiel pour informer Google de l’ensemble des pages que votre site contient !

Généralement, l’accès au sitemap de votre site se fait par l’URL : mon-site.com/sitemap.xml ou mon-site.com/sitemap_index.xml

Soumettre un Sitemap

Pour optimiser vos chances d’être visible dans les résultats de recherche de Google, vous pouvez lui soumettre un ou plusieurs fichiers sitemap. Pour cela renseignez l’URL de votre sitemap dans la section ‘Ajouter un sitemap’. Ce fichier sitemap peut être un sitemap de sitemaps (oui ça fait beaucoup), en clair, un fichier qui regroupe plusieurs adresses de fichiers sitemaps, cela permet d’ordonner différentes parties du site web, ou différentes ressources comme les images par exemple.

Google Search Console soumettre un sitemap

Une fois l’url du fichier soumis à la Search Console, l’outil doit l’analyser, cela peut prendre un peu de temps, je vous conseille donc de soumettre votre fichier le plus rapidement possible après la mise en ligne de votre site internet. A partir de là, les robots de Google iront de manière régulière crawler le fichier sitemap en quête de changements et de nouvelles pages.

Un tableau des sitemaps soumis sera alors affiché dans l’interface, vous permettant de voir combien d’URL google à découvert à l’aide de votre sitemap, mais également la fréquence de lecture du fichier par les robots de Google. Si votre fichier sitemap est invalide on contient des erreurs, vous devrez au plus rapidement corriger ces erreurs.

De même, les techniques de construction et d’optimisation du fichier sitemap font partie d’une formation SEO technique, c’est pour cette raison que nous ne nous soucions ici que de la bonne soumission du fichier à la Search Console.

La couverture de l’index

Cette section de la GSC vous sert de rapport pour observer les évolutions de votre site dans l’index de Google. Chaque fois que vous créez une nouvelle page ou créez un nouvel article, la courbe et le nombre de pages valides devrait augmenter.

Google Search Console couverture de l'index Google

Le rapport vous permet d’afficher les pages avec des erreurs d’indexations, comme par exemple, une page avec code HTTP 500, ou une page bloquée par un fichier robots.txt.

Pour les pages valides, le rapport indique si la page a été envoyée et indexée par le fichier sitemap, ou si la page à été trouvée par Google lui-même. Dans ce dernier cas, il serait judicieux d’ajouter la page découverte à votre fichier sitemap afin de le compléter.

La partie la plus intéressante de cette section est selon moi est la dernière, le rapport sur les pages exclues. Cette partie concerne les pages qui n'ont pas été ajoutées ou ont été retirées de l’index de Google. Il est très important de comprendre pourquoi ces pages n’ont pas été indexées, voici une liste des raisons les plus courrantes :

  • la page n’existe plus (erreur 404).
  • le robot d'indexation a reçu un code d'erreur HTTP (4XX / 5XX).
  • la page contient une balise noindex interdisant son indexation.
  • la page est automatiquement redirigée (redirection 301 / 302).
  • la page contient des erreurs de conception importante.
  • la page est considérée comme frauduleuse.
  • la page contient trop de texte de substitution (Lorem Ipsum).

Il est important de détecter ces erreurs et de tout faire pour que votre page soit à nouveau visible dans les résultats de recherche.

Dans la prochaine partie nous allons nous intéresser à la compatibilité avec les mobiles et tablettes, une chose primordiale pour le web d’aujourd’hui.

Allez, ne t'arrête pas maintenant !
Commentaires

Vous devez être connecté pour pouvoir commenter. Se connecter