Sitemap et couverture de l’index
Épisode N° 5 de la formation Google Search Console, publié le 01/09/2019 par Ronan HELLO et mis à jour le 07/10/2024Maintenant que nous avons vu les principaux formats de présentations dans les résultats de recherche de Google, nous allons nous intéresser à la soumission des pages et la compréhension de ces dernières par le robot d’indexation de Google.
Pour cette partie, assurez-vous que votre site web dispose d'un sitemap
(un fichier qui regroupe toutes les URL accessible de votre site internet). Pour les utilisateurs de Wordpress, il existe une multitude d’extensions pour créer votre sitemap XML en un rien de temps et simplement. Vous pouvez utiliser le plugin YoastSEO pour le générer (souvent installé de base sur vos sites WordPress par les agences).
Si vous utilisez d’autres outils de conception de site web, référez-vous à la documentation XML, la mise en place d’un sitemap
est essentiel pour informer Google de l’ensemble des pages que votre site contient !
Généralement, l’accès au sitemap
de votre site se fait par l’URL : mon-site.com/sitemap.xml
ou mon-site.com/sitemap_index.xml
Soumettre un sitemap XML
Pour optimiser vos chances d’être visible dans les résultats de recherche de Google, vous pouvez lui soumettre un ou plusieurs fichiers sitemap
. Pour cela renseignez l’URL de votre sitemap
dans la section ‘Ajouter un sitemap’. Ce fichier sitemap
peut être un sitemap
de sitemaps
(oui ça fait beaucoup), en clair, un fichier qui regroupe plusieurs adresses de fichiers sitemaps
, cela permet d’ordonner différentes parties du site web ou différentes ressources comme les images par exemple.
Une fois l’url du fichier soumis à la Search Console, l’outil doit l’analyser, cela peut prendre un peu de temps, je vous conseille donc de soumettre votre fichier le plus rapidement possible après la mise en ligne de votre site internet. A partir de là, les robots de Google iront de manière régulière crawler le fichier sitemap
en quête de changements et de nouvelles pages.
Un tableau des sitemaps
soumis sera alors affiché dans l’interface, vous permettant de voir combien d’URL google à découvert à l’aide de votre sitemap
, mais également la fréquence de lecture du fichier par les robots de Google. Si votre fichier sitemap
est invalide on contient des erreurs, vous devrez au plus rapidement corriger ces erreurs.
De même, les techniques de construction et d’optimisation du fichier sitemap
font partie d’une formation SEO technique, c’est pour cette raison que nous ne nous soucions ici que de la bonne soumission du fichier à la Search Console.
La couverture de l’index
Cette section de la GSC vous sert de rapport pour observer les évolutions de votre site dans l’index de Google. Chaque fois que vous créez une nouvelle page ou créez un nouvel article, la courbe et le nombre de pages valides devrait augmenter.
Le rapport vous permet d’afficher les pages avec des erreurs d’indexations, comme une page avec code HTTP 500
, ou une page bloquée par un fichier robots.txt.
Pour les pages valides, le rapport indique si la page a été envoyée et indexée par le fichier sitemap
, ou si la page a été trouvée par Google lui-même. Dans ce dernier cas, il serait judicieux d’ajouter la page découverte à votre fichier sitemap
afin de le compléter.
La partie la plus intéressante de cette section est selon moi est la dernière, le rapport sur les pages exclues. Cette partie concerne les pages qui n'ont pas été ajoutées ou ont été retirées de l’index de Google. Il est très important de comprendre pourquoi ces pages n’ont pas été indexées, voici une liste des raisons les plus courantes :
- la page n’existe plus (erreur
404
). - le robot d'indexation a reçu un code d'erreur HTTP (
4XX
/5XX
). - la page contient une balise
noindex
interdisant son indexation. - la page est automatiquement redirigée (redirection
301
/302
). - la page contient des erreurs de conception importante.
- la page est considérée comme frauduleuse.
- la page contient trop de texte de substitution (Lorem Ipsum).
Il est important de détecter ces erreurs et de tout faire pour que votre page soit à nouveau visible dans les résultats de recherche.
Dans la prochaine partie, nous allons nous intéresser à la compatibilité avec les mobiles et tablettes, une chose primordiale pour le web d’aujourd’hui.