Skip to main content

Fichier Sitemap.Xml

Le fichier sitemap.xml et le référencement naturel (SEO technique)

Le sujet de cet article sur le référencement naturel est de vous donner quelques informations sur ce qu’est le fichier sitemap.xml, comment le créer et comment l’utiliser pour référencer votre site dans les différents moteurs de recherche tels que Google, Yahoo, Bing

A quoi sert le fichier sitemap.xml ?

Pour les sites web comprenant un nombre important de pages, le fichier « sitemap.xml » permet d’aider les moteurs de recherche à découvrir les nouvelles pages ou celles qui ont été récemment mises à jour.

Ensuite, pour les sites web qui n’ont pas un riche maillage interne, le fichier « sitemap.xml » permet de donner des informations aux moteurs de recherche.

Pour les sites web qui viennent d’être lancés et qui n’ont donc pas de liens externes qui pointent sur leurs pages, le fichier « sitemap.xml » va être utile aux moteurs de recherche pour leur phase d’analyse et d’indexation de pages.

Comment créer un fichier sitemap.xml efficace ?

La plupart des logiciels de création de sites web, tels que WordPress, Joomla ou Drupal, permettent de créer facilement un fichier « sitemap.xml » mais sinon ce n’est pas très compliqué.

Pour savoir si le fichier « sitemap.xml » existe, il vous suffit de taper dans la barre d’adresse de votre navigateur web, l’URL suivante :

http://www.votresiteinternet.fr/sitemap.xml

ou

https://www.votresiteinternet.fr/sitemap.xml

suivant que vous avez ou pas le protocole SSL activé.

Il faut savoir qu’un sitemap n’est pas un fichier dont le contenu est figé. En effet, il doit évoluer en fonction des modifications effectuées sur votre site web. En effet, c’est le cas lorsque des nouvelles pages sont créées ou modifiées. Pour des raisons pratiques, il vaut donc mieux automatiser la prise en compte de ces changements dans le fichier « sitemap.xml ».

Toutefois, pour les sites internet qui ne se basent pas sur WordPress, la meilleure manière d’automatiser la mise à jour du fichier « sitemap.xml » est de trouver le composant additionnel (plugin) ou le logiciel nécessaire. Cependant, faites attention à ce que ce plugin ou ce logiciel additionnel respecte bien les directives de Google pour ne pas avoir de souci avec votre référencement.

Pour les sites internet qui utilisent WordPress, il y a des extensions qui gèrent très bien les mises à jour automatiques du fichier « sitemap.xml ».

Que faut-il mettre dans un sitemap pour un bon référencement ?

Avant d’entrer dans les détails, il est important de bien comprendre ce qu’il faut mettre dans le fichier « sitemap.xml » pour un bon référencement.

En effet, la majorité des CMS, tels que WordPress, Drupal et Joomla, savent créer un sitemap. Ainsi, le sitemap peut être pour les pages d’un site, les articles de blog, les images et les vidéos. Ainsi, tout cela doit être optimisé pour un bon référencement.

Toutefois, nous recommandons de n’intégrer dans le sitemap que les pages qui sont importantes. Avec un contenu de bonne qualité et qui peuvent amener des visites.

Cependant, excluez les pages qui présentent un contenu identique ou similaire. Toutefois, pour les sites web, intégrez les pages de vos anciens articles de blog.

Excluez du fichier « sitemap.xml » tout ce qui a un contenu de faible qualité. En effet, ce n’est pas le nombre de pages qui est important, mais l’intérêt de leur contenu.

Dans le fichier « sitemap.xml », vous pouvez différencier les pages que vous ne souhaitez pas faire indexer. Pour ce faire, il suffit d’indiquer le paramètre « no-index ». En outre, vous pouvez mettre ces pages dans une catégorie et ensuite exclure cette catégorie de l’indexation.

Très important !

Dans le fichier « sitemap.xml », ne mettez pas de pages protégées par mot de passe ou par un autre système d’authentification.

Vérifiez que le fichier « sitemap.xml » indique bien la date de dernière modification de vos pages.

Pour les sites web qui ont beaucoup de contenu (textes, vidéos, images…) vous pouvez créer un fichier « sitemap.xml » adapté à chaque type d’information. Par exemple :

https://www.votresiteweb.fr/pages-sitemap.xml
https://www.votresiteweb.fr/videos-sitemap.xml
https://www.votresiteweb.fr/illustrations-sitemap.xml

Le fichier « sitemap.xml » est un fichier texte, au format UTF-8, qui contient les URL complètes, dites URL absolues, des différents éléments contenus dans votre site : pages, images, vidéos… en associant pour chacune de ces URL, des informations complémentaires comme :

  • la date de dernière modification,
  • la fréquence de la mise à jour de l’élément concerné
  • l’importance de l’élément par rapport aux autres.

N’utilisez pas des URL relatives dans le fichier sitemap.xml

L’ensemble de ces informations facilite l’exploration du site par les moteurs de recherche.

Nous vous donnons un exemple d’un sitemap avec les différentes options possibles et leur signification :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.votresiteweb.com/</loc> => l'URL ne doit pas comporter plus de 2048 caractères
<lastmod>2020-01-01</lastmod>           => date de la dernière mise à jour, au format américain
<changefreq>monthly</changefreq>        => fréquence de la mise à jour (ici mensuellement) mais la valeur peut être always, hourly, daily, weekly, yearly, never
<priority>0.8</priority>                => importance par rapport aux autres éléments du site (peut être entre 0.0 et 1.0). Par défaut, la valeur est de 0.5.
</url>
</urlset>

A noter que la valeur attribuée à <changefreq> n’est qu’indicative et ne constitue en aucune manière une obligation pour les moteurs de recherche.

La nombre de lignes d’un fichier est de 50 000 et son poids ne doit pas excéder 50 Mo. Toutefois, il ne faut pas compresser ce fichier. Ainsi, ceci permet de faire pas mal de choses. En outre, on peut avoir jusqu’à 500 fichiers de référencement sitemap pour 1 seul et même site web.

Dans le cas où vous souhaitez utiliser plusieurs fichiers « sitemap.xml », il faut un fichier « sitemap.xml » principal qui contient les instructions qui permettent de localiser les autres fichiers « sitemap ». Par exemple :

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.exemple.com/sitemap1.xml</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.exemple.com/sitemap2.xml</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

Pour indiquer l’emplacement du fichier dans « robots.txt », ajoutez :

Sitemap: http://www.exemple.com/sitemap.xml

dans votre fichier « robots.txt »

Quand votre fichier « sitemap.xml » est prêt, vous pouvez l’envoyer à Google pour qu’il l’analyse en l’envoyant depuis la console d’administration (Google Search Console) et en le précisant dans votre fichier « robots.txt » avec les instructions :

User-agent: *
Allow: /
Sitemap: https://www.votresiteinternet.fr/sitemap.xml

Quand votre fichier a été envoyé à Google, il faut patienter quelques jours avant de voir dans la console d’administration Google, les pages qui auront été indexées.

Si vous utilisez Prestashop, depuis la version 1.7, le module qui permettait de créer le fichier sitemap.xml n’existe plus mais on peut utiliser celui qu’on peut télécharger sur Github ou télécharger un module sitemap pour Prestashop.

Quand est-il nécessaire de soumettre un flux RSS à Google ?

Si vous avez un site internet avec beaucoup de pages qui sont fréquemment mises à jour, comme c’est le cas pour les sites internet d’actualité, alors vous pouvez utiliser un flux RSS pour informer Google des modifications faites sur votre site internet.

Le flux RSS n’incluera que les nouvelles pages, ce qui fait qu’il sera traité plus rapidement. C’est la différence avec votre plan de site qui, lui, inclue toutes vos pages.

Les schémas couvrent de nombreux types de contenus : articles, vidéos, images… mais aussi concernant des entreprises et des personnes.

Pour en savoir plus sur le fichier sitemap.xml et son optimisation, contactez Olivier Informaticien