Fichier sitemap.xml : Définition, utilité SEO, Comment le créer ?

Comment créer un fichier sitemap.xml ? Utilité SEO ?

Parmi les différentes check-lists SEO que l’on eut retrouver sur le Web, il existe un fichier redondant que l’on appelle le sitemap.xml. A ne pas confondre avec le plan de site, ce fichier doit requérir toute votre attention pour plusieurs raisons ; C’est pour cela qu’il est observé par chaque expert SEO. Étudions ici son utilité mais également comment vous pourriez le créer.

  1. Définition et généralités du fichier sitemap.xml
  2. Exemple de fichier sitemap
  3. Explications des indications
  4. Le sitemap pour la gestion multilingue ?
  5. Conclusion

Définition et généralités du fichier sitemap.xml

Proposé par Google, le protocole sitemap date de 2005 ; il a été repris énormément, notamment avec l’avènement des CMS. Pour WordPress, par exemple, nous vous invitions à utiliser Google Sitemap xml. C’est donc une (très) vieille histoire du Web.

Le xml (Extensible Markup Language) est ce qu’on appelle un métalangage en informatique. Il est issu du SGML ou Standard Generalized Markup Language. Le XML permet de proposer des noms via ses chevrons (< >). Les balises d’un fichier .xml ont donc pour but de clarifier les contenus textes pour les machines. Enregistré avec un encodage utf-8, ce qui est clairement devenu la norme du Web aujourd’hui, vous devez utiliser des valeurs dites « d’échappement »pour certains caractères comme par exemple les guillemets :&quot;

Comme le rappelle le site sitemap.org, ce fichier .xml permet aux webmasters d’indiquer facilement quels contenus sont disponibles à l’exploration pour les moteurs de recherche. Le soumettre notamment au travers de l’usage de la Google Search console, du Webmaster tools de Bing, de la console des Webmaster de Yandex ou même Baidu fait partie le plus souvent des prérequis. A la création d’un nouveau compte sur Bing et Google, il vous l’est proposé. Vous pouvez également rappeler sa présence dans le fichier robots.txt que vous avez nécessairement configuré pour votre site Internet (très fréquent sur les E-commerce). Installez-le à la racine de votre serveur.

Attention : rien ne garantit l’indexation des pages précisées dans le fichier

Soumettre un fichier .xml, c’est une invitation au crawl supplémentaire ; de ce fait, il revêt un caractère intéressant pour les sites composés de plusieurs centaines voire milliers de pages et également dans le cadre d’une arborescence particulière. On prendra soin tout de même dans ce dernier cas que sans ce fichier, les pages s’indexent correctement. En soi, l’usage de ce fichier ne relève pas du référencement puisque cela ne peut vous aider directement à un meilleur positionnement sur les moteurs de recherche.

Exemple de fichier sitemap.xml

A l’aide d’outils comme XML Copy Editor, vous pourrez créer et corriger facilement un fichier .xml. Sachez que la moindre erreur de balisage plombe l’ensemble du fichier. Voici un petit exemple restreint :

Petit exemple de sitemap pour une page d'accueil
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
  <loc>https://monsiteinternet.com/</loc>
  <changefreq>daily</changefreq>
  <priority>0.9</priority>
 </url>
</urlset>

Explications des indications :

La première ligne correspond au type de document.  La balise <urlest> commence et termine </urlest> le fichier. La balise <url> est utilisé à chaque ajout d’adresse Web mais doit obligatoirement être complétée par le champ <loc>. Une url peut renvoyer vers du html, du pdf, de la vidéo. Notez qu’elle doit être absolue.

Dans l’exemple ci-dessus, certainement incomplet pour la plupart des configuration, il est précisé à l’attention des moteurs que la page change « probablement » fréquemment (tous les jours) avec une priorité élevée (o,9) de la page en question en rapport avec les autres : il s’agit ici pour l’exemple d’une page d’accueil.

Vous pourriez également ajouter une balise <lastmod> pour préciser une heure au format W3C du dernier changement (facultatif au même titre que le changement probable de la page <changefreq> et la priorité). Concernant ce format « W3C », il s’agit de la norme ISO 8601. Exemple : YYYY-MM-DD voire si vous le souhaitez : YYYY-MM-DDThh:mm:ssTZD

L’usage du sitemap pour les sites multilingues

La question du multilingue est parfois épineuse pour les sites. Il est parfois compliqué également d’utiliser correctement les balises hreflang. Google propose ainsi d’utiliser le fichier que nous traitons ici pour fournir les attributs rel= »alternate » et hreflang= »x ». Il nous est précisé ici qu’il est préférable de spécifier dans ce type de fichier l’espace de noms xhtml :

Spécification de l'espace des noms xhtml
xmlns:xhtml="http://www.w3.org/1999/xhtml"

Pour chaque élément <url>, vous devez ainsi indiquer un sous élément de type :

Utiliser le sitemap pour le multilingue
<url>
  <loc>https://monsupersite.com/fr</loc>
  <xhtml:link
      rel="alternate"
      hreflang="en"
      href="https://monsupersite.com/en" />
  <xhtml:link
      rel="alternate"
      hreflang="fr"
      hreflang="htttp://monsupersite.com/fr" />
</url>

Pour plus de précisions également pour la question liguistique (par exemple en_GB), voir ce que nous dit la firme de Mountain View.

Conclusion

Le fichier sitemap, s’il ne représente pas un besoin en termes de référencement, le devient souvent pour des raisons de structure du site. A peu près inutile sur les tout petits sites (en tous cas négligeables au reste des autres actions d’optimisation), il facilite le crawl, permet un distingo entre les langues et régions cibles comme évoqué dans le dernier point : ce sont dans ce cas des facteurs très influents.

Si le fichier est bien conçu, il apporte ainsi une possibilité supplémentaire de lecture des nouvelles urls par les robots, favorisant également la lecture des liens internes de chaque document. N’oubliez pas de faire valider votre fichier dans la Search Console, Google vous dit s’il a des problèmes de lecture !

[Total : 3    Moyenne : 5/5]

A propos de l'auteur(e)

Pas de commentaire

Centre de préférences de confidentialité

Google Analytics

Google Analytics est un outil Google d'analyse d'audience Internet permettant aux propriétaires de sites Web et d'applications de mieux comprendre le comportement de leurs utilisateurs. Cet outil peut utiliser des cookies pour collecter des informations et générer des rapports sur les statistiques d'utilisation d'un site Web sans que les utilisateurs individuels soient identifiés personnellement par Google. Le cookie "__ga" est celui qui est le plus utilisé par Google Analytics.
En plus d’établir des rapports statistiques d’utilisation des sites web, Google Analytics peut également être utilisé, conjointement avec certains des cookies publicitaires décrits précédemment, pour proposer des publicités plus pertinentes sur les services Google (comme Google Search), sur l’ensemble d’Internet et pour mesurer votre interaction avec les publicités que nous affichons.

Google Analytics
_ga, _gid, _gat

Publicité Google

Google AdSense est un programme de monétisation proposé par Google aux éditeurs de sites web pour générer des revenus publicitaires à la performance. Un éditeur de site web peut adhérer gratuitement au programme et bénéficier d’affichages publicitaires sur son site en y plaçant des tags publicitaires correspondant aux formats de son choix par simple copier / coller d’un code fourni par le programme.
Google utilise des cookies pour rendre la publicité plus attractive pour les utilisateurs et plus rentable pour les éditeurs et les annonceurs. Les cookies servent ainsi également à sélectionner les publicités en fonction de leur pertinence pour l'utilisateur, à améliorer les rapports sur les performances des campagnes et à éviter la diffusion d'annonces que l'utilisateur a déjà vues.

Google AdSense
NID,SID,DSID, FLC, AID, TAID