Comment créer un fichier sitemap.xml ? Utilité SEO ?

Parmi les différentes check-lists SEO que l’on eut retrouver sur le Web, il existe un fichier redondant que l’on appelle le sitemap.xml. A ne pas confondre avec le plan de site, ce fichier doit requérir toute votre attention pour plusieurs raisons ; C’est pour cela qu’il est observé par chaque expert SEO. Étudions ici son utilité mais également comment vous pourriez le créer.

  1. Définition et généralités du fichier sitemap.xml
  2. Exemple de fichier sitemap
  3. Explications des indications
  4. Le sitemap pour la gestion multilingue ?
  5. Conclusion

Définition et généralités du fichier sitemap.xml

Proposé par Google, le protocole sitemap date de 2005 ; il a été repris énormément, notamment avec l’avènement des CMS. Pour WordPress, par exemple, nous vous invitions à utiliser Google Sitemap xml. C’est donc une (très) vieille histoire du Web.

Le xml (Extensible Markup Language) est ce qu’on appelle un métalangage en informatique. Il est issu du SGML ou Standard Generalized Markup Language. Le XML permet de proposer des noms via ses chevrons (< >). Les balises d’un fichier .xml ont donc pour but de clarifier les contenus textes pour les machines. Enregistré avec un encodage utf-8, ce qui est clairement devenu la norme du Web aujourd’hui, vous devez utiliser des valeurs dites “d’échappement”pour certains caractères comme par exemple les guillemets :&quot;

Comme le rappelle le site sitemap.org, ce fichier .xml permet aux webmasters d’indiquer facilement quels contenus sont disponibles à l’exploration pour les moteurs de recherche. Le soumettre notamment au travers de l’usage de la Google Search console, du Webmaster tools de Bing, de la console des Webmaster de Yandex ou même Baidu fait partie le plus souvent des prérequis. A la création d’un nouveau compte sur Bing et Google, il vous l’est proposé. Vous pouvez également rappeler sa présence dans le fichier robots.txt que vous avez nécessairement configuré pour votre site Internet (très fréquent sur les E-commerce). Installez-le à la racine de votre serveur.

Attention : rien ne garantit l’indexation des pages précisées dans le fichier

Soumettre un fichier .xml, c’est une invitation au crawl supplémentaire ; de ce fait, il revêt un caractère intéressant pour les sites composés de plusieurs centaines voire milliers de pages et également dans le cadre d’une arborescence particulière. On prendra soin tout de même dans ce dernier cas que sans ce fichier, les pages s’indexent correctement. En soi, l’usage de ce fichier ne relève pas du référencement puisque cela ne peut vous aider directement à un meilleur positionnement sur les moteurs de recherche.

Exemple de fichier sitemap.xml

A l’aide d’outils comme XML Copy Editor, vous pourrez créer et corriger facilement un fichier .xml. Sachez que la moindre erreur de balisage plombe l’ensemble du fichier. Voici un petit exemple restreint :

[pastacode lang=”markup” manual=”%3C%3Fxml%20version%3D%221.0%22%20encoding%3D%22UTF-8%22%3F%3E%0A%3Curlset%20xmlns%3D%22http%3A%2F%2Fwww.sitemaps.org%2Fschemas%2Fsitemap%2F0.9%22%3E%0A%20%3Curl%3E%0A%20%20%3Cloc%3Ehttps%3A%2F%2Fmonsiteinternet.com%2F%3C%2Floc%3E%0A%20%20%3Cchangefreq%3Edaily%3C%2Fchangefreq%3E%0A%20%20%3Cpriority%3E0.9%3C%2Fpriority%3E%0A%20%3C%2Furl%3E%0A%3C%2Furlset%3E” message=”Petit exemple de sitemap pour une page d’accueil” highlight=”” provider=”manual”/]

Explications des indications :

La première ligne correspond au type de document.  La balise <urlest> commence et termine </urlest> le fichier. La balise <url> est utilisé à chaque ajout d’adresse Web mais doit obligatoirement être complétée par le champ <loc>. Une url peut renvoyer vers du html, du pdf, de la vidéo. Notez qu’elle doit être absolue.

Dans l’exemple ci-dessus, certainement incomplet pour la plupart des configuration, il est précisé à l’attention des moteurs que la page change “probablement” fréquemment (tous les jours) avec une priorité élevée (o,9) de la page en question en rapport avec les autres : il s’agit ici pour l’exemple d’une page d’accueil.

Vous pourriez également ajouter une balise <lastmod> pour préciser une heure au format W3C du dernier changement (facultatif au même titre que le changement probable de la page <changefreq> et la priorité). Concernant ce format “W3C”, il s’agit de la norme ISO 8601. Exemple : YYYY-MM-DD voire si vous le souhaitez : YYYY-MM-DDThh:mm:ssTZD

L’usage du sitemap pour les sites multilingues

La question du multilingue est parfois épineuse pour les sites. Il est parfois compliqué également d’utiliser correctement les balises hreflang. Google propose ainsi d’utiliser le fichier que nous traitons ici pour fournir les attributs rel=”alternate” et hreflang=”x”. Il nous est précisé ici qu’il est préférable de spécifier dans ce type de fichier l’espace de noms xhtml :

[pastacode lang=”markup” manual=”xmlns%3Axhtml%3D%22http%3A%2F%2Fwww.w3.org%2F1999%2Fxhtml%22″ message=”Spécification de l’espace des noms xhtml” highlight=”” provider=”manual”/]

Pour chaque élément <url>, vous devez ainsi indiquer un sous élément de type :

[pastacode lang=”markup” manual=”%3Curl%3E%0A%20%20%3Cloc%3Ehttps%3A%2F%2Fmonsupersite.com%2Ffr%3C%2Floc%3E%0A%20%20%3Cxhtml%3Alink%0A%20%20%20%20%20%20rel%3D%22alternate%22%0A%20%20%20%20%20%20hreflang%3D%22en%22%0A%20%20%20%20%20%20href%3D%22https%3A%2F%2Fmonsupersite.com%2Fen%22%20%2F%3E%0A%20%20%3Cxhtml%3Alink%0A%20%20%20%20%20%20rel%3D%22alternate%22%0A%20%20%20%20%20%20hreflang%3D%22fr%22%0A%20%20%20%20%20%20hreflang%3D%22htttp%3A%2F%2Fmonsupersite.com%2Ffr%22%20%2F%3E%0A%3C%2Furl%3E” message=”Utiliser le sitemap pour le multilingue” highlight=”” provider=”manual”/]

Pour plus de précisions également pour la question liguistique (par exemple en_GB), voir ce que nous dit la firme de Mountain View.

Conclusion

Le fichier sitemap, s’il ne représente pas un besoin en termes de référencement, le devient souvent pour des raisons de structure du site. A peu près inutile sur les tout petits sites (en tous cas négligeables au reste des autres actions d’optimisation), il facilite le crawl, permet un distingo entre les langues et régions cibles comme évoqué dans le dernier point : ce sont dans ce cas des facteurs très influents.

Si le fichier est bien conçu, il apporte ainsi une possibilité supplémentaire de lecture des nouvelles urls par les robots, favorisant également la lecture des liens internes de chaque document. N’oubliez pas de faire valider votre fichier dans la Search Console, Google vous dit s’il a des problèmes de lecture !

A propos de l'auteur(e)

Pas de commentaire