vendredi 22 avril 2022

Qu'est-ce qu'une balise canonique (et comment l'utiliser) ?

 

Qu'est-ce qu'une balise canonique ?

Une balise canonique (ou rel=canonical) est un petit morceau de code HTML qui aide les moteurs de recherche à déterminer la version "principale" de la page parmi le reste des pages qui lui sont identiques ou très similaires.

En référencement, les balises canoniques sont utilisées pour indiquer à Google quelle version de la page vous souhaitez voir apparaître dans les résultats de recherche, pour consolider l'équité des liens à partir des pages en double ainsi que pour améliorer l'exploration et l'indexation de votre site Web.

Voici à quoi peut ressembler une balise canonique sur la page Web :

<link rel="canonical" href="https://mangools.com/blog/robots-txt/" />

Pourquoi les balises canoniques sont-elles importantes en SEO ?

L'objectif principal de la balise canonique est d'indiquer aux moteurs de recherche quelle page est la version principale et originale et lesquelles ne sont que des doublons qui se ressemblent. 

De manière générale, les sites Web contiennent généralement au moins certaines pages considérées comme des doublons - ils affichent le même contenu mais avec des URL différentes.

Dans ces cas, Google doit décider quelle page choisir à des fins d'indexation et de classement. Il n'utilisera pas toutes les pages comme résultats de recherche, car elles semblent toutes identiques ou tout simplement très similaires .

Par exemple, les pages de produits sont généralement affichées non seulement par 1 URL principale. Ils peuvent également être affichés avec divers paramètres d'URL souvent utilisés (par exemple pour le tri, la devise, les tailles, etc.) :

https://www.randomshop.com/vetements/chemises.html
https://www.randomshop.com/clothes/shirts.html?Size=XL
https://www.randomshop.com/clothes/shirts.html?Size=XL&color=red

Dans cet exemple, la page produit peut être affichée dans la catégorie principale –  /clothes/, mais aussi être filtrée et affichée avec des paramètres de taille et de couleur. Par conséquent, il peut être affiché comme résultat de recherche sous 3 URL différentes.

C'est là que les balises canoniques sont devenues importantes - elles indiqueront à Google que vous souhaitez indexer la catégorie d'URL principale /clothes/, l'utiliser comme résultat de recherche et ignorer le reste des URL.




Remarque : Gardez à l'esprit que Google perçoit la balise canonique comme un signal et non comme une directive.

S'il existe des raisons valables de choisir une autre page à des fins d'indexation et de classement plutôt que la page canonique, le moteur de recherche peut ignorer complètement la balise canonique :

Ou comme l'a dit Martin Splitt :

"D'accord, commençons par l'idée qu'il s'agit d'une directive parce que ce n'en est pas une."

Outre l'objectif fondamental de la balise canonique, elle présente également d'importants avantages SEO.

1. Ils consolident le PageRank

Les balises canoniques aident à consolider l'équité des liens (PageRank) de toutes les pages en double dans une seule page canonique principale. 

Les pages en double peuvent souvent obtenir des backlinks de diverses sources externes - qu'il s'agisse de backlinks de sites Web aléatoires, d'utilisateurs sur les réseaux sociaux, etc.

Ces pages reprennent donc partiellement l'équité des liens de la version principale de la page - celle que vous souhaitez réellement classer comme résultat de recherche. 

En implémentant des balises canoniques sur les pages en double, le PageRank peut être transféré dans une seule URL et ainsi améliorer son classement général dans la recherche Google.

2. Ils aident à gérer le contenu syndiqué

Les balises canoniques peuvent indiquer au moteur de recherche quel site Web contient la version originale du contenu et quels sites Web le republient (ou le syndiquent).

De nombreux propriétaires de sites Web utilisent d'autres sites Web pour publier leur contenu (à des fins promotionnelles ou autres).

Dans ce cas, Google doit décider quel site Web est la source originale de ce contenu et doit être affiché comme résultat de recherche et quels sites Web en font simplement la promotion.

La configuration de balises canoniques sur ces sites Web externes permet de résoudre ce problème et de promouvoir la version principale d'origine de la page dans la recherche Google .

Ou comme Danny Sullivan l'a dit :

3. Ils améliorent l'exploration

Les balises canoniques aident les moteurs de recherche comme Google à explorer efficacement les pages que vous souhaitez réellement explorer et indexer , par opposition aux doublons qui ne devraient pas être explorés du tout.

Les pages en double gaspillent les ressources et le temps de Google car elles ne sont pas importantes à des fins d'exploration ou d'indexation.

En nommant des pages canoniques, Google va se concentrer davantage sur les pages qui comptent le plus et donc économiser le « budget de crawl ».

Ou comme Google l'a officiellement déclaré :

« La page canonique sera explorée le plus régulièrement ; les doublons sont explorés moins fréquemment afin de réduire la charge d'exploration de Google sur votre site. »

Comment ajouter une balise canonique ?

L'ajout de balises canoniques à vos pages est assez simple - il suffit d'aller sur n'importe quelle page Web en double et d'ajouter la balise rel="canonical" dans la section <head> de la page .

Le lien dans la balise canonique doit pointer vers la version originale principale.

Il est préférable d'implémenter des balises canoniques page par page. Cependant, cela peut consommer beaucoup de temps et de ressources ou même être impossible sur de plus grands sites Web.

Heureusement, les balises canoniques peuvent également être implémentées automatiquement en utilisant divers plugins tels que Yoast SEO (pour WordPress).

L'implémentation des balises canoniques via ce plugin est assez simple :

  1. Choisissez la page pour la canonisation
  2. Rendez-vous dans la section "Avancé" de la page
  3. Ajoutez l'URL canonique à laquelle vous souhaitez vous référer
balise canonique dans l'exemple Yoast SEO

Il existe également d'autres façons d'indiquer à Google vos pages canoniques.

Utiliser l'en-tête HTTP

Des balises canoniques peuvent également être ajoutées dans l'en-tête HTTP de la page Web.

Ceci est particulièrement utile pour les documents spéciaux non HTML tels que les PDF , car ils ne contiennent aucune  <head> section où vous pourriez ajouter une balise canonique standard.

Pour implémenter des balises canoniques dans l'en-tête HTTP, vous devez accéder au  .htaccess fichier de votre site et ajouter la balise canonique dans un formulaire qui peut ressembler à ceci :

Lien : <https://www.votresite.com/random-document.pdf> ; rel="canonique"

Si vous souhaitez en savoir plus sur l'ajout de balises canoniques via l'en-tête HTTP, consultez cet article sur l'implémentation de canonicals .

Conseil : Il existe également plusieurs autres façons d'indiquer au moteur de recherche les pages que vous souhaitez voir en version canonique :

  • Plan du site – Google peut automatiquement supposer que toutes les URL répertoriées dans le plan du site sont les principales versions canoniques
  • Rediriger – les pages en double peuvent transférer le trafic ainsi que tous les signaux de page vers l'URL canonique unique via des redirections 301
  • Liaison interne – Google peut déterminer plus facilement quelles pages sont canoniques si des liens internes de votre site pointent vers elles à partir de pages en double.
  • HTTPS - les moteurs de recherche comme Google préfèrent généralement les pages canoniques qui ont un certificat SSL valide (par opposition aux pages sans cryptage - HTTP).

Meilleures pratiques des balises canoniques

1. Utilisez des canoniques auto-référencés

Bien que ce ne soit pas obligatoire, il est toujours recommandé d'ajouter une balise canonique sur une page qui pointe vers elle -même, même si vous n'avez pas utilisé de balises canoniques sur le reste des pages en double.

L'utilisation de l'auto-référencement rel=canonicalsur les pages principales et originales donne aux moteurs de recherche comme Google un signal clair qu'il s'agit de versions canoniques :

"Je recommande de faire ce genre de rel=canonical auto-référentiel, car cela nous indique vraiment quelle page vous souhaitez indexer ou quelle URL devrait être lorsqu'elle est indexée." John Muller ).

2. Utilisez des URL absolues

Les URL absolues dans les balises canoniques peuvent vous aider à éviter les erreurs involontaires ou la mauvaise interprétation des URL canoniques par un moteur de recherche (par opposition aux URL relatives).

Les URL absolues doivent également inclure  https//wwwet des barres obliques finales (si possible).

Voici un exemple d'URL absolue dans une balise canonique :

<link rel="canonical" href="https://www.randomwebsite.com/randompage/" />

Et voici un exemple d'URL juste relative :

<link rel="canonical" href="/randompage/" />

3. Utilisez des URL en minuscules

Les moteurs de recherche comme Google peuvent être sensibles aux majuscules et minuscules dans les URL.

L'utilisation de minuscules dans les URL canoniques peut donc vous aider à garder la cohérence et à éviter les problèmes de duplication aux yeux des moteurs de recherche.

Comme bonne pratique, essayez d'utiliser des minuscules dans les URL de vos serveurs et appliquez-les aux balises canoniques. 

4. Canonicaliser les doublons inter-domaines

Les balises canoniques peuvent également référencer vos pages principales à partir d'autres domaines, et pas seulement à partir de votre site Web. 

Si vous avez du contenu en double sur des pages d'un site Web différent (par exemple, une publication réutilisée sur un site d'actualités), vous devez :

  • utilisez la balise canonique d'auto-référence sur votre page d'origine
  • appliquez la balise canonique sur la page externe , en faisant référence à votre page d'origine

Qu'est-ce qu'il faut éviter avec les balises canoniques ?

1. Plusieurs canoniques sur 1 page

Faites attention aux multiples balises canoniques qui peuvent apparaître accidentellement dans le code HTML d'une page.

Bien que rare, le fait d'avoir plus d'une balise canonique sur une page peut créer de la confusion pour le moteur de recherche et entraîner l'ignorance de ce signal canonique .

Ou comme Google l'a officiellement déclaré :

"En cas de déclarations multiples de rel=canonical, Google ignorera probablement tous les indices rel=canonical. Tout avantage qu'un rel=canonical légitime aurait pu offrir sera perdu.

2. Évitez les canoniques sur les non-doublons

Assurez-vous toujours que le contenu des pages en double et de la version principale de la page est soit identique, soit au moins presque similaire lors de l'application de balises canoniques.

L'implémentation de balises canoniques sur des pages complètement différentes peut semer la confusion dans les moteurs de recherche ou être complètement ignorée :

Ou comme l' explique Martin Splitt :

"... si le contenu est complètement différent ou suffisamment différent pour que les algorithmes décident qu'il ne s'agit pas d'une duplication, alors le canonique est inutile."

3. Canoniques sur les pages paginées

Les pages paginées contiennent un contenu fragmenté sur plusieurs pages différentes (par exemple, la section des commentaires sur le site Web divisée en pages « 1 », « 2 », « 3 »).

Dans ce cas, vous devez toujours utiliser des balises canoniques d'auto-référence sur chaque page individuelle - et ne pas faire référence à la page "1" du reste des pages paginées :

« La principale chose à éviter, puisque ce message traite de la canonisation, est d'utiliser le rel=canonical à la page 2 pointant vers la page 1. La page 2 n'est pas équivalente à la page 1, donc le rel=canonical comme ça serait incorrect. ” John Muller )

4. Ne bloquez pas les canoniques via robots.txt

Vous ne devez jamais bloquer les URL avec des balises canoniques par le fichier robots.txt. 

Robots.txt empêchera Google d'explorer les pages en double - il ne pourra donc pas voir la balise canonique faisant référence à la version principale de la page.

De plus, le blocage des URL contenant des balises canoniques empêchera également le PageRank d'être transféré dans vos versions principales .

5. N'utilisez pas canonique dans le <body>

Les balises canoniques doivent toujours être appliquées dans la <head> section de vos pages, et non à d'autres endroits du document HTML. 

Google ignorera simplement vos balises canoniques dans la <body> section ou à tout autre endroit.

6. Évitez les boucles et les chaînes canoniques

Vous devriez toujours essayer d'utiliser des balises canoniques référençant directement à la page principale afin d'éviter les boucles canoniques (similaires aux boucles de redirection).

Par exemple, l'utilisation d'une balise canonique de la page A à la page B, puis de la page B à la page C créera une chaîne canonique qui peut confondre les moteurs de recherche et gaspiller leurs ressources et leur temps.

https://mangools.com/blog/canonical-tag/#a61c31e3afeebf8079ee37f00

Aucun commentaire:

Enregistrer un commentaire