dimanche 15 mai 2022

Contenu dupliqué : qu'est-ce que c'est et comment l'éviter ?

Qu'est-ce que le contenu dupliqué ?



Le contenu dupliqué dans le référencement signifie qu'un texte d'une page Web différente a été copié, réutilisé et fait passer pour le sien par un autre site Web.

En termes simples, le contenu dupliqué est considéré comme un contenu qui peut être vu sur Internet à plusieurs endroits. Selon la définition de Google du contenu dupliqué, il ne vient généralement pas avec une intention malveillante.


Comment les problèmes de contenu dupliqué surviennent-ils ?


Le contenu en double est principalement dû à des problèmes techniques résultant d'une erreur commise lors de la configuration du site Web ou de la page Web. Malheureusement, ces petits incidents peuvent faire baisser votre classement.

Outre les erreurs humaines, certaines parties du contenu proviennent d'un site Web particulier qui est imité et réutilisé par un autre. Cet acte pourrait entraîner des sanctions s'il s'avère qu'il a une fin malveillante. Vous trouverez ci-dessous deux catégories (avec certains scénarios spécifiques) qui ont conduit à l'apparition de contenu dupliqué.


Duplication de contenu causée par des problèmes techniques

  1. Serveurs Web mal configurés menant à divers domaines canoniques : par exemple, vous n'avez qu'un sous-domaine www et pourtant votre page Web peut être vue sur le serveur Web non www.
  2. Problèmes dus à la structure des URL : les URL doivent être saisies avec précision car elles sont sensibles à la casse. Cela signifie qu'une lettre mal majuscule est considérée comme une URL différente s'il en existe une autre en minuscules. Une erreur dans la barre oblique de transfert ou la barre oblique de fin comme on l'appelle peut également être un problème.
  3. L'accès via différentes pages d'index est disponible : vous ne le savez peut-être pas, mais avec un serveur Web mal configuré, votre page d'accueil peut être accessible via différentes versions d'index.
  4. Taxonomie : dans les systèmes de gestion de contenu, les publications sont parfois disponibles dans plusieurs catégories. Si vous ne parvenez pas à en nommer un principal, tous seront considérés comme des doublons.
  5. Pages uniquement pour les images : certains sites Web attribuent une page Web aux images dans la publication. Étant donné que cette page ne contient qu'une seule image, d'autres comme celle-ci auront la même page d'image. Cela conduit à dupliquer le contenu.
  6. Commentaires longs : Lorsqu'il y a beaucoup de commentaires dans un post, cela peut conduire à la création de différentes pages. Les pages paginées afficheront le même article mais différeront dans les commentaires trouvés dans la section inférieure de la page.
  7. Cibler différentes régions avec la même langue : par exemple, vous avez un contenu destiné aux utilisateurs américains et un autre au public britannique et australien. Le contenu est le même mais la localisation diffère.


Contenu dupliqué causé par un contenu copié

  1. Pages de destination : des pages de destination dédiées sont nécessaires pour les recherches payantes. La plupart du temps, les pages de destination sont très similaires aux articles originaux. Parfois, ils ne modifient que certains mots pour insérer des mots-clés spécifiques.
  2. Autres sites Web qui utilisent votre contenu : Malheureusement, dès que vous cliquez sur Publier, d'autres sites Web peuvent utiliser les informations que vous avez partagées avec le monde. Le vrai combat est lorsque votre site Web se classe plus bas que ces sites Web. Parce qu'ils ont une autorité de domaine supérieure, ils seront considérés comme une source plus fiable et seront donc considérés comme l'auteur original de l'article.
  3. Utilisation du contenu d'un autre site Web : à l'autre extrémité du spectre, la copie de contenu ne posera pas seulement un problème en termes de classement, mais peut également créer un fossé entre les propriétaires de sites Web.

Pour être clair, le contenu traduit où vous localisez votre contenu pour qu'il soit disponible dans différentes langues pour s'adapter à différents pays n'est pas un contenu dupliqué. Cependant, si les sites Web sont mal traduits par une forme de logiciel ou d'outil, Google ou d'autres moteurs de recherche pourraient considérer le contenu comme des doublons de spam.

Un autre exemple de contenu non dupliqué consiste à afficher le même contenu sur votre mobile que votre version Web. Google a un ensemble différent de robots de recherche pour les sites mobiles, cela n'affectera donc pas votre classement SEO dans ce cas.

S'il se trouve que vous rencontrez un site Web qui ne répond pas et que vous souhaitez qu'il ait une version d'application native, vous pouvez visiter GoNative pour créer votre propre application.


Vérificateurs de contenu en double


Pour éviter toute malédiction SEO associée au contenu dupliqué, il est préférable de prendre des mesures de précaution sur votre site Web et sur tous les sites Web. Il existe de nombreux vérificateurs de contenu en double qui peuvent vous aider à faire le travail :

Copyscape – un outil payant qui peut vous aider à identifier s'il y a des parties de votre contenu qui sont similaires aux articles de blog déjà disponibles sur Internet. C'est rapide et efficace. Il signale rapidement tout contenu en double en le mettant en évidence et en vous fournissant un aperçu de la façon dont votre contenu se compare au contenu publié. Il fournit également un pourcentage de l'originalité de votre article.



Grammaire - est un assistant d'écriture gratuit qui détecte facilement une mauvaise utilisation de la grammaire, de la ponctuation, de l'orthographe ou du choix des mots. Le compte premium fournit des suggestions sur la façon d'améliorer le style d'écriture, et il dispose également d'une fonctionnalité qui détecte le plagiat à partir de milliards de pages Web.




Duplichecker - un outil qui enquête rapidement sur l'originalité de l'article. Il y a une limite de 50 recherches par jour par utilisateur enregistré.




Siteliner - vous permet de faire des vérifications mensuelles pour le contenu en double sur votre site Web. Les avantages supplémentaires de Siteliner sont qu'il aide à identifier les liens brisés et les pages qui fonctionnent bien en termes de classement.




Quelle quantité de contenu dupliqué est acceptable ?


C'est un cas difficile à résoudre car l'algorithme du principal moteur de recherche Google ne cesse de changer. Selon Matt Cutts de Google, environ 25 à 35 % du contenu Web est considéré comme du contenu dupliqué. Et obtenez ce * signal dans le roulement de tambour, s'il vous plaît * Google ne pénalise pas les sites Web avec du contenu en double.

Cependant, si l'ensemble de votre site est composé de contenu republié sans aucune valeur ajoutée, Google ne vous permettra pas de vous démarquer des autres sites Web. Il n'y a pas de pourcentage exact que Google considère comme autorisé pour le contenu dupliqué, mais en règle générale :

Vous ne devez pas vous attendre à ce que votre site Web soit bien classé dans Google s'il contient du contenu disponible sur des sites Web plus réputés et établis. De plus, si vous ne générez que du contenu automatiquement et que vous ne faites aucun effort pour y ajouter de la valeur, ne vous attendez pas du tout à gagner un classement.

Si vous voulez atteindre le sommet, vous devez publier une version canonique originale du texte ou du contenu qui offre une valeur significative.


Effets du contenu dupliqué

Pour les moteurs de recherche :


Le contenu dupliqué est important pour les moteurs de recherche car ils ne seront pas en mesure d'identifier les versions à supprimer de leur liste. Cela pose également un problème concernant la façon dont les métriques SEO ne seront associées qu'à une seule page ou pour tout enregistrer sur plusieurs versions.

Enfin, il sera difficile pour les moteurs de recherche de déterminer quelle version de votre site Web doit être affichée dans les résultats de recherche.

Pour les propriétaires de sites Web :


Conformément à tout cela, le contenu dupliqué peut nuire au classement de votre site Web et générer moins de trafic vers votre page Web actuelle. Les pertes de trafic proviennent de deux choses.

Premièrement, les moteurs de recherche n'afficheront pas toutes les versions qui ont le même contenu. Au lieu de cela, il choisira la version qui semble avoir le meilleur contenu. En ce sens, le trafic diminuera la visibilité de tous les doublons. Ensuite, l'équité du lien sera également affectée.

Même d'autres sites Web devront sélectionner le meilleur lien avec lequel travailler. En conséquence, les liens seront répartis entre tous les doublons, au lieu de tous les diriger vers une seule page Web.


Comment réparer le contenu dupliqué

Pratiquer la cohérence


Selon la liste des causes de contenu en double, la majorité sont dues à des URL ou des liens incohérents. Standardisez votre structure de liens pour éviter que de tels problèmes ne se produisent. Utilisez également des balises canoniques. Il est facile de programmer votre URL préférée en vérifiant votre compte Google Webmasters et en ajustant votre préférence.

Canonicalisez vos URL


Les CMS vous permettent de gérer le contenu de votre blog via des catégories et des balises. Lorsque les utilisateurs effectuent des recherches à l'aide de balises et de catégories, les résultats qui s'affichent généralement sont les mêmes. Pour cette raison, les robots peuvent les considérer comme des doublons. Il existe trois méthodes pour implémenter des balises canoniques :
  1. Définissez votre version préférée, que ce soit www ou non-www. Cependant, comme mentionné précédemment, il n'aborde qu'une certaine avenue.
  2. Attribuez manuellement le lien canonique pour vos pages. Identifiez votre source d'origine. C'est la page que vous voulez rendre accessible à tous vos lecteurs.
  • Implémentez des redirections 301 pour réduire l'impact des problèmes de contenu dupliqué. Grâce aux redirections 301, l'utilisateur sera redirigé d'une URL non préférée vers une URL préférée. Lorsqu'un bot de moteur rencontre une redirection 301, il recherche la ressource d'origine via la page de contenu dupliqué. Dans ce cas, toutes les URL non préférées deviennent des liens vers une URL préférée.

Utiliser aucun index


Utilisez la balise meta noindex pour empêcher les moteurs de recherche de former des index de vos pages qui ont du contenu en double.

Utiliser hreflang


Il a été mentionné précédemment que le contenu traduit n'est pas considéré comme un contenu dupliqué. Cependant, il peut y avoir des cas où cela le devient. Pour éviter cela, ajoutez une balise hreflang pour aider les moteurs à trouver la bonne version de contenu.


Comment empêcher l'apparition de contenu dupliqué


Les procédures mentionnées ci-dessus pour remédier aux problèmes de contenu en double peuvent également être effectuées pour empêcher l'apparition de contenu en double. De plus, les conseils ci-dessous peuvent être suivis pour ajouter plus de mesures préventives en fonction de la cause du contenu dupliqué.

Conseils pour éviter le contenu dupliqué à la suite d'un contenu copié

  1. Pages de destination : empêchez les moteurs de recherche d'indexer automatiquement vos pages de destination en utilisant l'attribut noindex des méta-robots. N'incluez pas de pages de destination dans votre sitemap XML.
  2. Autres sites Web qui utilisent votre contenu : assurez-vous que vous êtes correctement crédité en utilisant une URL canonique qui mène à votre page. Si ce n'est pas le cas, engagez une action en justice ou demandez à Google de mettre en œuvre le Digital Millennium Copyright Act.
  3. Utilisation du contenu d'un autre site Web : pour éviter des frais juridiques, attribuez le crédit là où le crédit est dû.

Conseils pour éviter le contenu dupliqué à la suite d'un contenu copié

  1. Serveurs Web mal configurés menant à divers domaines canoniques : utilisez les redirections 301 et sélectionnez une manière préférée de présenter votre contenu.
  2. L'accès via différentes pages d'index est disponible : Avant de mettre en œuvre des redirections 301, assurez-vous de canoniser vos pages. Sinon, les pages se casseront.
  3. Taxonomie : encore une fois, en canonisant le message principal, vous pouvez éviter d'avoir plusieurs copies d'un message sur votre site Web.
  4. Pages uniquement pour les images : si cela est possible, essayez de supprimer la fonctionnalité qui fournit des images avec leurs propres pages. Si ce n'est pas le cas, ajoutez la fonctionnalité noindex des méta-robots à la page.
  5. Commentaires longs : utilisez les relations de lien de pagination pour informer les moteurs de recherche de la série de commentaires paginés qui accompagnent un contenu particulier.

Des dizaines d'experts en référencement vous diront de ne jamais dupliquer le contenu exprès. D'autres moyens d'éviter les problèmes de contenu dupliqué sont similaires à certains des conseils de référencement les plus élémentaires que vous connaissez probablement déjà. Ces stratégies vous obligeront à revenir à l'essentiel.

Comment obtenir du contenu original ? 

Simplement en lançant un blog et en vous concentrant sur la création d'un contenu unique, riche et engageant que vos lecteurs partageront avec plaisir avec d'autres personnes.

Pour les sites Web proposant des produits, intégrer les avis des utilisateurs est si simple et efficace. Ce contenu généré par les utilisateurs est garanti unique en son genre et peut servir de stratégie marketing qui attire efficacement les clients potentiels. Pour les affiliés Amazon, vous devez personnaliser les descriptions de produits sur vos sites Web et vous abstenir de copier ce qui se trouve déjà sur le site Web du fabricant.

Cela n'a pas besoin d'être compliqué, en suivant ces conseils, vous n'aurez plus jamais à vous soucier des problèmes de contenu en double.

Aucun commentaire:

Enregistrer un commentaire