Contenu dupliqué en SEO : quel impact sur vos performances ? - The Words
21355
post-template-default,single,single-post,postid-21355,single-format-standard,cookies-not-set,edgt-core-1.3,ajax_fade,page_not_loaded,,hudson-ver-3.3, vertical_menu_with_scroll,smooth_scroll,blog_installed,wpb-js-composer js-comp-ver-6.7.0,vc_responsive
 
SEO et contenu dupliqué, quelles conséquences
Fév 13 2023

Contenu dupliqué en SEO : quel impact sur vos performances ?

Qu’est-ce que le contenu dupliqué et quel est son impact sur le SEO ?

La qualité du contenu est un critère de référencement essentiel aux yeux de Google. Certaines pratiques, comme le duplicate content (contenu dupliqué), peuvent ainsi avoir des conséquences désastreuses sur le référencement naturel des sites Internet. Zoom sur cette pratique, ses conséquences et comment éviter les pénalités qu’elles peuvent engendrer. 

Contenu dupliqué : définition

Le contenu dupliqué (duplicate content) définit un contenu très similaire ou identique, que l’on peut retrouver sur plusieurs pages, articles de blog et URLS distinctes. En d’autres termes, il désigne une forme de texte (paragraphe, phrase ou page entière) copié-collé d’une page de site Internet à une autre. 

Ce type de duplication peut représenter un véritable frein à l’indexation d’un site par les moteurs de recherche. Son impact sur une stratégie SEO peut, en outre, être assez désastreux s’il n’est pas surveillé et/ou corrigé rapidement, comme nous le verrons plus en détail dans la suite de cet article. 

Les différents types de contenus dupliqués 

Le contenu en double peut prendre plusieurs formes. En fonction de celles-ci, il vous faudra appliquer différentes techniques de résolution pour venir à bout du problème. 

Le vol de contenu ou duplicate content externe

Le vol de contenu (autrement dit, le plagiat), est de plus en plus répandu sur Internet et constitue une première forme de duplication de contenu. Il peut concerner le contenu de vos articles de blog, de vos pages Internet ou même de vos balises méta. Afin de vous assurer que votre contenu n’a pas été volé par un autre site Internet, nous vous recommandons d’effectuer une recherche Google en utilisant la combinaison suivante : 

“[ Entrez votre texte ici ]” + site : “[ URL de votre site web ]”

Si votre contenu a été volé, les résultats de recherche en lien avec cette requête mettront en évidence les sites web qui ont pu se servir de votre contenu sans obtenir votre aval. 

Que faire si vous êtes victime de plagiat ? Si vous vous apercevez qu’un autre site Internet utilise rigoureusement le même contenu que vous, nous vous recommandons vivement de déposer une plainte DMCA auprès de Google

Le contenu dupliqué interne

Si le contenu identique peut résulter d’un vol sur Internet, il est aussi possible que l’erreur provienne directement de votre propre site. En effet, les moteurs de recherches comme Bing, Google ou Yahoo! vérifient également que vous n’avez pas dupliqué votre propre contenu au sein de votre propre site. 

Ce cas de figure est particulièrement notable pour les sites e-commerce qui possèdent plusieurs fiches-produits similaires (par exemple, pour un même produit en différentes tailles ou couleurs). Le contenu dupliqué pourrait alors vous pénaliser et empêcher ces pages d’être indexées. En outre, ce type de pratique impacte également l’expérience utilisateur sur votre site Internet et peut ainsi augmenter votre taux de rebond. 

Le spinning

Le spinning se définit par l’utilisation de synonymes pour différencier un texte d’un autre, tout en conservant sa structure d’origine. Cela a pour conséquence de créer un texte différent en termes de lexique, mais communiquant rigoureusement la même idée (parfois de façon bancale, quand le spinning n’est pas bien maîtrisé). 

Les citations

Les citations sont un sujet assez sensible lorsque l’on parle de duplicate content. Leur utilisation dans certains textes est assez pertinente pour appuyer la crédibilité des propos. Toutefois, si trop de citations apparaissent au sein d’un même texte cela peut être une source de contenu dupliqué pour le Googlebot. En outre, gardez à l’esprit qu’un texte comprenant trop de citations peut vite devenir un signe de mauvaise qualité, à la fois pour les lecteurs, mais aussi pour les moteurs de recherches. 

Les URL dupliquées (duplicate URL)

Les URL dupliquées sont des pages web qui peuvent être accessibles via différentes formes d’URL (avec ou sans www, avec le protocole HTTP et HTTPS, avec ou sans barre oblique en fin d’URL, etc.). Il est important de relier ces différentes formes entre elles pour limiter le risque de contenu dupliqué. Pour ce faire, il vous faudra déterminer quelle est la page canonique (la page principale reliée à un mot-clé en particulier) et établir ensuite les redirections des pages secondaires vers celle-ci si vous souhaitez également renvoyer les internautes sur la page principale. Placez ensuite les pages secondaires en “no index” et le tour est joué !

Quelles sont les conséquences du contenu dupliqué sur le SEO ? 

Le contenu dupliqué est une pratique mal perçue par les moteurs de recherche. Si elle n’est pas traitée rapidement, elle peut avoir des conséquences importantes sur le référencement de votre site Internet.

Par définition, un moteur de recherche a pour objectif de proposer aux internautes les supports de réponse les plus adaptés à sa question initiale. Si deux contenus identiques se présentent à lui, qu’ils proviennent ou non du même site, Google ne sera pas en mesure de choisir lequel est le plus pertinent pour répondre à l’intention de recherche. Ainsi, cette difficulté risque fort d’inciter les moteurs de recherche à pénaliser votre site, pour éviter de détériorer l’expérience utilisateur.  

Il est important de savoir que Google va tout de même tenter de détecter qui est le site copieur en cas de contenu dupliqué. Le site en tort risque alors d’écoper d’une très mauvaise position dans le SERP et donc de ne générer que très peu de trafic. Dans certains cas extrêmes, il est même possible que le site soit entièrement retiré de l’index et ne plus apparaître du tout dans les résultats de recherche. 

Le saviez-vous ? Google Panda est un filtre lancé en 2011 par Google, afin d’analyser la qualité du contenu des sites Internet. Avant son apparition, le moteur de recherche utilisait le filtre “duplicate content” qui permettait de comparer le contenu des sites phrase par phrase. Or, cet outil pouvait facilement être corrompu par quelques modifications effectuées sur le site. Depuis l’apparition de Panda, l’analyse est beaucoup plus globale et permet de pénaliser un site en cas de contenu dupliqué, même si quelques-unes de ses pages présentent du contenu unique.

Comment prévenir le risque de contenu dupliqué sur son site Internet ? 

Pour éviter de générer ou de subir les conséquences du contenu dupliqué, voici quelques conseils importants à suivre : 

  • utilisez des redirections 301 sur votre site Internet en cas de pages au contenu très similaire. Cette manipulation permet à Google de transférer le trafic d’une page vers une autre sans pénalité ;
  • optez pour la balise « rel=canonical » : cette balise permet à Google de comprendre quelle URL doit être considérée comme principale, comme nous l’avons vu précédemment ;
  • mettez en évidence vos citations avec la balise citation pour indiquer aux moteurs de recherche que ce texte ne vous appartient pas. Dans ce cas de figure, vous ne serez pas pénalisé pour contenu dupliqué ;
  • avant de publier un texte sur votre site, utilisez un outil de vérification de contenu dupliqué ;
  • eviter de confier la rédaction de ses contenus à une intelligence artificielle ;

Quels outils utiliser pour détecter le contenu dupliqué ?

Pour vous aider à détecter un contenu dupliqué plus facilement, voici quelques outils que vous pouvez utiliser : 

  • Screaming frog : outil de crawling par excellence, la version gratuite de cet outil peut vous permettre d’analyser jusqu’à 500 URL. Screaming frog vous permettra de détecter vos contenus dupliqués, mais également les liens rompus ou les erreurs de serveur, par exemple ;
  • Duplichecker : en plus d’analyser votre contenu dupliqué, cet outil peut également vous permettre de supprimer les dernières fautes d’orthographe présentent au sein de votre contenu ;
  • Kill duplicate : très facile à utiliser, Kill duplicate vous permet de déceler en quelques secondes l’ensemble du contenu dupliqué sur votre site Internet ;
  • Siteliner : cet outil peut analyser jusqu’à 25 000 pages de votre site Internet et détecter les contenus dupliqués internes.
Share Post