Définition de Duplicate Content (Contenu Dupliqué)


 

Définition de Duplicate Content (Contenu Dupliqué) :

definition-duplicate-content-contenu-dupliqueLe Duplicate Content ou Contenu Dupliqué en français désigne plusieurs contenus identiques ou similaires sur deux ou plusieurs pages web différentes, sur le même site (duplicate content intrasite) ou sur des sites différents (duplicate content intersite). Cela ne génère pas de pénalité de la part de Google, mais un seul des contenus obtiendra une visibilité sur le moteur.

 

On entend très souvent parler de duplicate content en SEO. Ce concept peut prendre plusieurs formes et est effectivement très important en référencement naturel si on désire optimiser sa visibilité sur Google et les autres moteurs. Explications…

Le Duplicate Content intervient lorsque Google détecte, sur un même site ou sur des sites différents, des contenus identiques ou similaires (on parlera dans ce cas de near duplicate content). Lorsque cela arrive, Google tentera d’identifier le contenu original, dit canonique au travers de deux critères : la date de première découverte et le PageRank de la page. C’est cette page canonique qui sera bien positionnée et qui aura la principale visibilité dans les SERP.

Les contenus dupliqués (les copies) seront la plupart du temps indexés, mais n’auront qu’une très faible visibilité.

Il est à noter que Google ne sanctionne pas – ne pénalise pas – contrairement à une croyance très répandue, les sites faisant du duplicate content (copiant du contenu depuis un autre site). En revanche, ces sites n’auront qu’une visibilité très faible puisqu’ils seront la plupart du temps considérés comme dupliqués.

L’utilisation de la balise « canonical » permet de « forcer » Google à prendre en compte une URL comme canonique plutôt qu’une autre et ainsi à mieux gérer et maîtriser la situation de contenu dupliqué.

Enfin, le DUST est une autre forme de contenu dupliqué, qui se règle également la plupart du temps au travers de la balise « canonical ».

Dernier type de duplicate content : lorsque plusieurs sites, dédiés à plusieurs pays différents mais dans la même langue (exemple : France, Belgique, Suisse et Québec pour la langue française) proposent le même contenu. Dans ce cas, c’est la balise Hreflang qu’il faudra utiliser pour faire tomber les barrières du contenu dupliqué.

infographie-duplicate-content.jpg
Infographie illustrant le phénomène de Duplicate Content en e-commerce. Source : Ineolab

Voici également quelques liens pour aller plus loin sur le sujet :

Et cinq vidéos :


Does translated content cause a duplicate content issue? (Matt Cutts)


Balise Canonical et Duplicate Content.


Le DUST (Duplicate URL, Same Text), c’est quoi ?


Google pénalise-t-il le contenu dupliqué intersites ?


Extraits de Contenus et Duplicate Content

Publié le 9 mars 2018
 
  • Bonjour, merci pour ce super article avec de belles illustrations !

    En effet le problème du contenu dupliqué peut être réglé grâce à diffèrentes solutions, parmies elles la balise canonique. Nous avons étudié le sujet et avons pu faire ressortir des chiffres. L’analyse d’un grand nombre de pages web avec un classement dans Google conduit à des conclusions surprenantes !

  • Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *