Jan
14
2013

Zoom sur le contenu dupliqué

On parle souvent de contenu dupliqué (ou  » DC « ) mais quels sont ses vrais impacts sur le référencement ? Quelles sont les solutions ?

DC

Pourquoi Google pénalise le DC ?

Le DC, ou duplicate content, est pénalisé pour Google.

En effet, le moteur de recherche valorise les sites qui créent eux-même leurs propres contenus pour éviter à l’internaute de tomber sur des sites similaires, qui parlent de la même chose dans des termes similaires.

De plus, le DC fait perdre du temps à Google qui préfèrerait l’utiliser autrement. Donc au bout d’un moment, Google pénalise strictement les sites dont les DC se répètent.

Le contenu du site fait donc partie des points les plus importants pour Google puisqu’il représente le coeur du site et son intérêt pour tout lecteur. Outre les autres aspects importants comme l’ergonomie, le design, la rapidité du site etc.. le contenu texte est finalement celui qui ressort en premier puisqu’il représente le BUT du site, la réponse à la question : pourquoi créer un site ?

Le contenu peut être soit dupliqué d’un site à l’autre, soit se répéter plusieurs fois sur le même site.

Contenu dupliqué d’un site à l’autre

S’il est dupliqué d’un site à l’autre, c’est que soit quelqu’un a copié/collé le contenu du site sur un autre site, annuaire, comparateur etc.., soit qu’il existe deux noms de domaines différents pour un même site comme ceci :

DC

D’un site à l’autre, il peut également y avoir du DC entre les titres et les meta descriptions. Puisque ceux-ci sont les plus importants pour Google (ils permettent d’accrocher les lecteurs et résument le contenu de l’article), le moteur les indexe et vérifie qu’ils soient bien différents les uns des autres.

Contenu dupliqué sur le site lui-même

Si le contenu est dupliqué sur le site lui-même il peut y avoir plusieurs raisons.

Sur un site WordPress, par exemple, le contenu d’articles postés sur une des pages du site peut être rappelé sur l’index sans être bien tronqué et créer ainsi du DC vis-à-vis des pages d’accueil, des tags,des catégories ou des articles.

Pourquoi lutter contre ce fléau ?

DC

Trois raisons principales font qu’il est très important de divulguer du contenu original sur un site.

Premièrement, si deux sites sont référencés sous 2 URL différentes mais avec le même contenu, cela va peut-être énerver les internautes, leur faire perdre du temps et freiner leur élan de clics vers le site en question. L’image du site va se dégrader et, au long terme, la réputation sera entravée,entraînant aussi l’énervement des clients, partenaires, et de Google!

Deuxièmement, si deux sites contiennent les mêmes textes, la différence va se jouer au nombre et à la qualité des liens pointant vers ces sites (backlinks). Donc si tous les efforts de référencement servent à alimenter deux sites, beaucoup de jus (résultat des backlinks) va se diviser en deux et donc il faudra deux fois plus d’efforts pour garantir un résultat très moyennement correct. Mieux vaut donc se concentrer sur un site, un contenu, et bien travailler ses backlinks uniques.

Enfin, plus il y a d’URL à gérer et plus le robot Googlebot a de travail. Il survole alors l’indexation des deux sites et il y a de fortes chances qu’il n’indexe pas toutes les pages, ou que certaines pages soient crawlées longtemps après d’autres.

Comment mettre en forme votre site pour qu’il reste unique longtemps ?

Tout d’abord, comme dit plus haut, il faut à tout prix soigner les titres principaux et les meta descriptions de chaque page pour qu’ils soient vraiment différents d’une page à l’autre du site. Si les titres se ressemblent alors que la page contient deux textes différents, le site est pénalisé. Les URL de chaque page du site doivent donc obligatoirement être différentes.

Si, par ailleurs, vous souhaitez dupliquer et faire indexer le contenu de votre page sur un autre site , il faut utiliser une redirection 301 vers la nouvelle page . Elle signale alors à Google que le contenu est dupliqué sur une autre page et Google ne la considérera pas comme du DC.

Il est également possible d’ utiliser la balise « meta robots » en « rel=nofollow » si vous souhaitez que Google ne suive pas certaines URL pour arriver au contenu de cette page.

Une autre balise permet également à Google de prouver que le site a du contenu unique : la balise « link rel=canonical » dans la partie « head » sur l’en-tête de la page. Cette balise contient l’ URL de l’adresse où se situe le contenu de la source et indique donc à Google qu’il s’agit bien du contenu original.

Les robots de Google parcourent en premier lieu le dossier robots.txt sur le site et analysent les pages à indexer. Pour éviter qu’un contenu soit indexé 2 fois, mieux vaut utiliser la balise « meta robots » en « index » ou « noindex » pour gérer vous-même l’indexation de vos page ( CF notre article sur l’indexation des pages et les fichiers sitemap).

Enfin, si en dernier recours le contenu du site reste dupliqué par un site externe, il faut prendre contact avec le propriétaire du site qui copie le contenu en question. Il faut essayer de lui expliquer qu’il n’en a pas l’intérêt , que cela lui causera plus de mal que de bien pour le référencement de son site et pour son activité. Bref, que ce n’est pas la bonne solution !

Si vraiment il campe sur ses positions, et que vous ne vous entendez pas avec lui pour qu’il change de contenu, vous pouvez toujours changer vous-même de contenu.

Si l’opération se reproduit il vous reste l’ultime recours : le dénoncer à Google !

cut and paste

 

 

Ajouter un commentaire

Référencement Page 1

Référencement Page 1

Réseaux sociaux