Duplicate Content
Le duplicate content, qu’est-ce que c’est ?
Le duplicate content, ou contenu dupliqué en français, désigne un contenu identique présent plusieurs pages différentes. On parle de contenu dupliqué interne s’il apparaît sur plusieurs pages (plusieurs urls) d’un même site, et de contenu dupliqué externe s’il est présent sur un autre site web.
Est-ce que le duplicate content nuit au SEO ?
Il est très important de proposer un contenu unique, un contenu de qualité, sur chaque page pour éviter une pénalité Google. En effet, la duplication de contenu nuit grandement au référencement naturel et à l’indexation. Lorsque des contenus sont dupliqués, les algorithmes de Google chargés de crawler les pages de votre site vont déterminer quel est le contenu original, en mettant de côté les autres contenus identiques. Il est donc important de bien vérifier son contenu, éviter les copier-coller et rédiger soi-même ou passer par un professionnel. Un rédacteur web ou un rédacteur SEO peut vraiment vous aider à publier des contenus de qualité.
A première vue, c’est un système juste qui permet à l’auteur d’un contenu d’en tirer profit et d’empêcher des copieurs/voleurs de s’accaparer les bénéfices de son travail. Malheureusement ce n’est pas aussi simple. Les robots d’exploration déterminent eux-mêmes quelle page est l’originale et ils peuvent être influencés par plusieurs facteurs notamment l’autorité d’un domaine.
Vous l’aurez compris, un site plus « puissant » que le votre pourrait voler votre contenu et être considéré comme son auteur. Par conséquent votre page contiendrait du duplicate content, votre SEO ne serait pas amélioré et un autre site tirerait bénéfice de votre travail.
Que faire face au contenu dupliqué ?
Pour le duplicate content interne, il est parfois inévitable d’avoir des pages avec des contenus similaires. Par exemple, les sites e-commerce qui ont des fiches-produits ou des pages de liste rencontrent souvent ce problème. Heureusement il existe un moyen très simple de pallier cela, les balises canonical. Cette balise canonical permet d’indiquer au robot d’exploration quelle url est l’originale, la canonique, entre deux similaires. Il est également conseillé de “self canoniser” chaque page par sécurité. Imaginons deux pages similaires A et B sachant que la page principale est la A. Il faudra indiquer dans la balise canonical que la page canonique est A dans les deux pages. Ainsi même si la page B propose du contenu dupliqué ou similaire, il n’y aura pas de pénalités.
Le duplicate content externe est en revanche très difficile à gérer car vous ne pouvez malheureusement pas empêcher un webmaster de piocher dans votre contenu et faire du plagiat. C’est également très compliqué de le détecter tout simplement car Google ne vous prévient pas en cas de contenu dupliqué. C’est au propriétaire du site de mener son enquête. En tapant un texte entre guillemets sur Google vous pouvez voir s’il est présent sur une autre page. C’est une méthode qui fonctionne mais c’est très fastidieux. Il existe aussi des outils payants pour retrouver du duplicate content dans les moteurs de recherche.