Duplicate Content Google

Duplicate Content Google, Comment le supprimer?

Son nom l’indique, le « duplicate content Google est du contenu dupliqué. Cette duplication concerne tout ce qui est possible d’être répliquer dans un site web (images, PDF, texte, code, etc.).
Le duplicate content permet de pratiquer du référencement gratuit, ou presque …

L’abréviation anglaise du terme « #duplicate+content Google » est DC.

Ne pas confondre avec le content spinning qui lui n’est en principe pas du contenu dupliqué.
Le « duplicate content Google » externe est en général un double identique, un clone réalisé par un simple copié collé, sans autorisations, d’un contenu web dont la paternité n’appartient pas au duplicateur.  La personne qui duplique un contenu d’un autre site, le fait généralement par fainéantise, manque d’imagination ou par intérêt financier. Un copier collé ne coûte pas cher, il faut peu de temps pour le réalisé.

Le « duplicate content Google n’est pas propre à Google. Le moteur de recherche Bing, est parfaitement en mesure de détecter et signaler le duplicate content qui lui est soumis. L’outil webmasters tools Bing permet une approche similaire pour régler le problème du duplicate content Bing. La grande différence entre ces deux moteurs réside dans le fait que Bing est moins souple que Google.

Le « duplicate content Google » peut parfois être présent à l’intérieur de son propre site.

En substance un duplicate content Google (Bing) peut également être similaire au contenu original d’une pages d’un site internet, la ressemblance du duplicate content Google – Bing –  s’explique par une manipulation de l’élément copié.

Exemple : il suffit de  remplacer quelques termes d’un texte par des synonymes, de changer la disposition du texte, retoucher une image volée avec Photoshop ou Gimp (modification d’autres documents).

Contenu dupliqué partiel

Exemple : copie d’une citation, copie d’une fraction de texte, emprunt d’un unique paragraphe dans l’éditorial d’un site web, utilisation partielle d’une image dérobée, etc.

Le duplicate content Google (Bing) est effectif lorsque le contenu volé est rediffusé sur la toile, que l’indélicat déclare être l’auteur du contenu, qu’il n’indique pas sa source, qu’il publie sans l’autorisation du propriétaire, etc.

Danger, Duplicate content Google (Bing)

Duplicate Content

Il faut être conscient que le duplicate content Google peut mettre le site web plagiaire en danger, le duplicate content risque avant tout de nuire au site web plagié. Que le site plagiaire souffre d’une mise à l’écart prononcée par Google ou Bing on s’en fiche carrément, par contre que le site plagié – qui lui propose du contenu frais, propre et unique – soit rétrogradé ou mal mené est très agaçant pour ne pas utiliser d’autres mots …

Formes du « Duplicate Content Google » (Bing)

Votre propre site peu être victime de duplicate content Google, un doublon traîne dans les entraille de votre bébé (page ou texte en double exemplaire). Vous avez par exemple copié et inséré sans modifications dans un de votre éditorial, une section, un paragraphe ou une longue citation appartenant à un autre site (sans le mentionner par un lien).

Une autre méthode de duplicate content et celle induite par des web-masters peu scrupuleux et malveillant, qui pillent du contenu ici et là.
Ce cas est problématique en ressources et temps, le risque de pénalités encouru pour son propre site est important.

Balise « Title » dupliquée

Un autre problème du duplicate content et lié à la balise « Title » et meta description.
Les moteurs de recherche (Google, Bing) peuvent considérer, des balise « Title » étant identiques et répétées, à du duplicate content. La balise « Title » doit, devrait, être descriptive, contenant quelques mots clés pertinent. Cette balise doit avant tout être unique.

La meta description comme sont nom l’indique devrait décrire le contenu de la page en moins de 140 caractères (pour éviter que la description soit tronquée). Les meta descriptions identiques ou non adaptées au contenu de votre page, susciterons pas ou peu les internaute à visiter votre site internet.

DUST : Different URL Same Text

Le DUST (URL dupliquée menant au même contenu) est un autre aspect un peu plus technique du « contenu dupliqué ». Le DUST se résume par l’accessibilité d’une même page du domaine web par plusieurs URL différentes.

Exemples :

http://mon-sous-domaine.ndd.tld (sans « / »)

http://mon-sous-domaine.ndd.tld/

http://mon-sous-domaine.ndd.tld/index.php

http://mon-sous-domaine.ndd.tld/index.php?param=5

etc..

(TLD=Top Level Domain ou domaine de premier niveau est représenté par une extension du type .com, .org, etc. )
(NDD=Nom De Domaine aussi nommé SLD ou second level domain). Le nom de domaine (NDD ou SLD) est le sous-domaine d’un domaine de premier niveau – (TLD)
(le www de http://www.ndd.tld est le sous-domaine d’un domaine de second niveau, idem pour http://mon-sous-domaine.ndd.tld

Le constat est l’on se retrouve avec autant de pages qu’il y a URL, 4 ici, les moteurs de recherches voient la même chose 4 URL. La question est donc: comment les moteurs de recherche interprètent-ils cela? comme une forme de duplicate content Google, Bing interprète le Dust de la même  manière.

En adoptant l’hypothèse que chaque URL contient n backlinks en nombre différents, il suffit d’additionner le nombre de backlink de chaque URL pour se rendre compte qu’une seule page hérite de tout les backlink. Cet héritage est indéniablement contre productif pour le référencement et clairement considéré comme du duplicate content Google.

Comment supprimer les URLs double du DUST

25% du web est du duplicate content

Le duplicate content Google peut certes être pénalisant, selon Google 25 à 30 % du web serait du duplicate content. Gooogle ou Bing pénalisent-ils pour autant tous ces contenu double? clairement non!

Il probable que le duplicate content présent sur la toile est bien plus important que le 25 à 30 pour cent annoncé par le porte parole de Google, représenté par  Monsieur Matt Cutts. Il est sans doute possible d’augmenter ce pourcentage de 10 à 15 points au moins.

Cette hypothèse et difficilement démontrable, mais semble plausible.

Pour gagner une pénalité il faut la vouloir! Si vous essayer de gruger ou tromper les moteurs de recherche, oui, alors vous avez de bonnes chances pour décrocher une médaille d’or « sanction ».

Si en revanche vous n’abuser pas et que personne ne dénonce votre plagiat, vous ne risquez pas grand chose. Inutile de crier au loup!

Duplicate content à la mode

A l’heure actuelle le duplicate content externe, le copier collé, l’appropriation du contenu d’autres site internet est à la mode.

Pourquoi passer du temps à rédiger du texte pour un site web ou un blog, alors que de multiple sources correspondantes au sujet à écrire sont « gratuitement » disponibles sut la toile, demanderez-vous?

S’approprier de ressources sur d’autres sites internet sous formes textuelles ou d’images sans l’autorisation du présumé auteur ou propriétaire est du plagiat. Faire d’un duplicate content Google son fond de commerce est un double vol. C’est voler l’auteur,  c’est aussi voler le client à qui vous servez du duplicate content (rédactionnelle ou infographique) en tant qu’œuvre unique et personnelle. En revanche, s’inspirer d’un éditorial, d’une image, d’un graphique, composer et réaliser sa propre œuvre à partir d’un modèle et d’une feuille blanche n’a rien de compromettant.

Il est impératif de supprimer le duplicate content se trouvant sur son propre site.

Comment supprimer le Duplicate content ?

Supprimer le Duplicate content interne

Le duplicate content interne peut s’éliminer de différentes manières … la solution la plus évidente  au premier abord est de simplement supprimer les contenus ou les paragraphes à double dans les pages de son propre site.  L’utilisation de la balise canonical est également une bonne méthode …

Lutter contre le Duplicate content externe

Comment lutter contre les plagiaire … Combattre le duplicate content externe