On a souvent tendance à parler de duplication dans le cadre d’optimisation au référencement, voici un tour complet sur les différents types de « duplicate ».
Duplication de contenu (duplicate content)
Le DC est la forme la plus répandue de duplication sur le web, c’est le simple fait de trouver le même contenu sur deux voir plusieurs pages sur le web.
Exemple : le figaro publie une actualité (article réalisé par un journaliste avéré), un blog d’actualité lambda reprend cet article et le publie. L’article est identique à la fois sur le figaro et sur le blog, ce qui représente de la duplication de contenu.
La solution, ici, pour le blog d’actualité est de placer un lien vers l’article du figaro avec la balise rel= « canonical ». Cela permettra de déclarer à Google que l’article a été repris depuis le figaro.
Duplication d’URL
Il est possible de se retrouver avec deux URL (voir plus) pour un même contenu. Il est impératif au niveau SEO d’avoir une seule URL pour un seul contenu. Certains CMS peuvent générer des URL différentes pour un même article (souvent le cas avec Joomla), la solution est de rediriger l’une vers l’autre afin d’en avoir qu’une seule.
Autre cas de figure, l’utilisation d’URL trackées avec Google Analytics (ou autre outil de tracking) peut générer plusieurs URL pour un seul et même contenu. La solution ici est d’utiliser le séparateur # plutôt que le ? (tout ce qui suit le # est ignoré par Google donc pas d’URL dupliquée), il faudra rajouter dans le TAG Analytics _gaq.push([‘_setAllowAnchor’, true]); (PS : j’ai passé des heures à résoudre ce problème…)
Duplication du nom de domaine
Un nom de domaine peut s’afficher en http://alexeo.fr ou en http://www.alexeo.fr, le webmaster est libre de choisir quel affichage il souhaite utiliser simplement il est recommandé de faire une redirection pour le second.
Exemple, je choisi le http://www.alexeo.fr, lorsque je saisie http://alexeo.fr je suis automatiquement redirigé vers le http://www.alexeo.fr. Cette option se gère dans le htaccess ou dans le panneau de configuration pour les CMS.
Autre cas de figure, l’article en page d’accueil. On voit souvent certains sites avec www.alexeo.fr/accueil au lieu de www.alexeo.fr, le problème se présente lorsque www.alexeo.fr/accueil et www.alexeo.fr affichent la même page. Il faut rediriger l’une des deux.
Duplication de balises titre et description
Google Webmaster Tools vous a peut-être déjà informé que certaines de vos balises titre et description étaient identiques (ou dupliquées). C’est notamment le cas avec la pagination sur un site web, la solution est de personnaliser chaque balise (en y insérant le numéro de page par exemple).