Le duplicate content et la balise canonical
2 mar. 2009
Par Mickael - Référencement - Lien permanent
Qu'est ce qu'est le duplicate content ?
Ce terme fait echo sur la toile depuis le développement des problématiques liées au référencement de sites web dans les moteurs de recherche. Le duplicate content correspond à un même contenu que l'on retrouve à plusieurs endroits sur le web et donc accessible depuis deux url différentes.
Il constitue la bête noir des moteurs de recherche (et du référenceur) qui ne souhaitent pas surcharger leurs bases de données en indexant inutilement deux fois le même contenu. C'est aussi faire éviter une perte de temps à l'utilisateur qui n'a pas besoin d'obtenir plusieurs pages avec les mêmes informations pour sa requête. Google pénalise donc le référencement de ces pages dupliquées et l'enjeu est de taille pour les responsables web qui peuvent perdre beaucoup de visiteurs et/ou de clients potentiels.
Le duplicate content et les problèmes d'url canonique
L'url canonique, Il s'agit de l'url principale à utiliser pour une page, l'adresse officielle ou favorite en quelque sorte. Ci-dessous les problèmes que l'on peut rencontrer en matière de duplicate content.
- L'indexation d'un site avec et sans le sous domaine "www"
http://mickaelgros.fr et http://www.mickaelgros.fr sont bien deux urls distincts et peuvent être indexées par Google comme étant du duplicate Content.
L'astuce étant d'utiliser un fichier htaccess à la racine du site pour établir une redirection permanente (redirection 301). Dans ce cas, l'utilisateur qui tappe http://mickaelgros.fr sera redirigé vers http://www.mickaelgros.fr , Google prendra en compte la redirection et l'adresse destinataire sera considérée comme l'adresse officielle de la page. A titre d'exemple voici le code à mettre en place dans le cas d'une redirection 301:
RewriteCond %{HTTP_HOST} !^www\.mickaelgros\.fr$
RewriteRule (.*) http://www.mickaelgros.fr/$1 [R=301,L] - L'utilisation de plusieurs domaines
Il est courant de réserver plusieurs domaines pour un même site, par exemple pour éviter le cybersquattingou pour localiser un site on utilise facilement monsite.fr,monsite.com...
Comme pour le premier point, il est important de garder une url principale et chaque page doit disposer de sa propre url. On pourra utiliser une redirection 301 pour rediriger vers le domaine principale. - Utiliser deux urls pour sa page d'accueil
Il est courant de voir une page d'accueil accessible depuis l'adresse http://www.mickaelgros.fr et http://www.mickaelgros.fr/index.php. Dans ce cas, il faut veiller à ce que les liens du site qui pointe vers la page d'accueil (logo, liens "retour à l'accueil" par exemple) utilisent bien la même url, c'est à dire http://www.mickaelgros.fr.
La balise canonical
C'était l'actu référencement des dernières semaines, les principaux moteurs de recherche dont Google, Yahoo!, Microsoft Live Search et Ask.com se sont mis d'accord pour gérer une nouvelle balise "canonical" permettant d'éviter certains problèmes de duplicate content et notamment les erreurs listées ci-dessus..
Cette balise permet de définir une url canonique, c'est à dire d'indiquer la page source de l'information aux moteurs et donc consolider l'importance donnée à une page sur une seule et même url et éviter la dilution du page rank.
La balise se présente comme ceci <link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />
- http://www.webrankinfo.com/actualites/200510-contenus-dupliques.htm
- http://www.webrankinfo.com/actualites/200703-erreurs-de-duplicate-content.htm
- http://actu.abondance.com/2009/02/duplicate-content-google-microsoft-et.html
- http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html
- http://google.com/support/webmasters/bin/answer.py?answer=139394
- http://blog.abondance.com/2008/01/contenus-syndiqus-et-duplicate-content.html







Commentaires
En theorie ok, mais en pratique, j'attend des preuves de son fonctionnement !
photovotlaiqueJe viens de mettre cela en place et je dois dire que ça fonctionne parfaitement. J'avais été pénalisé pour du duplicate et là grace à canonical je retrouve mon référencement initial.
chilipariIt is a good timberland 6 inch boots thing that the God Who made us is not impatient with people like me with my timberland shoe company orchid. He lovingly thinks about us all the time timberland boots and he even temporarily gave up His heavenly home and his timberland traditional handsewn hold on diety to die for the sins of timberland mens custom world nearly 2,000 years ago. His death back then covered the sins of every cheap timberland boots person who will ever live. He then rose to life after three mens timberland chukka? days and ever since has wanted us to accept His gracious act by loving Him and also those around us. When we do this, we will see people in a totally different timberland womens premium boots light — one that redefines what it means to be ugly or different or weird or strange. Instead, we see people with ugly timberland shoes store problems in whom God is working so they can bloom beautifully — just like I now see in my orchids whether they are “lumps” or blossoms! On a certain timberland work shoes day at a certain hour, we will pull into the station. Bands will be playing and flags waving. Once we get there, so many wonderful dreams will come true and the pieces of our timberland wheat shoes lives will fit together like a completed jigsaw puzzle. How restlessly we pace the aisles, *ing the minutes for timberland for you loitering --waiting, waiting, waiting for the station. http://www.timberland4you.co.uk/ QL
timberland bootsmerci pour le blog
Betclic