SEO W, LLC

Le partenaire de votre réussite sur internet

Google obtient un brevet pour la détection du duplicate content

Le 1er Décembre 2009, Google a obtenu un brevet pour la détection du « duplicate content » (contenu en double). Ce brevet à été demandé le 3 juillet 2003.

Le brevet explique comment le moteur de recherche fait pour détecter le contenu dupliqué.

Le duplicate content c’est quoi ?

Le brevet contient une définition du duplicate content :

« Les documents en double sont des documents qui ont un contenu sensiblement identique ou qui ont un mode de réalisation de contenu tout à fait identique, mais avec des urls différentes. »

Le brevet décrit trois scénarios dans lesquels les documents en double sont identifiés comme tel par le robot d’exploration:

1. Deux pages, ayant la même structure de contenu sont des documents en double si elles partagent le même contenu de la page, mais ont des URL différentes.

2. Deux pages avec redirection temporaire sont des documents en double si elles partagent le même objectif d’URL, mais des URL source différente.

3. Une page Web classique et une page de redirection temporaire sont des documents en double si l’URL de la page Web est l’URL cible de la page de redirection temporaire et si le contenu de la page Web classique est la même que celle de la page de redirection temporaire.

Une page de redirection permanente n’est pas vue comme du duplicate content, car les robots d’exploration ne sont pas configurés pour télécharger le contenu de la page de redirection permanente.

Comment Google peut détecter le duplicate content ?

Selon la description du brevet, le robot de Google consulte le serveur qui contient du contenu en double pour vérifier si une page trouvée est une copie d’un autre document. L’algorithme détermine ensuite quelle version est la version la plus importante pour les visiteurs potentiels.

Google peut utiliser différentes méthodes pour détecter le contenu en double. Par exemple, Google pourrait prendre des repères dans le contenu et les comparer quand une nouvelle page Web est trouvée.

Fait intéressant, ce n’est pas toujours la page avec le meilleur Pagerank ni la plus ancienne qui est vu comme la version original du contenu.

Comment le duplicate content peut pénaliser votre site internet ?

En cas de duplicate content le moteur de recherche garde une seule page de son choix en top position. Si vous souhaitez obtenir des classements élevés, il est plus facile de le faire avec un contenu unique. Essayez d’utiliser du contenu original autant que possible sur vos pages Web.

Si votre site Web doit utiliser le même contenu qu’un autre site Web, assurez-vous que votre site a de meilleurs liens entrants que les autres sites Web qui contiennent le même contenu. Ainsi il est plus probable que votre site sera choisi comme l’URL la plus importante pour ce contenu dupliqué.

Si votre site a un contenu unique, vous ne devez pas vous inquiéter au sujet des pénalités du duplicate content. Optimisez votre contenu pour les moteurs de recherche et assurez-vous que votre site web a de bons liens entrants. Il est plus facile de bien positionner un site web avec un bon contenu optimisé et beaucoup de bons liens entrants.

Popularity: 13% [?]

Consultez également :

Tags : , , , , , , , , ,

Réagissez