Définition de Désindexation


 

Définition de Désindexation :

definition-desindexationLa désindexation désigne en SEO le fait de ne pas montrer aux moteurs de recherche certains contenus considérés comme de faible ou mauvaise qualité pour ne garder que ceux qui intéresseront les internautes lorsqu’ils les trouveront dans les résultats de recherche. Un tri sélectif, en quelque sorte…

 

Depuis Panda, les référenceurs ont appris à séparer le bon grain de l’ivraie et à désindexer les contenus de faible qualité. Explications…

Pendant des années, on donnait « à manger » en référencement naturel à Google (ou à tous les moteurs de recherche) toutes les pages d’un site web, libre au moteur de séparer les contenus de bonne ou mauvaise qualité en fonction de ses capacités de digestion. Puis, en 2011 est arrivé le filtre algorithmique Panda qui a bouleversé la donne à ce niveau en pénalisant les sites proposant un contenu de faible qualité. Un terme soit dit en passant assez flou et globalement mal expliqué par Google à l’époque.

Un nouveau pan du métier de SEO a alors vu le jour avec la désindexation des contenus de faible qualité d’un site web, afin de ne plus montrer aux moteurs que les pages correspondant à la meilleure qualité possible. En effet, l’internaute (ou le mobinaute) utilisant un moteur de recherche désire avant tout trouver des pages répondant à sa question et correspondant donc à un certain niveau de qualité. Google pousse donc les webmasters à lui proposer en priorité ce type d’information et à supprimer les autres de la vue de ses robots.

Sont ainsi considérés comme des contenus de faible qualité :

  • Les pages contenant trop peu de texte ;
  • Les pages en duplicate content ;
  • Les formulaires trop nombreux ;
  • Les pages de résultats du moteur interne ;
  • Les pages proposant du contenu spinné ;
  • Etc.

Pour désindexer, plusieurs solutions sont possibles, dont 4 sont le plus souvent utilisées :

  • Le fichier robots.txt ;
  • La balise meta robots « noindex » ;
  • La directive X-Robots-Tag du protocole HTTTP (souvent utilisée pour désindexer des fichiers au format non-HTML : PDF, Word, Excel…)
  • Le formulaire de suppression d’URL dans la Search Console

Désindexer du site de faible qualité va également optimiser le budget crawl du moteur lors de l’exploration de vos pages.

desindexation-search-console
Le formulaire de désindexation dans la Search Console, une solution qui peut convenir pour une action rapide sur quelques pages isolées.

Voici également quelques liens pour aller plus loin sur le sujet :

Et quatre vidéos sur Panda et les principes de la désindexation :


Faut-il (dés)indexer les fichiers PDF ? (Abondance)


Comment savoir si votre site est impacté par Panda ou Penguin ? (Abondance)


Les Pénalités Google : Filtres Algorithmiques (Abondance)


Should I disallow Googlebot from crawling slower pages? (Google, Matt Cutts)

Publié le 12 avril 2018
 
  • Hello et merci pour cet article.
    J’ai une question peut etre un peu idiote, mais dans la nouvelle version de la Search Console, on ne peut plus désindexer une url, non ?

  • Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *