lundi 28 juin 2010

Suppression d'URL - Partie I : URL et répertoires

Niveau webmaster : tous



Il y a une grande quantité de contenus sur Internet. Une information peut se retrouver en ligne sur le Web alors que vous ne souhaitiez pas qu’elle y soit. Il peut s'agir, par exemple, d'un message de blog provocateur que vous regrettez d'avoir publié ou de données confidentielles divulguées de manière accidentelle. Dans la plupart des cas, lorsque vous supprimez ce contenu ou en limitez l'accès, il disparaît naturellement des résultats de recherche au bout d'un certain temps. Mais si vous souhaitez supprimer en urgence un contenu indésirable qui a été indexé par Google, sans attendre qu'il disparaisse naturellement, vous pouvez utiliser notre outil de demande de suppression d'URL. Le contenu sera ainsi supprimé rapidement de nos résultats de recherche, à condition qu'il respecte certains critères (exposés ci-dessous).



Nous avons préparé une série de posts pour vous expliquer comment supprimer différents types de contenu et les erreurs courantes à éviter. Dans ce premier post, je vais vous présenter quelques scénarios classiques, à savoir comment supprimer une URL, un répertoire entier ou l'intégralité d'un site, et comment réintégrer un contenu supprimé. Par ailleurs, je vous conseille vivement de lire notre précédent message concernant la gestion de vos informations personnelles publiées sur Internet.




Suppression d'une URL



En général, pour que votre demande de suppression aboutisse, le propriétaire de l'URL en question (que ce soit vous ou une autre personne) doit avoir approuvé la suppression de ce contenu. Il existe trois façons d'approuver la suppression d'une URL. Vous pouvez ainsi :

  • bloquer l'exploration de la page au moyen d'un fichier robots.txt ;
  • bloquer l'indexation de la page au moyen d'une balise Meta noindex ;
  • indiquer que la page n'existe plus en renvoyant un code d'état 404 ou 410.

Avant d'envoyer une demande de suppression, vous pouvez vérifier si l'URL est correctement bloquée :

  • Fichier robots.txt : vérifiez si l'URL est correctement bloquée en utilisant l'outil “Analyser comme Googlebot” ou “Test de robots.txt” des Outils pour les webmasters.
  • Balise Meta noindex : utilisez l'outil “Analyser comme Googlebot” afin de vous assurer que la balise Meta apparaît entre les balises et . Si vous souhaitez vérifier une page que vous ne parvenez pas à valider dans les Outils pour les webmasters, vous pouvez l'afficher dans un navigateur, puis sélectionner Affichage > Code source de la page. Assurez-vous alors que la balise Meta est située entre les balises et .
  • Code d'état 404 ou 410 : pour vérifier que l'URL renvoie effectivement le bon code, utilisez l'outil Analyser comme Googlebot, ou d'autres outils tels que Live HTTP Headers ou web-sniffer.net. Le message "404" ou "Introuvable" s'affiche parfois sur les pages "supprimées" alors qu'un code d'état 200 est renvoyé dans l'en-tête de la page. Par conséquent, mieux vaut recontrôler à l'aide d'un outil de vérification d'en-tête approprié.

Si le contenu indésirable a été supprimé de la page, mais que cette dernière n'a été bloquée par aucun des moyens mentionnés ci-dessus, vous ne pourrez pas supprimer complètement l'URL de nos résultats de recherche. Cette situation se présente généralement lorsque vous n'êtes pas le propriétaire du site hébergeant le contenu. Nous vous indiquerons comment y faire face dans un post ultérieur.



Lorsqu'une URL respecte l'un des critères ci-dessus, vous pouvez la supprimer en procédant comme suit : accédez à la page http://www.google.com/webmasters/tools/removals, saisissez l'URL à supprimer, puis sélectionnez l'option "Le webmaster a déjà bloqué la page". L'URL à indiquer correspond à la page sur laquelle le contenu est hébergé, et non à l'URL de la page des résultats de recherche Google sur laquelle elle s'affiche. Par exemple, saisissez http://www.example.com/contenu-embarrassant.html
et non http://www.google.com/search?q=contenu+embarrassant

Pour être certain d'indiquer la bonne URL, reportez-vous à cet article. N'oubliez pas que si vous ne nous communiquez pas l'URL exacte qui vous pose problème, nous ne serons pas en mesure de supprimer le contenu visé.




Suppression de l'intégralité d'un répertoire ou d'un site



Pour qu'une demande de suppression d'un répertoire ou d'un site entier aboutisse, le répertoire ou le site en question doit être bloqué dans le fichier robots.txt du site. Par exemple, pour supprimer le répertoire http://www.example.com/secret/, le fichier robots.txt doit indiquer : User-agent: *
 Disallow: /secret/

Le fait que la racine du répertoire renvoie un code d'état 404 ne signifie pas pour autant que les fichiers présents dans ce répertoire ne s'afficheront pas. En bloquant un répertoire (ou un site entier) à l'aide du fichier robots.txt, vous êtes certain que toutes les URL associées à ce répertoire (ou à ce site) seront également bloquées. Pour vérifier si un répertoire a été correctement bloqué, vous pouvez utiliser l'outil “Analyser comme Googlebot” ou “Test de robots.txt” des Outils pour les webmasters.



Seuls les propriétaires confirmés d'un site peuvent demander la suppression de l'intégralité de ce site ou de l'un de ses répertoires dans les Outils. Pour demander la suppression d'un répertoire ou d'un site, cliquez sur le site en question, puis sélectionnez Configuration du site > Accès du robot d'exploration > Supprimer l'URL. Si l'URL à supprimer correspond à la racine de votre site, vous êtes invité à confirmer la suppression de l'intégralité du site. Si vous saisissez un sous-répertoire, sélectionnez l'option "Supprimer un répertoire" dans le menu déroulant.




Réintégration de contenu



Vous pouvez, à tout moment, annuler les demandes de suppression concernant les sites dont vous êtes le propriétaire, y compris celles émanant de tiers. Pour cela, vous devez être un propriétaire confirmé de ce site dans les Outils. Une fois ce statut confirmé, vous pouvez accéder à la page Configuration du site > Accès du robot d'exploration > Supprimer l'URL > URL supprimées (ou > Demandées par d'autres webmasters), puis cliquer sur "Annuler" en regard des demandes à annuler.



Vous avez encore des questions ? Plus d’infos seront publiées dans cette série de posts sur la suppression de contenu dans les résultats de recherche Google. Vous ne souhaitez pas attendre ? Dans ce cas, n'hésitez pas à consulter notre Forum d'aide. Celui-ci contient déjà de nombreuses informations sur la suppression des URL et sur la marche à suivre en cas de problème. Si les témoignages des autres utilisateurs n'ont pas permis de répondre à toutes vos questions, n'hésitez pas à nous les poser. Sachez cependant que, bien souvent, il est difficile de donner des conseils pertinents à propos de la suppression d'un contenu spécifique sans connaître le site ou l'URL en question. Nous vous recommandons de partager votre URL en faisant appel à un service de raccourcisseur d'URL. De cette manière, l'URL qui pose problème et qui s'affiche dans votre message ne sera pas indexée. Certains de ces services permettent même de désactiver le raccourci par la suite, une fois le problème résolu.


Posté par Susan Moskwa - Webmaster
Share:

0 commentaires:

Enregistrer un commentaire