mardi 6 juillet 2010

Suppression d'URL - Partie II : suppression de texte à caractère sensible sur une page

Tout le monde peut changer d'avis. Il arrive parfois, comme nous l'avons vu dans notre post précédent sur les suppressions d'URL, que vous décidiez de bloquer ou de supprimer l'intégralité d'une page sur votre site. À d'autres moments, vous pouvez avoir envie de ne modifier qu'une partie d'une page ou de supprimer certaines portions de texte. L'apparition de ces modifications dans nos résultats de recherche peut prendre un certain temps, en fonction de la fréquence à laquelle la page est explorée. Dans ce post, nous vous présenterons la marche à suivre si un contenu obsolète ou inexistant s'affiche toujours dans nos résultats de recherche, que ce soit sous la forme d'un "extrait" ou par l'intermédiaire d'un lien menant à une page en cache. Cette procédure est utile lorsque les anciennes données contiennent des informations confidentielles devant être supprimées sur-le-champ. En revanche, vous n'êtes pas tenu de l'appliquer si vous devez simplement mettre à jour un site Web.


Prenons comme exemple un résultat de recherche fictif :
Vil Coyote
< Titre
Responsable du développement chez Tartampion - 1948 - 2003 : a travaillé sur le dispositif top secret pour la capture du Velocitus Incalculii, qui a montré tout son potentiel en matière de...
< Extrait
...
www.example.com/about/vilcoyote - En cache
< URL + lien vers la page en cache

Pour modifier le texte affiché dans l'extrait (ou sur la page en cache proposée en lien),
vous devez d'abord modifier le contenu figurant sur la page disponible en ligne. Sinon, des portions du texte d'origine continueront d'apparaître automatiquement dans les résultats de recherche Google.



Après avoir modifié le contenu de la page, vous avez le choix entre différentes options pour faire apparaître les changements dans nos résultats de recherche :
  • Attendre que Googlebot explore et indexe à nouveau la page.

Il s'agit de la méthode la plus couramment utilisée lors de la mise à jour d'un contenu sur Google. Elle peut prendre un certain temps, en fonction de la fréquence à laquelle Googlebot explore la page en question. Une fois que nous avons de nouveau exploré et indexé la page, l'ancien contenu est remplacé par le nouveau et n'est donc plus visible. Si l'exploration de la page par Googlebot n'est pas bloquée (que ce soit par un fichier robots.txt ou en raison d'un problème d'accès au serveur), vous n'avez rien à faire de particulier. Il est généralement impossible d'accélérer l'exploration et l'indexation, car ces processus entièrement automatisés dépendent de nombreux facteurs externes.


Avec cet outil, vous devez saisir l'URL exacte de la page qui a été modifiée, sélectionner l'option "Le contenu a déjà été supprimé de la page", puis indiquer un ou plusieurs termes ayant déjà été supprimés sur la page.





Notez qu'
aucun des termes que vous indiquez ne doit figurer sur la page. Même si un terme a été supprimé dans une partie de la page, s'il apparaît ailleurs sur cette même page, votre demande sera refusée. Veillez à choisir un ou plusieurs termes qui ne figurent plus du tout sur la page. Si vous supprimez "dispositif top secret pour la capture du Velocitus Incalculii" dans l'exemple ci-dessus, vous devrez indiquer ces termes et non "mon projet", par exemple. En revanche, si le terme "top" ou "dispositif" apparaît toujours sur la page, la demande sera refusée. Pour optimiser vos chances de réussite, il est souvent plus simple de ne saisir qu'un seul terme, si vous êtes certain qu'il ne figure plus sur la page.



À l'issue du traitement de votre demande et après vérification de la suppression des termes indiqués sur la page, le résultat de recherche ne proposera plus d'extrait et la page en cache ne sera pas disponible. Le titre et l'URL de la page resteront visibles, et pourront apparaître dans les résultats de recherche si un internaute effectue une recherche sur le contenu supprimé (par exemple, sur les termes [
velocitus incalculii]), même si ces derniers n'apparaissent plus dans l'extrait. Toutefois, dès que la page aura été explorée et indexée de nouveau, les mises à jour de l'extrait et du cache seront visibles dans les résultats de recherche.


N'oubliez pas que pour vérifier la suppression des termes de votre page, nous avons besoin de l'afficher. Si la page n'existe plus et si le serveur renvoie
un code d'état HTTP 404 ou 410, ce qui signifie que la page ne peut pas être affichée, nous vous conseillons de demander à supprimer la page entière.

  • Utiliser l'outil de demande de suppression d'URL dans les Outils Google pour les webmasters pour demander la suppression d'informations sur une page de votre site Web

Si vous avez accès au site Web concerné et avez confirmé que vous en êtes le propriétaire dans les Outils Google pour les webmasters, vous pouvez utiliser l'outil de demande de suppression d'URL, disponible sous Configuration du site > Accès du robot d'exploration. Vous pourrez ainsi demander la suppression de l'extrait et de la page en cache, jusqu'à ce que la page soit de nouveau explorée. Pour utiliser cet outil, il vous suffit d'indiquer l'URL exacte de la page (vous n'avez pas besoin de spécifier les termes supprimés). Une fois votre demande traitée, nous supprimons l'extrait et la page en cache des résultats de recherche. Le titre et l'URL de la page resteront visibles, et pourront apparaître dans les résultats de recherche si un internaute effectue une recherche sur le contenu supprimé. Dès que la page aura été explorée et indexée à nouveau, les mises à jour de l'extrait et de la page en cache, effectuées sur la base du nouveau contenu, seront visibles dans les résultats de recherche.

Google indexe et classe les éléments en fonction du contenu d'une page, mais aussi en tenant compte d'autres facteurs externes, tels que les liens entrants vers l'URL de la page. Par conséquent, il est possible qu'une URL continue d'apparaître dans les résultats de recherche alors que le contenu ne figure plus sur la page, même après que celle-ci a été explorée et indexée à nouveau. L'outil de demande de suppression d'URL peut supprimer l'extrait et la page en cache associés à un résultat de recherche. En revanche, il ne permet pas de modifier/supprimer le titre d'un résultat de recherche, de modifier l'URL affichée ni d'empêcher l'affichage d'une page dans le cadre de recherches basées sur l'ancien contenu ou sur le contenu actuel. Si vous souhaitez procéder à
la suppression complète d'une URL de nos résultats de recherche, vous devez vous assurer que celle-ci respecte les critères applicables.


Supprimer du contenu au format autre que HTML

Si le contenu modifié n'est pas au format (X)HTML (en cas de modification d'une image, d'un fichier Flash ou d'un fichier PDF, par exemple), vous ne serez pas en mesure d'utiliser l'outil de suppression des pages en cache. Par conséquent, si vous tenez réellement à ce que l'ancien contenu ne soit plus visible dans les résultats de recherche, la solution la plus rapide consiste à modifier l'URL du fichier de sorte que l'ancienne URL renvoie un code d'état HTTP 404, puis à utiliser l'outil de demande de suppression d'URL pour supprimer l'ancienne URL. Si vous choisissez de laisser Google actualiser naturellement vos informations, sachez que la mise à jour des aperçus du contenu au format autre que HTML (les liens
Quick View pour les fichiers PDF, par exemple) après une nouvelle exploration peut prendre plus de temps que pour les pages HTML normales.



Empêcher, de manière proactive, l'affichage des extraits ou des versions en cache



En tant que webmaster, vous avez la possibilité d'utiliser des balises Meta robots afin d'empêcher, de manière proactive, l'affichage des extraits ou des versions en cache et ce, sans faire appel à notre outil de suppression. Toutefois, nous ne recommandons pas d'utiliser cette méthode par défaut. En effet, l'extrait peut aider les internautes à identifier plus rapidement un résultat de recherche pertinent, et la version en cache d'une page peut leur permettre de voir votre contenu même si votre serveur est indisponible. Vous pouvez utiliser la balise Meta robots "nosnippet" pour empêcher l'affichage d'un extrait ou la balise Meta robots "noarchive" pour désactiver la mise en cache d'une page. Notez que si vous modifiez ainsi des pages existantes déjà indexées, Googlebot devra les explorer et les indexer à nouveau pour que les modifications soient visibles dans les résultats de recherche.


Nous espérons que ce post vous aura éclairé sur certains des processus utilisés par l'outil de demande de suppression d'URL pour les pages modifiées. Dans notre prochain post, nous étudierons les différentes manières de demander la suppression d'un contenu dont vous n'êtes pas le propriétaire. 

Comme toujours, vous pouvez nous faire part de vos commentaires et poser vos questions sur notre
Forum d'aide pour les webmasters.


Posté par John Mueller - Webmaster Trends Analyst, Google Suisse 
Share:

0 commentaires:

Enregistrer un commentaire