Pourquoi Google garde de vieux sites dans son index ?

camilleroux · Mars 23, 2015, 9:26

J’ai un exemple précis à donner : cela fait plusieurs années que rubylive.fr redirige avec une 301 vers http://news.humancoders.com/t/ruby, pourtant rubylive figure toujours dans l’index Google (il suffit de chercher “site:rubylive.fr” pour s’en rendre compte).
Pourquoi Google fait-il ça ? Et peut-on avoir la main sur ce comportement ?

Julien_S · Mars 24, 2015, 7:47

Le pourquoi je ne saurais pas vraiment y répondre…

Mais pour avoir “un peu” la main sur ce comportement tu as les outils webmasters de Google : https://www.google.com/webmasters/tools/

Tu peux y demander une désindexation de ton site, ou d’une partie.

vdaubry · Mars 30, 2015, 8:01

Quand je cURL rubylive je récupère une 302 (moved temporarily). Ca explique surement ton problème

$ curl -I http://www.rubylive.fr
HTTP/1.1 302 Moved Temporarily
Date: Mon, 30 Mar 2015 07:59:32 GMT

EDIT: oops autant pour moi, le sous domaine www renvoi une 302 mais le domaine rubylive.fr renvoi bien une 301. Je sais pas comment Google gère ce genre de cas de figure. Tu devrais poser la question sur un forum spécialisé SEO.

camilleroux · Mars 30, 2015, 3:27

On utilisait pas les www. donc c’est effectivement une 301 qui est faite.

$ curl -I http://rubylive.fr
HTTP/1.1 301 Moved Permanently
Date: Mon, 30 Mar 2015 23:30:02 GMT

rkueny · Mars 31, 2015, 10:02

Dans Webmaster tools tu peux désindexer des urls