Pourquoi Google garde de vieux sites dans son index ?

J’ai un exemple précis à donner : cela fait plusieurs années que rubylive.fr redirige avec une 301 vers http://news.humancoders.com/t/ruby, pourtant rubylive figure toujours dans l’index Google (il suffit de chercher “site:rubylive.fr” pour s’en rendre compte).
Pourquoi Google fait-il ça ? Et peut-on avoir la main sur ce comportement ?

1 « J'aime »

Le pourquoi je ne saurais pas vraiment y répondre…

Mais pour avoir “un peu” la main sur ce comportement tu as les outils webmasters de Google : https://www.google.com/webmasters/tools/

Tu peux y demander une désindexation de ton site, ou d’une partie.

Quand je cURL rubylive je récupère une 302 (moved temporarily). Ca explique surement ton problème

$ curl -I http://www.rubylive.fr
HTTP/1.1 302 Moved Temporarily
Date: Mon, 30 Mar 2015 07:59:32 GMT

EDIT: oops autant pour moi, le sous domaine www renvoi une 302 mais le domaine rubylive.fr renvoi bien une 301. Je sais pas comment Google gère ce genre de cas de figure. Tu devrais poser la question sur un forum spécialisé SEO.

On utilisait pas les www. donc c’est effectivement une 301 qui est faite.

$ curl -I http://rubylive.fr
HTTP/1.1 301 Moved Permanently
Date: Mon, 30 Mar 2015 23:30:02 GMT

Dans Webmaster tools tu peux désindexer des urls

Human Coders - Le centre de formation recommandé par les développeur·se·s pour les développeur·se·s