Después de darme cuenta del pequeño desastre del foro SMF con google, y de no conseguir que funcionara el plugin de seo4smf, decidí hacerme mi propio sitemap.xml para google. Había hecho un programita en java que generaba ese fichero xml simplemente con un bucle de 2 a 1059 (el número de post en el foro en ese momento). Subí el fichero al foro, lo dí de alta en google…. y aparentemente NO funcionó. Después de un par de semanas, ninguno de los post del foro estaba indexado.
Estuve pensando cual podía ser el motivo. Hay páginas del foro que sí están indexadas en google, como la de mensajes recientes, los perfiles de los usuarios, la página principal del foro… pero NO los post. A pesar de que los parámetros que se pasan a la página php del foro son igual de feos en todos los casos, no veía por qué los post no se indexaban. Al final y por probar, decidí que podía ser cosa del punto decimal. Los post llevan un parámetro tal que así "topic=1046.0", con un decimal punto cero. Se me ocurrió que google podía interpretar ese decimal como que esa variable y, por tanto, la página, es muy variable en función de ese valor que no parece un índice, sino un valor arbitrario.
Así que hice mis experimentos. Primero comprobé que se puede acceder al post sin poner ese decimal, con algo como "topic=1046". Funciona bien. Así que hice el sitemap.xml sin ese decimal…. y funcionó. Una semana después de subir el nuevo sitemap.xml, google empezó a indexar los post y un par de semanas después, ya estaban casi todos.
Ahora la tarea que me queda es hacer un pequeño script de php que me genere ese sitema.xmp, o bien un sitemap.php que devuelva una página xml con el formato del sitemap. De esta forma, cuando google visite el sitemap, lo tendrá actualizado.
Me quedan algunas dudas. Aparentemente tengo una cosa que no le gusta a a google, que es contenido duplicado. Se accede al mismo post a través de "topic=1046.0" que a través de "topic=1046". Sin embargo, al no estar indexado el primero, quizás no importe, ya que no tiene con quien comparar el segundo. Es cuestión ahora de ver si en las búsquedas de google empiezan a aparecer los post por algún sitio y de revisar mis estadísticas, a ver si se empieza a entrar directamente en los post desde google.
April 25th, 2008 at 5:34 am
[…] tiempo comenté en un post que el foro SMF es un desastre para que lo indexe google y, de hecho, no aparecía en google ninguno de los temas de mi foro de java. Intenté […]