Apr 25

sitemap para SMF

Hace tiempo comenté en un post que el foro SMF es un desastre para que lo indexe google y, de hecho, no aparecía en google ninguno de los temas de mi foro de java. Intenté instalar el plugin seo4smf para tratar de arreglarlo, pero no conseguí que me funcionara. Al final, como comenté en aquel post, me hice un pequeño programa java que generara un fichero sitemap.xml para colgarlo en el foro.

Esa opción no era buena del todo. Conseguí que google indexara los temas del foro, pero tenía que actualizar el sitemap periódicamente a mano. Así que decidí hacerme un pequeño script sitemap.php que hiciera de sitemap para google de forma automática.

Este script, al llamarlo, consulta en la base de datos el campo id_topic de la tabla smf_topics. Es la única información que necesita para generar el fichero XML de sitemap. El script dice que devuelve un "Content-Type : application/xml" para que cuando google lo consulte piense que es un fichero XML, luego envía los tags XML correspondientes al sitemap.

Adjunto el código php por si a alguien le interesa

<?php
header(’Content-Type: application/xml’);
include (’Settings.php’);

print (’<?xml version="1.0" encoding="UTF-8"?>’);
print (’<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">’);

$link = mysql_connect ($db_server, $db_user, $db_passwd) or die ("<center>No se puede conectar con la base de datos\n</center>\n");
$query=’select id_topic from smf_topics’;
$result=mysql_db_query ($db_name, $query, $link);

while ($row = mysql_fetch_array ($result))
{
   print (’<url>’);
   print (’<loc>’);
   print (’http://foro.chuidiang.com/index.php?topic=’.$row[0]);
   print (’</loc>’);
   print (’</url>’);
}
mysql_free_result($result);
print (’</urlset>’);
?>

El include "Settings.php" únicamente incluye un fichero de configuración del foro, en el que están las variables con el nombre de la base de datos $db_name, el usuario $db_user y la password $db_passwd. Ojo, no le busqueis pegas, que las tiene. Yo no tengo ni idea de PHP.

 

Apr 11

Castigado por google

Hace unos días comenté que me habían crackeado el header.php de wordpress, metiendo un montón de enlaces ocultos de spam. Este tipo de cosas es una práctica castigada por google y, efectivamente, pocos días después, fuí castigado por google. En el gráfico de visitas se puede apreciar un descenso brusco de visitas, que se mantiene, pocos días depués de que me crakearan el blog.

Estadisticas blog chuidiang

Por cierto, el bajón de la segunda semana que se ve en el gráfico corresponde con semana santa. Se ve que los estudiantes no están muy por la labor de java….

Mar 25

Indexado en google del foro SMF

Después de darme cuenta del pequeño desastre del foro SMF con google, y de no conseguir que funcionara el plugin de seo4smf, decidí hacerme mi propio sitemap.xml para google. Había hecho un programita en java que generaba ese fichero xml simplemente con un bucle de 2 a 1059 (el número de post en el foro en ese momento). Subí el fichero al foro, lo dí de alta en google…. y aparentemente NO funcionó. Después de un par de semanas, ninguno de los post del foro estaba indexado.

Estuve pensando cual podía ser el motivo. Hay páginas del foro que sí están indexadas en google, como la de mensajes recientes, los perfiles de los usuarios, la página principal del foro… pero NO los post. A pesar de que los parámetros que se pasan a la página php del foro son igual de feos en todos los casos, no veía por qué los post no se indexaban. Al final y por probar, decidí que podía ser cosa del punto decimal. Los post llevan un parámetro tal que así "topic=1046.0", con un decimal punto cero. Se me ocurrió que google podía interpretar ese decimal como que esa variable y, por tanto, la página, es muy variable en función de ese valor que no parece un índice, sino un valor arbitrario.

Así que hice mis experimentos. Primero comprobé que se puede acceder al post sin poner ese decimal, con algo como "topic=1046". Funciona bien. Así que hice el sitemap.xml sin ese decimal…. y funcionó. Una semana después de subir el nuevo sitemap.xml, google empezó a indexar los post y un par de semanas después, ya estaban casi todos.

Ahora la tarea que me queda es hacer un pequeño script de php que me genere ese sitema.xmp, o bien un sitemap.php que devuelva una página xml con el formato del sitemap. De esta forma, cuando google visite el sitemap, lo tendrá actualizado.

Me quedan algunas dudas. Aparentemente tengo una cosa que no le gusta a a google, que es contenido duplicado. Se accede al mismo post a través de "topic=1046.0" que a través de "topic=1046". Sin embargo, al no estar indexado el primero, quizás no importe, ya que no tiene con quien comparar el segundo. Es cuestión ahora de ver si en las búsquedas de google empiezan a aparecer los post por algún sitio y de revisar mis estadísticas, a ver si se empieza a entrar directamente en los post desde google.

Jan 18

Temas con iGoogle

No me fijo mucho en las cosas, así que no sé el tiempo que lleva, pero en iGoogle pone "nuevo…."

La cosa es que con tu cuenta de gmail puedes entrar en sesión en la página de google, con lo que puedes "personalizar" google. Hasta ahora lo usaba para tener ahí los "feeds" de los blogs que visito y el de la Chuwiki, por si alguien se equivoca algún día y escribe algo.

Pues bien, ahora en la parte superior derecha del buscador de google, cuando estás en sesión, tienes un enlace a "seleccione un tema". Pinchando ahí se puede seleccionar una especie de "tema" para google, de forma que luego la caja de busqueda te aparece dentro de un "banner" y los colores de la página en general toman los tonos propios del tema.

Lo más curioso es que muchos de los banner son un paisaje con un sol. Al instalar el tema, te pide que digas en que ciudad/pais/zona horaria vives, de forma que la foto del "banner" y el sol van cambiando de posisición. Lo he instalado hace un par de horas y el sol efectivamente ha cambiado de posición. Esta noche veré si se hace de noche…

ACTUALIZADO TRES SEGUNDOS DESPUÉS:

Voy a ahorraros el comentario y ya lo pongo yo.  ¡¡ A buenas horas, mangas verdes !!. Esto ya lleva desde Marzo del año pasado, por lo menos.

¿Se habrán olvidado google de la etiqueta "nuevo" o caduca al año?

Jan 16

Adwords para Adsense

Creo que he estado a punto de meter la pata y creo que no la he metido, espero, aunque estoy a tiempo, sopongo. Y me explico.

Aprovechando que los de google lo ponen todo fácil, se me ha ocurrido apuntarme a Adwords para hacer publicidad de mi página web Apuntes de Programación. La idea última, por supuesto, es conseguir más visitas para conseguir más clicks en los anuncios de Adsense. Lo de Adwords es sencillo. Pagas 5$ por activar la cuenta, creas tu anuncio poniendo un par de textos, eliges palabras clave para las que quieres que salga tu anuncio, dices lo máximo que quieres pagar al mes y listo.

Sin embargo, afortunadamente, me ha dado por pensar, justo antes de meter mis datos bancarios. Pago por click que hagan en mi anuncio. Pero cada visita que venga a mi página, no hará click en un anuncio de mi página, por lo que supongo que es "hacer pan con unas tortas". Vaya, que gastaré más dinero que el que ganaré.

Así que tengo mi cuenta de Adwords abierta, no he pagado un duro y no creo que la use. Supongo que este tipo de propaganda es útil para gente que tiene el negocio en la web vendiendo cosas, pero no para tratar de compensarlo con anuncios de Adsense.

 

Dec 15

¿Se estarán pasando los de google?

Leo en google.dirson esta noticia que me deja un pelín preocupado. Aunque el principio de la noticia no cuenta nada del otro mundo, simplemente la evolución de la web y el rechazo de la wikipedia a poner anuncios google, los últimos párrafos sí son más chocantes.

Por lo visto, google tiene un marcha un proyecto llamado google knol, en el que google pretende que la gente escriba los artículos científicos, de historia, generales, etc. Por supuesto, piensa pagar a los que escriban por medio de los anuncios insertados en esos artículos.

Lo peor de todo esto es que posiblemente estos artículos empezarán a salir en el buscador de google, supongo que en igualdad de condiciones con el resto de la web. Pero, si google hace las cosas la mitad de bien de lo que suele hacerlas, lo más probable es que esos artículos salgan de los primeros en las búsquedas. Todo esto hará que la gente tienda a escribir sus artículos allí, ya que tendrán visitas y además cobrarán por ello, en vez de tratar de mantener sus propios sitios web, sin garantía de éxito y pagando por el hosting.

¿No llevará todo esto a un monopolio demasiado monopolio?. Google ya no sólo controlará las búsquedas, sino que con el tiempo quizás también la información. El tiempo lo dirá.

Dec 09

Gráficos estadísticos con Google

Veo en google.dirson que ahora podemos pintar gráficos estadísticos en nuestra web casi inmediatamente. Basta con enlazar a chart.apis.google.com pasando los parámetros adecuados y listo, sale el gráfico en nuestra web.

Por ejemplo, este enlace, http://chart.apis.google.com/chart?cht=p3&chd=s:hW&chs=250x100&chl=Hola|Mundo , metido como un img src="..." da lugar a

grafico estadistico

No deja de ser una cosa interesante y que puede darnos mucho juego, sobre todo con páginas PHP o JSP, para la presentación de datos de una base de datos. En http://code.google.com/apis/chart/ tenemos la documentación necesaria.

Nov 04

Por un pelo

Cuando pones anuncios de google en tu página, google revisa una vez al mes si has llegado a 100$ de ingresos. Si llegas, paga. Si no llegas, espera que sigas acumulando otro mes completo para ver si ya llegas. El caso es que, según tus ingresos, puedes cobrar una vez al mes, cada dos meses, cada tres, etc.

En mi caso, lo normal es cada dos meses. En un mes me quedo alrededor de los 70$, por lo que cada dos meses cobro aproximadamente 140$

Sin embargo, este mes de Octubre ha sido especialmente productivo … y especialmente fustrante. Los ingresos diarios durante el mes de Octubre fueron especialmente altos, por lo que me hice con la esperanza de juntar los ansiados 100$ en un solo mes. Día a día, según nos acercábamos a final de Octubre, lo veía cada vez más cercano y posible. Pero … ¡ decepción !. El 31 de Octubre a las 12 de la noche me quedé en 99,59$. Me quedé a 41 cochinos ¿centavos de dolar?. Condenado, otra vez, a cobrar cada dos meses.

Y lo más recochineante de todo. Una hora después, a la 1 de la madrugada del 1 de Noviembre, un solo click me reporta 1,51$. Una cantidad suficiente para haber superado los 100$.

En fin, resignación. Son cosas que pasan.

Por cierto, NO se te ocurra ayudarme a base de clicks. Los de google son muy listos y detectan estas cosas. Los clicks falsos a la largan son contraproducentes.

Oct 29

Más sobre la cabra

Bueno, ando un poco cabreadillo con la cabra -google-. Me entero en el blog de Max Glaser que google, después de seis meses, ha actualizado los page rank. También veo ahí que parece que esta vez han sido un poco rácanos y han bajado el page rank de muchas páginas. Y lo peor de todo, veo en mis propias páginas que varias han pasado de page rank 4 a page rank 3.

Al menos tendré la oportunidad de ver si el page rank sirve o no para algo. Tendré que mirar en las siguientes semanas si se aprecia un cambio brusco de tráfico o todo sigue igual.

¿Os ha pasado algo parecido en vuestros respectivos?

Y ya puestos a meterme con google, no me gustan ahora los resultados de las búsquedas. Aunque si están más o menos claramente diferenciados, hace algún tiempo han metido propaganda o enlaces patrocinados o como quieras llamarlo entre los resultados de la búsqueda. Ya tienes que andar con más cuidado en lo que pinchas.

Oct 26

Alucino con google

Después de la sorpresa de anteayer al buscar DecimalFormat en google, se me ha ocurrido buscarlo hoy otra vez. La sorpresa esta vez sí que ha sido mayúscula.

Esta vez en primera posición de la búsqueda de DecimalFormat sigue apareciendo la página aleatoria de la Chuwiki, pero esta vez, el resumen que aparece en la búsqueda es de "ćomo poner una imágen aleatoria con php".

Y eso no es todo. Si pincho en la caché del resultado de búsqueda, sale "certificados y firmas digitales".

Está claro que el googlebot ha pasado en varias ocasiones por la página aleatoria. En una decidió que DecimalFormat debía ir en primera posición en la búsqueda. En otra ocasión decidió que la imagen aleatoria de php va en el resumen y a la tercera se guardó como caché la de certificados y firmas. A pesar de todo eso, sigue decidiendo que esa página es la primera en DecimalFormat, aunque el resumen ni la caché hablen en absoluto de eso.

Aquí las capturas de la búsqueda de hoy …

Busqueda DecimalFormat

y de la caché

cache busqueda DecimalFormat

Yo creo que no puede estar más claro. Google está un poco cabra.