Blogger mejora el formato de los Sitemaps

Los sitemaps en Blogger siempre se han podido enviar con los feeds RSS/Atom pero ahora gracias a un reciente cambio en la plataforma todos los blogs también cuentan con el formato XML.

Pueden verlo en funcionamiento en el blog oficial para webmasters entrando a googlewebmaster-es.blogspot.com/sitemap.xml. También notarán el cambio en los archivos robots.txt que se generan por defecto.

nuevo robots txtx de blogger

Antes la URL del Sitemap por defecto era …blogspot.com/feeds/posts/default?orderby=updated

Recuerdo que la primera vez que vi una forma mejorada de enviar un sitemap en Blogger fue en Vagabundia en un viejo post de 2007. El método que JMiur explicaba era genial porque permitía enviar sitemaps con hasta 500 URLs para ser rastreadas, en lugar de los últimos 25 artículos que el feed enviaba por defecto.

Recordemos que un sitemap es como su nombre lo indica un mapa del sitio, su función es muy simple, facilitar el rastreo. Aunque Google y otros buscadores generalmente no tienen problemas para rastrear todas las páginas de un sitio, el sitemap puede ser de gran ayuda ya que se están sirviendo en bandeja todas las URLs que se deben rastrear.

Esto facilita además la detección de cambios en las páginas más antiguas, imagina que no utilizas un Sitemap y actualizas o mejoras un post antiguo publicado hace varios años ¿cómo detectaría Google ese cambio? Para detectarlo el bot tiene que acceder al post, pero si no recibe ninguna señal sobre el cambio (como un ping) pueden pasar días, semanas e incluso meses hasta que recorriendo el sitio Google llegue a ese post, es algo que dependerá de la frecuencia de rastreo, el tamaño del sitio y su estructura. Con el sitemap este proceso se acelera notablemente.

El nuevo sitemap XML de Blogger incluye todos los post y sus respectivas fechas de modificación, es el formato XML más simple que se puede enviar. En blogs que tienen una gran cantidad de artículos publicados se envía un índice de sitemaps, es un archivo parecido que sirve para enviar varios sitemaps en uno. Un ejemplo lo pueden ver en vagabundia.blogspot.com/sitemap.xml

¿Qué formato enviar?

Para un rastreo óptimo Google recomienda utilizar ambos formatos ya que los sitemaps XML suelen ser más grandes al incluir todas las URLs del sitio y por ello ser rastreados con menor frecuencia, mientras que los feeds RSS/Atom son más pequeños y contienen sólo las actualizaciones más recientes. Si se envían ambos , aunque algunas de las URLs se repitan, no habrá ningún problema.

También es recomendable realizar pings para que los cambios sean detectados, en caso de actualizar el sitemap XML se puede hacer un ping a Google con esta URL www.google.com/webmasters/sitemaps/ping?sitemap=http://example.com/tu-sitemap.xml

Y en caso de utilizar RSS/Atom se recomienda utilizar el protocolo PubSubHubbub. Este último puede activarse fácilmente si se utiliza Feedburner con la opción PingShot de la pestaña Publicize.

PubSubHubbub con feedburner

Error 404 en sitemap.xml en los blogs con dominio propio:

Quienes tengan un blog con dominio propio notarán que al acceder al Sitemap la página responde con un error 404 Not Found. Se trata de un error temporal que debería de ser solucionado dentro de poco, el problema ya es conocido por el equipo de Blogger tal cual lo comenta Felipe (NicoNico), uno de los colaboradores principales en los foros de Blogger.

Deja un comentario