Google planea indexar sitios Web en tiempo real

Noticias Ultimas.- En ReadWriteWeb se cuenta que google esta pensando en incorporar un nuevo protocolo de de búsquedas en forma radical, para lo cual adoptara el uso del protocolo PubSubHubbub.

En la actualidad Google cuenta con centenares de ordenadores que indexa paginas mediante un programa llamado arañas de la Web que va recorriendo una página Web tras otra de forma automatizada y siguiendo los enlaces presentes en esta.

Pero este trabajo es realmente arduo, para verificar las actualizaciones, consume mucho tiempo y energía, y además no es muy eficiente. Muchas veces las arañas de google visitan algunas páginas varias veces al día, mientras que otras son solo visitadas una vez cada varios días.

El nuevo protocolo aprovecha la verificación de contenidos que hacen los usuarios, por ejemplo desde las redes sociales, muchos de estos usuarios se suscriben y regresan a ver si hubo alguna actualización.

En el protocolo PubSubHubbub existen tres actores principales: Los publicadores, los suscriptores, y los nodos. Los nodos están diseñados para avisar a los suscriptores de las actualizaciones.

De este modo, que si Google se suscribe a los nodos PubSubHubbub de las publicaciones tendría el trabajo hecho para recibir las notificaciones de actualización en tiempo real.

El trabajo de las arañas se limitaría a la búsqueda de sitios nuevos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *