22 Dic 2010

Google Bot, el gran cerebro

Escrito por: Gaizka Manero López el 22 Dic 2010 - URL Permanente

Siempre he pensado cómo es posible que con teclear unas letras en nuestro teclado, un ordenador ponga grandes paquetes de información a nuestro alcance. Decenas de buscadores nos facilitan las búsquedas, pero hay uno que es, sin duda, sinónimo de todo lo que Internet ofrece: Google.

Después de indagar tanto en wikipedia y con la ayuda de un reportaje publicado esta semana en la revista Quo , he conseguido reconstruir como funciona el corazón del gran cerebro de la Red.

La parte del creador


Como es obvio, para que Google te encuetre, primero tienes que volcar contenidos en una web, blog o similar. Es entonces cuando los Google Bots -o robots de búsqueda de Google- rastrean los contenidos y llegan a nuestra "página". Sin embargo, no todo lo que escribimos es percibido. Hay órdenes como "nofollow" que si son indicadas en el código de la página -archivo "robots.txt"- evitan que Google nos indexe. Todo lo contrario ocurre cuando tenemos enlaces en nuestra página o somo linkados desde páginas con "autoridad". Pero tened cuidado, si manipulamos en exceso los textos para ser rastreados por los Google Bots, corremos el riesgo de que nos eliminen de los resultados.

Si somos detectados, Google utiliza los títulos de páginas y enlaces de nuestras webs en sus índices. En otro índice paralelo se almacena el contenido de la página (que posteriormente es evaluado en lo que se llama comprobación editorial) y se comprueba gracias a las búsquedas de los usuarios -detectan spam y se observa que se cumpla la normativa de protección de datos-.

Si el contenido o los indexadores son engañosos, Google nos "penaliza".

El usuario de Google


Cuando entramos en google.com y tecleamos lo que queremos buscar, el portal nos sugiere palabras de búsquedas recientes y se apoya en sinónimos para mejorar los resultados. En estos tienen más importancia las web locales y más cercanas al punto geográfico del buscador. De los millones de posibilidades, sólo se muestran unas mil.

Aquí entra el programa Page Rank, el gran secreto de los de Silicon Valley. Éste ordena por ranking de interés las webs, aunque según los criterios del propio buscador. Para todo ello se aplican filtros, aunque si hay libros, vídeos o noticias relacionadas con la búsqueda, se entremezclan con las webs. Siempre se prioriza las webs visitadas anteriormente por el IP del usuario.

En ocasiones, si el término buscado también está siendo buscado a la vez por muchos otros usuarios, Google podría primar la "tendencia" de este término sobre los demás criterios.

Y aquí se obra la magia: todos los resultados aparecen en menos de un segundo y las estadísticas nos dicen que casi el 70% de los usuarios halla lo que buscaba entre las 40 primeras webs.

Compartir

  • Eskup
  • Tuenti
  • Meneame
  • Bitacoras
  • iGoogle
  • My Yahoo
  • My Live

Escribe tu comentario


Si prefieres firmar con tu avatar, haz login
Inserta un emoticono

Sobre este blog

Avatar de Gaizka Manero López

La Caverna Cibernética

Esta bitácora digital nace tras un viaje a Nueva York con mi esposa Arantxa en el verano de 2010. Tras visitar la capital del mundo vimos que, en muchos otros lugares, la tecnología es una parte absolutamente indispensable de la vida cotidiana.

Es por ello que, a partir de ahora, intentaremos descubrir juntos como la ciencia y sus avances nos hacen la vida más fácil.

ver perfil »

Tags

Amigos

  • Jordi Torre

Fans

  • Tucho Novoa
  • JRC.
  • Emilio Fuentes Romero
  • evelio47
  • ivette-duran
  • presunta
  • teo-tango
  • Loli
  • Carlos M
  • aphelp
  • techconsumer
  • Germán
  • patricio simó gisbert
  • Jose Antonio Suarez Lopez

Ídolos

  • wlafactoria

Suscríbete

Selecciona el agregador que utilices para suscribirte a este blog (también puedes obtener la URL de los feeds):