Google lança novo sistema de indexação
O Google anunciou nesta terça-feira (8/6) o início das operações do Caffeine, seu novo sistema de indexação da web. Com o sistema, os resultados das buscas serão 50% mais atualizados em comparação com a tecnologia anterior, afirma a empresa.
Anunciado em agosto de 2009, o sistema foi disponibilizado inicialmente em caráter de teste – fase que terminou em novembro do ano passado.
Em seu blog, a empresa explica por que investiu em um novo sistema de indexação. “O conteúdo na web está explodindo”, conta a engenheira de software Carrie Grimes. “E cresce não apenas em tamanho e números mas com o advento de vídeo, imagens, notícias e atualizações de tempo real.”
“Além disso, a expectativa das pessoas por resultados de busca é cada vez mais alto. Quem faz a pesquisa espera encontrar os conteúdos relevantes mais recentes, e quem publica espera ser encontrado instantaneamente, logo após a publicação”, diz Grimes.
A Google conta que, com o velho sistema de indexação baseado em camadas, alguns índices eram atualizados mais lentamente que outros, dependendo de sua posição nas camadas. “A camada principal poderia ser atualizada a cada duas semanas”, explica.
O sistema Caffeine analisa a web em “pequenos pedaços” e atualiza o índice de busca de forma contínua, globalmente. “Quando encontramos novas páginas, ou novas informações em páginas existentes, podemos inseri-las diretamente no índice”, conta a engenheira. Como resultado, os resultados de buscas tornam-se mais frescos.
A cada segundo, explica a empresa, o sistema de indexação do Caffeine processa “centenas de milhares de páginas em paralelo”. O Caffeine ocupa um banco de dados com cerca de 100 milhões de gigabytes, e acrescenta novas informações a uma taxa de “centenas de milhares de gigabytes por dia”.
“Nós construímos o Caffeine com o futuro em mente”, explica a engenheira. “Ele não é apenas mais atualizado; é uma fundação robusta que torna possível, para nós, construir um motor de busca mais rápido e abrangente, que acompanha o crescimento do volume de informação online.”
Categoria: Lançamentos, Notícias