Total de visualizações de página

quinta-feira, 29 de dezembro de 2011

Big Data- Parte X- Os Big Data e a cafeína.



Na primeira semana de Novembro, eu retornava  de um jantar com amigos do MPS, quando chegando em casa olhei os “posts” do Twitter. Um deles, contava sobre o caso de uma tentativa de estupro numa Universidade, aqui pertinho de casa, que tinha acabado de acontecer, há não mais do que 2 horas. Naquele evento, na realidade, consumi uma informação  fornecida pelo poder das redes sociais, informação essa que ainda não estava dos domínios do Dr. Google, que, em tese, tudo sabe e tudo informa, ou pelo menos assim deveria. Ou seja, em certas circunstâncias, as redes sociais estão informando antes que o Dr. Google e isso aos olhos atentos de Larry Page e Sergei Brin não é boa coisa. E essa tem sido justamente  uma das preocupações da grande empresa de busca: As informações estão chegando rapidamente à rede, via contatos sociais, mas  demoram um pouco mais para serem pescadas pelos  seus analisadores de páginas web, que vasculham o universo digital. No início do mês de Novembro, a gigante anunciava uma mudança nos seus métodos e algoritmos de buscas, a fim de produzir respostas mais atualizadas. Essa mudança é o reconhecimento pela Google de sua dependência da atualidade da informação e de certa forma, da sombra de ameaça que as redes sociais estão trazendo para cima da maior empresa de informações do planeta. Os resultados de um jogo de futebol, nas tardes de domingo, aparecem muito mais rapidamente no Twitter, FB,etc , com comentários inclusive, e somente depois são pescados pelos “crawlers” do Google. As redes sociais, por seu lado, tem incentivado fortemente  a colocação de informações em tempo real, criando um ambiente com o maior grau possível de atualidade. Bem que a gigante de Mountain View já havia tentado um acordo com o Twitter a fim de analisar em tempo(quase)  real as suas mensagens de 140 toques. O acordo foi definido por um tempo, mas depois as empresas não convergiram em termos de renovação do acerto e o mecanismo do Google foi desabilitado. É claro que  a Google ainda responde por 66% das pesquisas web nos EUA, mas o americano já está se acostumando a buscar nas redes sociais a informação do tipo “break news” que só depois(horas, minutos?) estará nas estruturas de Big Table da Google.   Nesse campo, o Twitter é imbatível com a sua instantaneidade de 140 batidas e oferece um produto colateral interessante: As informações poderão já vir com certa análise, crítica, percepções de  espanto, alegria, frustação,etc . Ou seja, além da informação “ in-natura”, certas considerações de “sentimento”  poderão tecer o seu contexto. Dai o crescimento de “Sentiment Analysis”, que discutiremos depois.  O Google acostumou o seu público a consumir informações com certa latência. Páginas “velhas” com as indicações sobre os restaurantes em NYC, ou a escalação do Vasco no jogo que já aconteceu são a tônica do grande depósito. O Google tem uma média de 500 alterações  no seu algoritmo por ano e esse desafio de buscar mais atualidade está na tela de radar da  grande empresa. A ideia é analisar os termos de buscas colocados na caixa de pesquisa e tentar entender  o grau de “freshness(sem tradução, por favor) daquilo que está por ser mostrado. No último anúncio de melhoria de sua máquina de busca(fevereiro de 2011), a ideia foi aumentar o ranking de páginas “mais interessantes”, a fim de “esconder” as de baixa qualidade de interesse, que insistem em inundar as pesquisas com artigos de menor interesse, porém atreladas a consultas também populares. Isso, garante o Google, melhorará a disponibilização de informações mais atuais. Essas melhorias estão escoradas no novo método de indexação definido pela Google, que tem o sugestivo nome de “Cafeina” (Caffeine), que além de varrer a teia digital de forma mais rápida, também o fará de forma constante, em vez de latência de algumas semanas, como acontecia. Como cafeína é um composto alcalóide que tem a propriedade de manter as pessoas mais acesas e alertas, o algoritmo, pelo menos no nome, faz todo o sentido......    

Nenhum comentário:

Postar um comentário