Big Data- Parte X- Os Big Data e a cafeína.
Na primeira semana de Novembro, eu
retornava de um jantar com amigos do
MPS, quando chegando em casa olhei os “posts” do Twitter. Um deles, contava
sobre o caso de uma tentativa de estupro numa Universidade, aqui pertinho de
casa, que tinha acabado de acontecer, há não mais do que 2 horas. Naquele
evento, na realidade, consumi uma informação fornecida pelo poder das redes sociais,
informação essa que ainda não estava dos domínios do Dr. Google, que, em tese,
tudo sabe e tudo informa, ou pelo menos assim deveria. Ou seja, em certas
circunstâncias, as redes sociais estão informando antes que o Dr. Google e isso
aos olhos atentos de Larry Page e Sergei Brin não é boa coisa. E essa tem sido
justamente uma das preocupações da
grande empresa de busca: As informações estão chegando rapidamente à rede, via
contatos sociais, mas demoram um pouco
mais para serem pescadas pelos seus analisadores
de páginas web, que vasculham o universo digital. No início do mês de Novembro,
a gigante anunciava uma mudança nos seus métodos e algoritmos de buscas, a fim
de produzir respostas mais atualizadas. Essa mudança é o reconhecimento pela
Google de sua dependência da atualidade da informação e de certa forma, da
sombra de ameaça que as redes sociais estão trazendo para cima da maior empresa
de informações do planeta. Os resultados de um jogo de futebol, nas tardes de
domingo, aparecem muito mais rapidamente no Twitter, FB,etc , com comentários
inclusive, e somente depois são pescados pelos “crawlers” do Google. As redes
sociais, por seu lado, tem incentivado fortemente a colocação de informações em tempo real, criando
um ambiente com o maior grau possível de atualidade. Bem que a gigante de
Mountain View já havia tentado um acordo com o Twitter a fim de analisar em
tempo(quase) real as suas mensagens de
140 toques. O acordo foi definido por um tempo, mas depois as empresas não
convergiram em termos de renovação do acerto e o mecanismo do Google foi
desabilitado. É claro que a Google ainda
responde por 66% das pesquisas web nos EUA, mas o americano já está se
acostumando a buscar nas redes sociais a informação do tipo “break news” que só
depois(horas, minutos?) estará nas estruturas de Big Table da Google. Nesse campo, o Twitter é imbatível com a sua
instantaneidade de 140 batidas e oferece um produto colateral interessante: As
informações poderão já vir com certa análise, crítica, percepções de espanto, alegria, frustação,etc . Ou seja,
além da informação “ in-natura”, certas considerações de “sentimento” poderão tecer o seu contexto. Dai o
crescimento de “Sentiment Analysis”, que discutiremos depois. O Google acostumou o seu público a consumir
informações com certa latência. Páginas “velhas” com as indicações sobre os
restaurantes em NYC, ou a escalação do Vasco no jogo que já aconteceu são a
tônica do grande depósito. O Google tem uma média de 500 alterações no seu algoritmo por ano e esse desafio de
buscar mais atualidade está na tela de radar da grande empresa. A ideia é analisar os termos
de buscas colocados na caixa de pesquisa e tentar entender o grau de “freshness(sem tradução, por favor)
daquilo que está por ser mostrado. No último anúncio de melhoria de sua máquina
de busca(fevereiro de 2011), a ideia foi aumentar o ranking de páginas “mais
interessantes”, a fim de “esconder” as de baixa qualidade de interesse, que
insistem em inundar as pesquisas com artigos de menor interesse, porém
atreladas a consultas também populares. Isso, garante o Google, melhorará a
disponibilização de informações mais atuais. Essas melhorias estão escoradas no
novo método de indexação definido pela Google, que tem o sugestivo nome de
“Cafeina” (Caffeine), que além de varrer a teia digital de forma mais rápida,
também o fará de forma constante, em vez de latência de algumas semanas, como
acontecia. Como cafeína é um composto alcalóide que tem a propriedade de manter
as pessoas mais acesas e alertas, o algoritmo, pelo menos no nome, faz todo o
sentido......
Nenhum comentário:
Postar um comentário