Total de visualizações de página

segunda-feira, 3 de outubro de 2011

BI2-Big Data-Parte IV- Data Scientists


No relatório da McKinsey, apresentado anteriormente, apareceram dois números, dentre os muitos que observei, que me atiçaram a curiosidade: Num futuro próximo, o mercado americano demandará a figura de cientista de dados(data scientists), na ordem de 190.000 postos de trabalhos e também 1.500.000 gerentes com alta percepção e conhecimento sobre dados. O conceito de gerente com sensibilidade e conhecimento para dados é uma decorrência natural do espessamento da importância dos dados, no contexto da empresa, visto como um ativo fundamental para os dias de hoje. O conceito de cientista de dados, por seu lado, já havia aparecido numa reportagem que apontava como a segunda profissão mais importante dos próximos anos. A referência foi
e publica o artigo “ The 6 hottest new Jobs in IT”,  escrito por Robert Strohmeyer , e publicado na Infoworld, de 14/06/2011.  O conceito de data scientist ficou em segundo lugar no ranking das mais quentes e novas profissões de TI. Sim, e daí?. Atrás de Arquiteto de negócios, posicionado em primeiro, os cientistas de dados ganham projeção pela necessidade de se domar as montanhas de dados produzidas e onde podem se esconder “pepitas” importantes de informação sobre opiniões, reputação de produtos, qualidade de serviços, etc. Os cientistas de dados deverão estar preparados para alinhavar projetos, mapeando as necessidades específicas de negócios com modelos de dados que deverão ser identificados, recuperados, analisados e visualizados. Nessas montanhas de dados, o cientista de dados (data scientist) deverá tentar descobrir padrões escondidos de comportamento, atitude de clientes, prospects, parceiros, etc , através da aplicação de algoritmos estatísticos de mining, análise preditiva, simulações, etc. O cientista de dados terá uma arsenal de ferramentas à sua disposição, como linguagem R, específica para tratamento integrado de cálculos e gráficos, softwares como SPSS(IBM), ou SAS, ou Greenplum(EMC2), dentre outros . O perfil de um cientista de dados envolve conhecimentos de dados, programação para captura e seleção de dados, limpeza e preparo de dados e aplicações estatísticas e preditivas sobre eles,podendo ser considerado um perfil 2012  do que eram os mineradores de dados ou “data miners” da época de nascimento do BI. Envolverá o conhecimento de estatística,  mining, algoritmos de “machine learning”, algoritmos de simulações, SGBD e técnicas e ferramentas de visualização.  Data Mining, de maneira geral é a ciência mãe de todas essas derivações e  pode ser definida como técnicas que buscam a identificação de relacionamentos desconhecidos que possam produzir resultados positivos e verificáveis, através da aplicação de modelos preditivos, quando aplicados em novos dados.
Outra figura também é eloqüente com relação ao crescimento do novo papel dos “data scientists”. A referência  http://www.indeed.com/jobtrends/Data-Scientist.html,  mostra uma figura que enfatiza o crescimento potencial dessa nova profissão, pesquisado em “posts” que falam sobre tendências de  profissões.
Recursos humanos em Big data:
Com a percepção de que esses profissionais não estão prontos e disponíveis, nas quantidades que serão demandadas, as empresas estão atuando junto às universidades americanas no sentido de criarem especializações, via cursos de MBA. Algumas universidades americanas , hoje, já oferecem cursos com foco nesses segmentos. Elas  tem adicionado  treinamentos “certificados” e cursos de “Masters”, visando o preenchimento da demanda para esses profissionais. As universidade de Stanford e a  Central do Estado de Connecticut estão entre as que já oferecem cursos nessa direção. A Universidade do Tennessee, em  Knoxville, também  acabou de anunciar um curso em “Analytics Masters” combinado com um MBA, engrossando a lista que será, cada vez mais, crescente.  A universidade de Northwestern também oferece curso de “Masters”  em Análise Preditiva, conforme o link a seguir: 

Veja  a lista completa de cursos focados em análise preditiva, mining etc que estão explodindo nos USA e Canadá, em função do crescimento do fenômeno Big data.

http://www.kdnuggets.com/education/usa-canada.html 

Um recente evento , chamado Data Scientist Summit-2011, foi patrocinado pela Greenplum(EMC2), empresa especializada em tratamento de grandes volumes de dados através do framework Apache-Hadoop. Esse “summit”, contém várias palestras disponíveis e oferece uma boa visão do que estão falando sobre essa nova figura dos  “data scientists”, fundamentais para os tempos do Big data, ou a era dos zettabytes. Uma olhada nas palestras ajuda a entender melhor esse novo conceito de “data scientists”. Vale a pena, passe lá :  http://www.greenplum.com/community/data-scientists/ 

Referências:  Veja o endereço www.kdnuggets.com, site especializado em mining, que oferece um conteúdo muito interessante sobre o assunto.

Nenhum comentário:

Postar um comentário