Total de visualizações de página

sábado, 2 de junho de 2012

Governança de Dados-Parte VIII-a-Visão europeia sobre Governança de dados:


Governança de Dados-Parte VIII-a-Visão europeia sobre Governança de dados:  

Essa visão foi obtida através da análise da obra de Steve Sarsfield, que publicou o primeiro livro  com um título explícito com Data Governance: The Data Governance Imperative, em 2009, do livro de Enterprise Data Governance, de Pierre Bonnet e de uma pesquisa francesa sobre qualidade de dados(qualitée des données), publicada pela PWC-Price Waterhouse Coopers .Os posts serão divididos em 5 partes(de A a E), para facilitar a publicação

Visão Sarsfield:
Steve Sarsfield é hoje um evangelista de qualidade e de governança de dados que trabalha na Talend, empresa de software open source  que oferece serviços e produtos de  gerência e integração de dados. Originada na França(Suresnes), a empresa hoje se espalha pelo mundo com escritórios nos EUA, Europa e Ásia, inclusive com presença no Brasil.
O livro aborda os seguintes pontos, importantes para o conhecimento e a aproximação com os conceitos de GD, que discutiremos abaixo:

a)A necessidade de se ter Governança de dados
Nesse capítulo são abordados os mesmos fatores já plenamente conhecidos sobre a necessidade de se estabelecer a GD, indo da obrigatoriedade de maior qualidade de dados  para melhoria de tomada de decisões, passando por aspectos de riscos, associados a regulações da indústria (Basel-II, Sox,etc) e chegando a patamares de maturidade de dados de onde as empresas deverão se aproximar. O autor fala sobre alguns pecados de dados cometidos por empresas, principalmente na esfera de crescimentos através de aquisições e fusões, onde dados de empresas  adquiridas são simplesmente agregados aos dados das empresas adquirentes, criando um mosaico complexo de redundância descontrolada sobre informações de possíveis clientes, fornecedores, e outros objetos comuns. Assim nascem os silos de dados, conceito aplicado aos depósitos isolados de dados, usados por unidades organizacionais diferentes. Esses pecados são materializados através de falta de padronização entre essas unidades, visto estarem usando dados de fontes diferentes, baseadas em tecnologias diferentes, com eventuais metadados diferentes e às vezes em línguas diferentes. Com o aparecimento dos problemas, as unidades partem para soluções também particulares, sem uma visão que articule os mesmos conceitos do ponto de vista organizacional, pecando pela falta de orquestração entre as partes. Nesses cenários,  soluções apressadas de BI aparecem como elemento de salvação, transferindo para as camadas de ETC, toda a responsabilidade de processos de qualidade que deveriam ter sido aplicados no nascedouro dos dados já no fluxo de seus processos associados.

b)A definição de Governança de dados
A definição de GD pode variar de pontos de vistas diferentes dentro da empresa. Na realidade, a definição vem mesmo, segundo Sarsfield, da expectativa que as áreas têm do que venha a ser GD. Segundo Sarsfield, a empresa tende a observar a GD como um elefante no quarto escuro(metáfora similar à usada pelos autores do livro originado da DGS-Data Governance Society, cujo título é: The Elephant in the room:Data). Ou seja, cada um inferirá, pelo toque em parte específica na anatomia do “proboscídeo”, o que aquilo representa.  Quem tocar no “rabo”, poderá achar que é uma cobra, quem encostar na perna, inferirá que é uma árvore. No fundo, a metáfora sugere que dependendo da unidade organizacional, cada uma terá percepções específicas com relação à GD. Para os CEO´s e outros C*O, podendo ser o asterisco a letra “F”(Finacial), “M”(Material),  “D”(Data), etc haverá a expectativa de que a GD proveja os dados com os devidos atributos que lhes permitam tomadas de decisões seguras, além de conforto nos aspectos exigentes das regulações. Para os usuários de negócios(business users), haverá a expectativa de que o recheio dos softwares usados nos seus domínios, como CRM, por exemplo, estejam perfeitos nos seus atributos. Pouco adianta uma poderosa ferramenta de CRM, como Siebel/Oracle com dados frágeis sobre clientes  a habitá-la. Para a equipe de TI, a GD deverá representar a expectativa de dias melhores no sentido de que os modelos de dados serão integrados, respeitados e não haverá correria para a duplicação de bases de dados, visando atender apelos de poderosos. Além disso, no exemplo de Sarsfield, um modelo de dados com atributos minimamente qualificados, não permitiria um campo de endereços como  Judy Johnson, 44 Main Street. LDIY, Dedham, Massachussets 02026. O que há de estranho no exemplo? Simplesmente as letras LDIY acopladas ao endereço, para designar “ large dogs in yard”, ou seja avisando que há cachorro grande no jardim.....Definitivamente o campo de dados  do endereço não tem como função colateral criar sinalização de perigo para entregadores...Francamente...A venda da GD pelos seus benefícios deve passar pela minimização de efeitos adversos produzidos por dados de má qualidade. Os exemplos são clássicos, grande parte oriundo da área de CRM, como a perda de clientes pelo envio do “junk email”, ou seja o excesso de comunicação desagradável; os problemas de envio de produtos comprados devido aos dados pouco controlados no nível de estoque que acabam resultando em tempos de entregas maiores do que o contratado e a impossibilidade de se gerenciar diversas pessoas num só mapeamento de comunicação, abrindo a porta para espertalhões que criam ligeiras variações em nomes/e-mails, a fim de dissimular como sendo pessoas diferentes, quando na realidade não são. Além disso, cita Sarsfield, uma empresa poderia concorrer com outra que no fundo seria uma divisão dela mesmo num outro país, devido à falta de integração de dados e de processos. Outro benefício tangível da GD é uma forte aproximação da área de TI com a de negócios, visto que a GD somente alçará voo consistente caso esse matrimônio se concretize. A capacidade de materializar o casamento das informações necessárias ao negócio(business) com os dados que poderão provê-la(TI) é um dos grandes objetivos da GD. No fundo, o que Sarsfield aponta nesse tópico é o mesmo rosário de vantagens  da GD que conhecemos de cor. O problema é como  implementá-la com efetividade, e sucesso, conforme discutido abaixo. 

c)Os fatores de sucesso na implementação da GD
Sarsfield divide os FCS em duas categorias: os fatores genéricos e específicos.
Os Fatores de sucesso genéricos são, segundo ele:

1)Consertar os problemas de dados
A proposta de Sarsfield vem ao encontro de muitas outras que advogam o início de tudo através de um ressonante impacto produzido por um levantamento sobre a qualidade dos dados. A exposição da real situação dos grandes cadastros de dados mestres e referenciais pode ser elemento de profunda sensibilização na “venda” da GD. Isso pode ser feito, como já discutimos, através de um projeto de data profiling, que traga a realidade “fotográfica”  e mensurada sobre os dados da empresa. O TDQM, processo do MIT tem uma ampla descrição de alternativas de profiling, inclusive através de pesquisa qualitativa, em contraponto ao levantamento quantitativo. Hoje os grandes provedores de soluções de dados, como IBM por exemplo, já oferecem camadas para análise e”profiling” de dados.

2)Desenvolver um processo repetido(repeatable)
Essa proposição de Sarsfield também é coerente com a implementação de processos de qualquer natureza. O CMMI e o MPS.BR, modelos para implementação de processos de melhoria de software, trilham níveis gradativos de maturidade, buscando a criação de processos que possam ser aplicados independentemente de pessoas e do tempo. Um programa de GD deve ser composto de vários projetos que deverão seguir processos aprovados e bem documentados. Por exemplo, dados de coleta de clientes vindo dos diferentes  pontos de contato da empresa, deverão seguir um processo de unificação, limpeza, consolidação,etc capaz de ser repetido em ciclos subsequentes. Um ponto importante e corroborado por Sarsfield é que  a GD deve observar o todo mas começar pequena. Projetos agigantados são fortes candidatos ao fracasso e uma boa alternativa é fazer da GD, depois de amadurecida e escrita, uma receita que seja parte ativa de todos os projetos da empresa.

3)Gerenciar as alterações
A ideia aqui é mostrar que as empresas são dinâmicas, mudam constantemente, via crescimento, fusões, partições, sendo por vezes alcançadas por novas regras e regulamentações e que a GD deve estar pronta para ser também rápida no gatilho. De que forma? Por exemplo, oferecendo processos estáveis e repetíveis, como visto acima, e mantendo a empresa ciente de possíveis alterações nos processos de dados. Em suma, ter um processo que possa assimilar mudanças na ecologia empresarial.

4)Coordenar esforços com a área de negócios
Um dos fatores fundamentais é que o processo de GD seja coordenado a quatro mãos com as iniciativas de negócios. Entender que o poder dos dados somente pode ser efetivamente aferido pelos usuários que os utilizam como combustível nos processos de negócios é fundamental. A área de TI tem melhorado essa percepção de parceria, mas em muitos casos, ainda se firma nos conceitos do velho e indivisível CPD...

5)Definir os conceitos de propriedades de dados (data ownership)
Essa talvez seja, das implementações operacionais, a mais desafiadora. Definir claramente as propriedades de dados , separando o âmbito departamental e o organizacional. Definir o que deve ser controlado no contexto da GD,  e com qual nível. Normalmente as proposições estruturais de GD passam por um Comitê de alto nível, composto de executivos de áreas estratégicas, que além de ter o poder de observadores e reguladores, decide questões críticas não resolvidas em instâncias inferiores. Embaixo, coloca-se uma estrutura tática/operacional que seria como um DMO, um escritório de dados, ou algo como um CDO(Chief Data Officer) que faria a definição e o acompanhamento dos processos, regras, políticas aprovadas pelo Comitê e praticadas pelas áreas de negócios da empresa. Depois teríamos uma 3ª camada, composta pelos data stewardship, que seriam os gestores de dados num nível de negócios, e , logicamente localizados nas unidades organizacionais. Complementando, teríamos os data custodians, ou os mantenedores de dados, mais próximos do ambiente físico e localizados na TI. Essa é uma das muitas possíveis e sugeridas estruturações de GD e cada conformação vai depender da empresa, do seu apoio e da sua cultura para processos e controles. O fator de sucesso específico apresentado é tão óbvio, quanto difícil de ser obtido:prover medidas de ROI(retorno) sobre as ações de GD. Se nenhum desses pontos acima mencionados forem suficientes para justificar a adoção de Governança de Dados, outros mais específicos deverão ser procurados na empresa. Mas não se iluda,  que esses estarão muito próximos.


Continua no próximo post

Nenhum comentário:

Postar um comentário