Governança
de Dados-Parte VIII-a-Visão europeia sobre Governança de dados:
Essa visão foi obtida através da análise da obra de Steve
Sarsfield, que publicou o primeiro livro
com um título explícito com Data Governance: The Data Governance Imperative,
em 2009, do livro de Enterprise Data Governance, de
Pierre Bonnet e de uma pesquisa francesa sobre qualidade de dados(qualitée
des données), publicada pela PWC-Price Waterhouse Coopers .Os posts serão
divididos em 5 partes(de A a E), para facilitar a publicação
Visão Sarsfield:
Steve Sarsfield é hoje um evangelista de qualidade e de
governança de dados que trabalha na Talend, empresa de software open source que oferece serviços e produtos de gerência e integração de dados. Originada na
França(Suresnes), a empresa hoje se espalha pelo mundo com escritórios nos EUA,
Europa e Ásia, inclusive com presença no Brasil.
O livro aborda os seguintes pontos, importantes para o
conhecimento e a aproximação com os conceitos de GD, que discutiremos abaixo:
a)A necessidade de se ter Governança de dados
Nesse capítulo são abordados os mesmos fatores já plenamente
conhecidos sobre a necessidade de se estabelecer a GD, indo da obrigatoriedade
de maior qualidade de dados para
melhoria de tomada de decisões, passando por aspectos de riscos, associados a
regulações da indústria (Basel-II, Sox,etc) e chegando a patamares de
maturidade de dados de onde as empresas deverão se aproximar. O autor fala
sobre alguns pecados de dados cometidos por empresas, principalmente na esfera
de crescimentos através de aquisições e fusões, onde dados de empresas adquiridas são simplesmente agregados aos
dados das empresas adquirentes, criando um mosaico complexo de redundância
descontrolada sobre informações de possíveis clientes, fornecedores, e outros objetos
comuns. Assim nascem os silos de dados, conceito aplicado aos depósitos isolados
de dados, usados por unidades organizacionais diferentes. Esses pecados são
materializados através de falta de padronização entre essas unidades, visto
estarem usando dados de fontes diferentes, baseadas em tecnologias diferentes,
com eventuais metadados diferentes e às vezes em línguas diferentes. Com o
aparecimento dos problemas, as unidades partem para soluções também particulares,
sem uma visão que articule os mesmos conceitos do ponto de vista organizacional,
pecando pela falta de orquestração entre as partes. Nesses cenários, soluções apressadas de BI aparecem como
elemento de salvação, transferindo para as camadas de ETC, toda a
responsabilidade de processos de qualidade que deveriam ter sido aplicados no
nascedouro dos dados já no fluxo de seus processos associados.
b)A definição de Governança de dados
A definição de GD pode variar de pontos de vistas diferentes
dentro da empresa. Na realidade, a definição vem mesmo, segundo Sarsfield, da
expectativa que as áreas têm do que venha a ser GD. Segundo Sarsfield, a
empresa tende a observar a GD como um elefante no quarto escuro(metáfora
similar à usada pelos autores do livro originado da DGS-Data Governance
Society, cujo título é: The Elephant in the room:Data). Ou
seja, cada um inferirá, pelo toque em parte específica na anatomia do
“proboscídeo”, o que aquilo representa. Quem
tocar no “rabo”, poderá achar que é uma cobra, quem encostar na perna, inferirá
que é uma árvore. No fundo, a metáfora sugere que dependendo da unidade
organizacional, cada uma terá percepções específicas com relação à GD. Para os
CEO´s e outros C*O, podendo ser o asterisco a letra “F”(Finacial),
“M”(Material), “D”(Data), etc haverá a
expectativa de que a GD proveja os dados com os devidos atributos que lhes
permitam tomadas de decisões seguras, além de conforto nos aspectos exigentes
das regulações. Para os usuários de negócios(business users), haverá a
expectativa de que o recheio dos softwares usados nos seus domínios, como CRM,
por exemplo, estejam perfeitos nos seus atributos. Pouco adianta uma poderosa
ferramenta de CRM, como Siebel/Oracle com dados frágeis sobre clientes a habitá-la. Para a equipe de TI, a GD deverá
representar a expectativa de dias melhores no sentido de que os modelos de
dados serão integrados, respeitados e não haverá correria para a duplicação de
bases de dados, visando atender apelos de poderosos. Além disso, no exemplo de
Sarsfield, um modelo de dados com atributos minimamente qualificados, não
permitiria um campo de endereços como Judy
Johnson, 44 Main Street. LDIY, Dedham, Massachussets 02026. O que há de
estranho no exemplo? Simplesmente as letras LDIY acopladas ao
endereço, para designar “ large dogs in yard”, ou seja
avisando que há cachorro grande no jardim.....Definitivamente o campo de dados do endereço não tem como função colateral
criar sinalização de perigo para entregadores...Francamente...A venda da GD
pelos seus benefícios deve passar pela minimização de efeitos adversos
produzidos por dados de má qualidade. Os exemplos são clássicos, grande parte
oriundo da área de CRM, como a perda de clientes pelo envio do “junk email”, ou
seja o excesso de comunicação desagradável; os problemas de envio de produtos
comprados devido aos dados pouco controlados no nível de estoque que acabam resultando
em tempos de entregas maiores do que o contratado e a impossibilidade de se
gerenciar diversas pessoas num só mapeamento de comunicação, abrindo a porta
para espertalhões que criam ligeiras variações em nomes/e-mails, a fim de
dissimular como sendo pessoas diferentes, quando na realidade não são. Além
disso, cita Sarsfield, uma empresa poderia concorrer com outra que no fundo
seria uma divisão dela mesmo num outro país, devido à falta de integração de
dados e de processos. Outro benefício tangível da GD é uma forte aproximação da
área de TI com a de negócios, visto que a GD somente alçará voo consistente
caso esse matrimônio se concretize. A capacidade de materializar o casamento das
informações necessárias ao negócio(business) com os dados que poderão
provê-la(TI) é um dos grandes objetivos da GD. No fundo, o que Sarsfield aponta
nesse tópico é o mesmo rosário de vantagens
da GD que conhecemos de cor. O problema é como implementá-la com efetividade, e sucesso, conforme
discutido abaixo.
c)Os fatores de sucesso na implementação da GD
Sarsfield divide os FCS em duas categorias: os fatores
genéricos e específicos.
Os Fatores de sucesso genéricos são, segundo ele:
1)Consertar os problemas de dados
A proposta de Sarsfield vem ao encontro de muitas outras que
advogam o início de tudo através de um ressonante impacto produzido por um
levantamento sobre a qualidade dos dados. A exposição da real situação dos
grandes cadastros de dados mestres e referenciais pode ser elemento de profunda
sensibilização na “venda” da GD. Isso pode ser feito, como já discutimos,
através de um projeto de data profiling, que traga a realidade “fotográfica” e mensurada sobre os dados da empresa. O TDQM,
processo do MIT tem uma ampla descrição de alternativas de profiling, inclusive
através de pesquisa qualitativa, em contraponto ao levantamento quantitativo.
Hoje os grandes provedores de soluções de dados, como IBM por exemplo, já
oferecem camadas para análise e”profiling” de dados.
2)Desenvolver um processo repetido(repeatable)
Essa proposição de Sarsfield também é coerente com a
implementação de processos de qualquer natureza. O CMMI e o MPS.BR, modelos
para implementação de processos de melhoria de software, trilham níveis
gradativos de maturidade, buscando a criação de processos que possam ser
aplicados independentemente de pessoas e do tempo. Um programa de GD deve ser
composto de vários projetos que deverão seguir processos aprovados e bem
documentados. Por exemplo, dados de coleta de clientes vindo dos
diferentes pontos de contato da empresa,
deverão seguir um processo de unificação, limpeza, consolidação,etc capaz de
ser repetido em ciclos subsequentes. Um ponto importante e corroborado por
Sarsfield é que a GD deve observar o
todo mas começar pequena. Projetos agigantados são fortes candidatos ao
fracasso e uma boa alternativa é fazer da GD, depois de amadurecida e escrita,
uma receita que seja parte ativa de todos os projetos da empresa.
3)Gerenciar as alterações
A ideia aqui é mostrar que as empresas são dinâmicas, mudam
constantemente, via crescimento, fusões, partições, sendo por vezes alcançadas
por novas regras e regulamentações e que a GD deve estar pronta para ser também
rápida no gatilho. De que forma? Por exemplo, oferecendo processos estáveis e
repetíveis, como visto acima, e mantendo a empresa ciente de possíveis
alterações nos processos de dados. Em suma, ter um processo que possa assimilar
mudanças na ecologia empresarial.
4)Coordenar esforços com a área de negócios
Um dos fatores fundamentais é que o processo de GD seja
coordenado a quatro mãos com as iniciativas de negócios. Entender que o poder
dos dados somente pode ser efetivamente aferido pelos usuários que os utilizam
como combustível nos processos de negócios é fundamental. A área de TI tem
melhorado essa percepção de parceria, mas em muitos casos, ainda se firma nos
conceitos do velho e indivisível CPD...
5)Definir os conceitos de propriedades de dados (data
ownership)
Essa talvez seja, das implementações
operacionais, a mais desafiadora. Definir claramente as propriedades de dados ,
separando o âmbito departamental e o organizacional. Definir o que deve ser
controlado no contexto da GD, e com qual
nível. Normalmente as proposições estruturais de GD passam por um Comitê de
alto nível, composto de executivos de áreas estratégicas, que além de ter o
poder de observadores e reguladores, decide questões críticas não resolvidas em
instâncias inferiores. Embaixo, coloca-se uma estrutura tática/operacional que
seria como um DMO, um escritório de dados, ou algo como um CDO(Chief Data
Officer) que faria a definição e o acompanhamento dos processos, regras,
políticas aprovadas pelo Comitê e praticadas pelas áreas de negócios da
empresa. Depois teríamos uma 3ª camada, composta pelos data stewardship, que
seriam os gestores de dados num nível de negócios, e , logicamente localizados
nas unidades organizacionais. Complementando, teríamos os data custodians, ou
os mantenedores de dados, mais próximos do ambiente físico e localizados na TI.
Essa é uma das muitas possíveis e sugeridas estruturações de GD e cada
conformação vai depender da empresa, do seu apoio e da sua cultura para
processos e controles. O fator de sucesso específico apresentado é tão óbvio,
quanto difícil de ser obtido:prover medidas de ROI(retorno) sobre as ações de GD. Se nenhum desses pontos acima mencionados forem suficientes para justificar a adoção de Governança de Dados, outros mais específicos deverão ser procurados na empresa. Mas não se iluda, que esses estarão muito próximos.Continua no próximo post
Nenhum comentário:
Postar um comentário