Nesse
conjunto de posts a seguir analisaremos as diferentes correntes ou escolas de
Governança de Dados existentes no mercado. O conceito de Governança de Dados é
muito amplo, já começa a sofrer mutações e extensões no nome (Governança de
Informações, Gestão de dados,etc) e portanto pode ser analisada sob diversos
focos, não havendo necessariamente uma verdade única a respeito do assunto. São
proposições variadas, algumas centradas no viés de ferramentas vendidas pelos
autores, outras focadas nos conceitos de qualidade de dados como cerne das
propostas e feitas por luminares da área de Data Quality, outras baseadas em
experiências puras de profissionais em implementações bem sucedidas na área.
Também o conjunto conceitual do DMBOK (Corpo de conhecimento de Gerência de
dados), da Dama-Data Management Association será analisado, como uma organização
sem vínculos com produtos e com um amplo guarda-chuva conceitual contendo os ingredientes fundamentais da Governança
de Dados, porém numa extensão além dos preceitos inicialmente pensados.
Analisaremos algumas proposições de Governança de dados e
correlatos, incluindo posicionamentos e visões próprias consolidadas pelos anos de
experiência no trato dos dados e de informações. Algumas das “escolas” que discutiremos:
a)Escola IBM;
b)Framework e proposições
da DAMA-Data Management Association;
c)Framework de Gwen Thomas, fundadora do DGI-Data Governance Institute;
c)Framework de Gwen Thomas, fundadora do DGI-Data Governance Institute;
d)Framework e visão de Steven Strout e de John Eisenhauer,
extraída do livro The Elephant in the room:Data e membros do Data Governance
Society;
e)Framework de Mike Cochrane-5 Passos para a Governança de
Dados
f)Uma visão europeia sobre Governança de dados através de
Pierre Bonnet, com o livro Enterprise Data Governance , Steve Sarsfield, que
publicou o primeiro livro com um título
explícito com Data Governance: The Data Governance Imperative e uma
pesquisa francesa sobre qualidade de dados(qualitée des données), publicada
pela PWC-Price Waterhouse Coopers
Esse trabalho que
começamos agora não objetivou somente a
tradução direta dos textos originais, mas principalmente uma visão analítica de
observações, comentários e extensões dentro do espectro amplo da GD
desenvolvida pelo autor, procurando a coleta de um conjunto realista de
melhores práticas em GD aplicada nos dias de hoje.
IBM:
O processo
de governança de dados(informações) da IBM está centrado no trabalho iniciado
pela empresa em 2004, através de Steve Adler, com a criação do Data Governance
Council. A ideia foi criar um conselho reunindo líderes de GD, líderes em
Information Governance, CDO(Chief Data Officers), arquitetos corporativos e
CSO(Chief Security Officers) visando debater e discutir formas efetivas das
empresas governarem os seus dados como se fora uma ativo empresarial. Esse
trabalho deu origem, por desdobramentos variados, a algumas publicações disponíveis, como:
a)Corporate Data Governance Best
Practices - 2006-2007. Scorecards for
Data Governance in the Global 5000 companies;
b)The IBM
Data Governance Council Maturity Model: Building a roadmap for effective Data Governance-October-2007;
c)The IBM
Data Governance Unified Process, livro de Sunil Soares, editado em 2010, pela
MC Press OnLine;
d)Selling Information Governance to the Business-Best
practices by industry and job function, livro de Sunil Soares, publicado na
forma de ebook, em 2011.
Framework de Governança de Dados –
IBM
A
IBM define um framework de GD, conforme a figura 3.1 abaixo. Os elementos que
compõem a sua proposta são:
Resultados:
Nesse contexto, a IBM propõe duas grandes ações: a primeira foca nos riscos apresentados pelos dados com relação aos aspectos de qualidade, com impactos sobre a reputação corporativa, e aos aspectos de aderência a normas internacionais. Os riscos deverão ser identificados, qualificados, quantificados e depois analisados para definir mecanismos de mitigação, contingência, aceitação ou transferência. Além disso, nesse mesmo contexto de resultados (outcomes), a IBM aponta a necessidade de valoração dos ativos de informação, ou seja, um processo de aculturamento corporativo que reflita sobre os valores dessa nova camada de ativos (ativos de informação), ainda hoje com uma formalização relativamente incipiente.
Nesse contexto, a IBM propõe duas grandes ações: a primeira foca nos riscos apresentados pelos dados com relação aos aspectos de qualidade, com impactos sobre a reputação corporativa, e aos aspectos de aderência a normas internacionais. Os riscos deverão ser identificados, qualificados, quantificados e depois analisados para definir mecanismos de mitigação, contingência, aceitação ou transferência. Além disso, nesse mesmo contexto de resultados (outcomes), a IBM aponta a necessidade de valoração dos ativos de informação, ou seja, um processo de aculturamento corporativo que reflita sobre os valores dessa nova camada de ativos (ativos de informação), ainda hoje com uma formalização relativamente incipiente.
Viabilizadores:
No framework apresentado, a IBM aponta elementos que viabilizarão a implantação de um programa de GD (Governança de Dados). A parte mais proeminente mostrada é a conscientização sobre a importância da GD e a definição de uma estrutura organizacional que estabeleça um nível mútuo de responsabilidade entre TI e áreas de negócios, aplicado sobre os dados em diferentes camadas de gerência. Nesse contexto, são destacadas as políticas, que definem direcionamentos estratégicos que apontam o comportamento desejado pela empresa a respeito da forma de atuação dos envolvidos no programa. Também surge como viabilizador o conceito de data stewardship, disciplina de controle de qualidade para garantir um cuidado custodial dos dados visando à sua melhoria e a gerência de riscos envolvidos. O conceito de custódia se aplica no sentido de que os dados, sendo um ativo corporativo e, portanto não pertencentes a ninguém, estarão, ao longo do seu ciclo de vida, sob os cuidados de departamentos, áreas, etc., responsáveis por parte do seu ciclo de vida. Algumas propostas sugerem a combinação de criadores de dados(creators) com proprietários(owners) e outras consideram mais a custódia como elemento de responsabilidade atribuído à área de TI, por seus procedimentos de armazenamento, administração de dados e de bancos de dados . Independentemente da forma estabelecida, essas definições estratificadas de responsabilidade deverão ser exercidas, gerenciadas e auditadas.
No framework apresentado, a IBM aponta elementos que viabilizarão a implantação de um programa de GD (Governança de Dados). A parte mais proeminente mostrada é a conscientização sobre a importância da GD e a definição de uma estrutura organizacional que estabeleça um nível mútuo de responsabilidade entre TI e áreas de negócios, aplicado sobre os dados em diferentes camadas de gerência. Nesse contexto, são destacadas as políticas, que definem direcionamentos estratégicos que apontam o comportamento desejado pela empresa a respeito da forma de atuação dos envolvidos no programa. Também surge como viabilizador o conceito de data stewardship, disciplina de controle de qualidade para garantir um cuidado custodial dos dados visando à sua melhoria e a gerência de riscos envolvidos. O conceito de custódia se aplica no sentido de que os dados, sendo um ativo corporativo e, portanto não pertencentes a ninguém, estarão, ao longo do seu ciclo de vida, sob os cuidados de departamentos, áreas, etc., responsáveis por parte do seu ciclo de vida. Algumas propostas sugerem a combinação de criadores de dados(creators) com proprietários(owners) e outras consideram mais a custódia como elemento de responsabilidade atribuído à área de TI, por seus procedimentos de armazenamento, administração de dados e de bancos de dados . Independentemente da forma estabelecida, essas definições estratificadas de responsabilidade deverão ser exercidas, gerenciadas e auditadas.
Disciplinas centrais:
Nessa parte do framework aparece a Gerência de Qualidade de Dados, composta de processos definidos para medir, melhorar e certificar a qualidade e a integridade dos dados, nos seus diferentes domínios, de produção a teste e arquivos históricos (archival). A essa proposta se associa a Gerência do Ciclo de Vida da informação, com processos definidos para coleta, uso, retenção e eliminação de informações. Essa camada termina com as considerações sobre segurança e privacidade da informação, visando ao controle e à proteção desses ativos, com relação à sua utilização.
Nessa parte do framework aparece a Gerência de Qualidade de Dados, composta de processos definidos para medir, melhorar e certificar a qualidade e a integridade dos dados, nos seus diferentes domínios, de produção a teste e arquivos históricos (archival). A essa proposta se associa a Gerência do Ciclo de Vida da informação, com processos definidos para coleta, uso, retenção e eliminação de informações. Essa camada termina com as considerações sobre segurança e privacidade da informação, visando ao controle e à proteção desses ativos, com relação à sua utilização.
Disciplinas de apoio:
Nesta última camada do framework da IBM aparecem disciplinas de suporte, com ênfase na arquitetura dos dados, objetivando a definição ou documentação de modelos de dados, no âmbito dos dados estruturados ou não estruturados, que visam a garantir o entendimento que facilitará a disponibilidade e distribuição desses ativos. Uma arquitetura de dados e seus modelos não poderão prescindir da definição dos metadados, que representam a semântica dos elementos de informação, regras de negócios e tipos de dados e que fazem a junção entre o conhecimento humano e os processos automatizados. Finalmente o framework se fecha com uma camada na qual serão gerados procedimentos de controle, como auditoria, visando à monitoração do processo e às consequentes ações de ajustes de rumo consideradas necessárias.
Nesta última camada do framework da IBM aparecem disciplinas de suporte, com ênfase na arquitetura dos dados, objetivando a definição ou documentação de modelos de dados, no âmbito dos dados estruturados ou não estruturados, que visam a garantir o entendimento que facilitará a disponibilidade e distribuição desses ativos. Uma arquitetura de dados e seus modelos não poderão prescindir da definição dos metadados, que representam a semântica dos elementos de informação, regras de negócios e tipos de dados e que fazem a junção entre o conhecimento humano e os processos automatizados. Finalmente o framework se fecha com uma camada na qual serão gerados procedimentos de controle, como auditoria, visando à monitoração do processo e às consequentes ações de ajustes de rumo consideradas necessárias.
Como
pode ser percebido pela análise desses frameworks mostrados, alguns elementos
são seminais na formação dos conceitos de GD. A definição de uma estrutura
corporativa formal, composta por elementos de TI e de negócios, de políticas amplas de dados, de projetos de
qualidade de dados, de definição de metadados, de auditorias e de métricas é
fundamental para o estabelecimento das primeiras camadas de GD de uma empresa
que se convenceu de que os ativos de dados e informações não poderão mais ser
vistos como produtos colaterais da execução de processos empresariais. Como
esse processo de GD não se mostra trivial, essas empresas certamente começarão
por implementações e modificações culturais gradativas, alcançando patamares
crescentes de maturidade.
Síntese:
Os
trabalhos sobre Governança de dados e informações da IBM são uma ótima
referência, para se dizer o mínimo, logo de início. O cuidado que o leitor deve
ter é que há um viés definido nos seus “roadmaps” que conduzem para certas ferramentas da Big
Blue, o que é natural considerando a força da empresa no segmento de serviços
hoje e a sua vocação comercial. Isso, entretanto, não diminui o valor das
ideias lá colocadas por Sunil Soares, responsável pelo assunto na Big Blue e
sua equipe de colaboradores, que são mostradas de forma muito clara, com ótima
capacidade de síntese e objetividade, servindo como um base conceitual
espessa para que cada empresa defina o
seu próprio framework de Governança, como sugere o bom senso. Isso é
fundamental na medida em que cada empresa tem suas especificidades que deverão
ser consideradas como fator crítico de sucesso nesse tipo de projeto. Seguir o
didático framework apresentado pela IBM é um ótimo começo para quem deseja
trilhar os caminhos de Governança de Dados, lembrando que as ferramentas podem
ser consideradas acessórios a serem definidos ao seu gosto. Veremos, futuramente, maiores detalhes sobre as proposições de Sunil Soares
Nenhum comentário:
Postar um comentário