Total de visualizações de página

domingo, 4 de março de 2012

Governança de Dados-Parte-III-IBM



Nesse conjunto de posts a seguir analisaremos as diferentes correntes ou escolas de Governança de Dados existentes no mercado. O conceito de Governança de Dados é muito amplo, já começa a sofrer mutações e extensões no nome (Governança de Informações, Gestão de dados,etc) e portanto pode ser analisada sob diversos focos, não havendo necessariamente uma verdade única a respeito do assunto. São proposições variadas, algumas centradas no viés de ferramentas vendidas pelos autores, outras focadas nos conceitos de qualidade de dados como cerne das propostas e feitas por luminares da área de Data Quality, outras baseadas em experiências puras de profissionais em implementações bem sucedidas na área. Também o conjunto conceitual do DMBOK (Corpo de conhecimento de Gerência de dados), da Dama-Data Management Association será analisado, como uma organização sem vínculos com produtos e com um amplo guarda-chuva conceitual  contendo os ingredientes fundamentais da Governança de Dados, porém numa extensão além dos preceitos inicialmente pensados.
Analisaremos algumas proposições de Governança de dados e correlatos, incluindo posicionamentos e visões  próprias consolidadas pelos anos de experiência no trato dos dados e de informações. Algumas das “escolas” que discutiremos:
a)Escola IBM;
b)Framework  e proposições da DAMA-Data Management Association;
c)Framework de Gwen Thomas,  fundadora do  DGI-Data Governance Institute;
d)Framework e visão de Steven Strout e de John Eisenhauer, extraída do livro The Elephant in the room:Data e membros do Data Governance Society;
e)Framework de Mike Cochrane-5 Passos para a Governança de Dados
f)Uma visão europeia sobre Governança de dados através de Pierre Bonnet, com o livro Enterprise Data Governance , Steve Sarsfield, que publicou o primeiro livro  com um título explícito com Data Governance: The Data Governance Imperative e uma pesquisa francesa sobre qualidade de dados(qualitée des données), publicada pela PWC-Price Waterhouse Coopers
Esse  trabalho que começamos agora não objetivou  somente a tradução direta dos textos originais, mas principalmente uma visão analítica de observações, comentários e extensões dentro do espectro amplo da GD desenvolvida pelo autor, procurando a coleta de um conjunto realista de melhores práticas em GD aplicada nos dias de hoje.



IBM:
O processo de governança de dados(informações) da IBM está centrado no trabalho iniciado pela empresa em 2004, através de Steve Adler, com a criação do Data Governance Council. A ideia foi criar um conselho reunindo líderes de GD, líderes em Information Governance, CDO(Chief Data Officers), arquitetos corporativos e CSO(Chief Security Officers) visando debater e discutir formas efetivas das empresas governarem os seus dados como se fora uma ativo empresarial. Esse trabalho deu origem, por desdobramentos variados,  a algumas publicações disponíveis, como:
a)Corporate Data Governance Best Practices - 2006-2007.  Scorecards for
Data Governance in the Global 5000 companies;
b)The IBM Data Governance Council Maturity Model: Building a roadmap for effective Data Governance-October-2007; 
c)The IBM Data Governance Unified Process, livro de Sunil Soares, editado em 2010, pela MC Press OnLine;
d)Selling Information Governance to the Business-Best practices by industry and job function, livro de Sunil Soares, publicado na forma de ebook, em 2011.
Framework de Governança de Dados – IBM

A IBM define um framework de GD, conforme a figura 3.1 abaixo. Os elementos que compõem a sua proposta são:

Resultados:
Nesse contexto, a IBM propõe duas grandes ações: a primeira foca nos riscos apresentados pelos dados com relação aos aspectos de qualidade, com impactos sobre a reputação corporativa, e aos aspectos de aderência a normas internacionais. Os riscos deverão ser identificados, qualificados, quantificados e depois analisados para definir mecanismos de mitigação, contingência, aceitação ou transferência. Além disso, nesse mesmo contexto de resultados (outcomes), a IBM aponta a necessidade de valoração dos ativos de informação, ou seja, um processo de aculturamento corporativo  que reflita  sobre os valores dessa nova camada de ativos (ativos de informação), ainda hoje com uma formalização  relativamente incipiente.

Viabilizadores:
No framework apresentado, a IBM aponta elementos que viabilizarão a implantação de um programa de GD (Governança de Dados). A parte mais proeminente mostrada é a conscientização sobre a importância da GD e a definição de uma estrutura organizacional que estabeleça um nível mútuo de responsabilidade entre TI e áreas de negócios, aplicado sobre os dados em diferentes camadas de gerência. Nesse contexto, são destacadas as políticas, que definem direcionamentos estratégicos que apontam o comportamento desejado pela empresa a respeito da forma de atuação dos envolvidos no programa. Também surge como viabilizador o conceito de data stewardship, disciplina de controle de qualidade para garantir um cuidado custodial dos dados visando à sua melhoria e a gerência de riscos envolvidos. O conceito de custódia se aplica no sentido de que os dados, sendo um ativo corporativo e, portanto não pertencentes a ninguém, estarão, ao longo do seu ciclo de vida, sob os cuidados de departamentos, áreas, etc., responsáveis por parte do seu ciclo de vida. Algumas propostas sugerem a combinação de criadores de dados(creators) com proprietários(owners) e outras consideram mais a custódia como elemento de responsabilidade atribuído à área de TI, por seus procedimentos de armazenamento, administração de dados e de bancos de dados . Independentemente da forma estabelecida, essas definições estratificadas de responsabilidade deverão ser exercidas, gerenciadas e auditadas.

Disciplinas centrais:
Nessa parte do framework aparece a Gerência de Qualidade de Dados, composta de processos  definidos para medir, melhorar e certificar a qualidade e a integridade dos dados, nos seus diferentes domínios, de produção a teste e arquivos históricos (archival).  A essa proposta se associa a Gerência do Ciclo de Vida da informação, com processos definidos para coleta, uso, retenção e eliminação de informações. Essa camada termina com as considerações sobre segurança e privacidade da informação, visando ao controle e à proteção desses ativos, com relação à sua utilização.

Disciplinas de apoio:
Nesta última camada do framework da IBM aparecem disciplinas de suporte, com ênfase na arquitetura dos dados, objetivando a definição ou documentação de modelos de dados, no âmbito dos dados estruturados ou não estruturados, que visam a garantir o entendimento que facilitará a disponibilidade e distribuição desses ativos. Uma arquitetura de dados e seus modelos não poderão prescindir da definição dos metadados, que representam a semântica dos elementos de informação, regras de negócios e tipos de dados e que fazem a junção entre o conhecimento humano e os processos automatizados. Finalmente o framework se fecha com uma camada na qual serão gerados procedimentos de controle, como auditoria, visando à monitoração do processo e às consequentes ações de ajustes de rumo consideradas necessárias.
Como pode ser percebido pela análise desses frameworks mostrados, alguns elementos são seminais na formação dos conceitos de GD. A definição de uma estrutura corporativa formal, composta por elementos de TI e de negócios,  de políticas amplas de dados, de projetos de qualidade de dados, de definição de metadados, de auditorias e de métricas é fundamental para o estabelecimento das primeiras camadas de GD de uma empresa que se convenceu de que os ativos de dados e informações não poderão mais ser vistos como produtos colaterais da execução de processos empresariais. Como esse processo de GD não se mostra trivial, essas empresas certamente começarão por implementações e modificações culturais gradativas, alcançando patamares crescentes de maturidade.

Síntese:
Os trabalhos sobre Governança de dados e informações da IBM são uma ótima referência, para se dizer o mínimo, logo de início. O cuidado que o leitor deve ter é que há um viés definido nos seus “roadmaps”  que conduzem para certas ferramentas da Big Blue, o que é natural considerando a força da empresa no segmento de serviços hoje e a sua vocação comercial. Isso, entretanto, não diminui o valor das ideias lá colocadas por Sunil Soares, responsável pelo assunto na Big Blue e sua equipe de colaboradores, que são mostradas de forma muito clara, com ótima capacidade de síntese e objetividade, servindo como um base conceitual espessa  para que cada empresa defina o seu próprio framework de Governança, como sugere o bom senso. Isso é fundamental na medida em que cada  empresa tem suas especificidades que deverão ser consideradas como fator crítico de sucesso nesse tipo de projeto. Seguir o didático framework apresentado pela IBM é um ótimo começo para quem deseja trilhar os caminhos de Governança de Dados, lembrando que as ferramentas podem ser consideradas acessórios a serem definidos ao seu gosto. Veremos, futuramente, maiores detalhes sobre as proposições de Sunil Soares

Nenhum comentário:

Postar um comentário