Governança de dados ganhou formalização através de frameworks que definem como estruturar programas, medir maturidade e organizar times. Os principais são o DAMA-DMBOK e o DCAM, mas modelos mais recentes como Data Mesh e Data Fabric mudaram a forma de pensar sobre o problema.
DAMA-DMBOK
O DAMA-DMBOK (Data Management Body of Knowledge) é o framework de referência da indústria, publicado pela Data Management Association. Define 11 áreas de conhecimento que compõem a gestão completa de dados:
| Área | O que cobre |
|---|---|
| Data Governance | Políticas, papéis, processos e decisões sobre dados |
| Data Architecture | Modelos, integração e fluxo de dados na organização |
| Data Modeling & Design | Estrutura lógica e física dos dados |
| Data Storage & Operations | Armazenamento, backup e recuperação |
| Data Security | Privacidade, controle de acesso, compliance |
| Data Integration & Interoperability | ETL, ELT, APIs, troca de dados |
| Documents & Content | Dados não-estruturados, gestão de documentos |
| Reference & Master Data | MDM, dados de referência (listas canônicas) |
| Data Warehousing & BI | Modelos dimensionais, relatórios, analytics |
| Metadata | Metadados técnicos, de negócio e operacionais |
| Data Quality | Medição, remediação e monitoramento de qualidade |
O framework posiciona Data Governance como a área central que habilita e coordena todas as demais.
DCAM
O DCAM (Data Management Capability Assessment Model) foi desenvolvido pela EDM Council com foco em organizações financeiras, mas é aplicável em qualquer setor.
É um modelo de maturidade: avalia onde a organização está e define um caminho de evolução. As seis capacidades avaliadas são:
- Estratégia e liderança de dados
- Arquitetura de dados
- Tecnologia e infraestrutura
- Governança e políticas
- Qualidade de dados
- Gestão do ciclo de vida dos dados
Cada capacidade tem níveis de maturidade (de ad hoc a otimizado), o que permite priorizar investimentos.
Data Mesh
Proposto por Zhamak Dehghani (2019-2020), o Data Mesh é um modelo arquitetural e organizacional que questiona a governança centralizada.
Os quatro princípios
- Propriedade descentralizada por domínio: cada domínio de negócio (pedidos, clientes, pagamentos) é dono dos seus dados
- Dados como produto: domínios publicam data products com SLAs, documentação e qualidade garantida
- Infraestrutura self-service: plataforma central que permite domínios criarem e publicarem data products sem depender de um time central
- Governança federada: políticas globais (segurança, privacidade, interoperabilidade) são definidas centralmente, mas implementadas por cada domínio
flowchart TB subgraph Plano de Controle Central G[Políticas globais] C[Catálogo central] end subgraph Domínio Pedidos P1[Data Product: pedidos] end subgraph Domínio Clientes P2[Data Product: clientes] end subgraph Domínio Pagamentos P3[Data Product: pagamentos] end G --> P1 & P2 & P3 P1 & P2 & P3 --> C
Quando faz sentido
Data Mesh resolve o problema de escala organizacional: quando há múltiplos times de dados e um time central não consegue mais atender a demanda. Para organizações pequenas, a complexidade pode superar os benefícios.
Data Fabric
Conceito complementar (e às vezes confundido) com Data Mesh. Enquanto Mesh é organizacional, Data Fabric é tecnológico.
A ideia central é usar metadados, grafos de conhecimento e ML para criar uma camada de integração inteligente que:
- Descobre e cataloga dados automaticamente
- Sugere pipelines com base em padrões de uso
- Aplica políticas de acesso de forma dinâmica
- Conecta fontes heterogêneas sem necessidade de replicação
Fornecedores como IBM, SAP e Informatica promovem o conceito fortemente. Na prática, elementos de Data Fabric aparecem em ferramentas como Apache Atlas, Microsoft Purview e Google Dataplex.
Comparativo
| Dimensão | DAMA-DMBOK | Data Mesh | Data Fabric |
|---|---|---|---|
| Tipo | Framework de boas práticas | Modelo organizacional | Abordagem tecnológica |
| Governança | Centralizada | Federada | Automatizada por metadados |
| Foco | Processos e responsabilidades | Autonomia dos domínios | Integração e descoberta |
| Adoção | Alta (referência de mercado) | Crescente (empresas grandes) | Emergente (vendor-driven) |
Ver também: governanca-de-dados | governanca-de-dados-ferramentas | governanca-de-dados-aplicacao | big-data | data-lake-lakehouse | arquitetura-medalhao