Governança de dados é o conjunto de políticas, processos, papéis e padrões que garantem que os dados de uma organização sejam precisos, seguros, acessíveis e usados de forma responsável.
Não é uma ferramenta nem um projeto pontual: é um programa contínuo que define quem pode fazer o quê com quais dados e como.
Por que governança importa
Sem governança, organizações data-driven enfrentam:
- Dados inconsistentes: “receita” significa coisas diferentes em cada relatório
- Silos de conhecimento: ninguém sabe onde os dados estão ou quem é o dono
- Riscos de compliance: dados sensíveis sem controle de acesso (LGPD, GDPR)
- Baixa confiança: times param de usar dados quando não confiam neles
Os cinco pilares
mindmap root((Governança de Dados)) Catálogo Inventário de ativos Metadados de negócio Qualidade Regras de validação Monitoramento contínuo Linhagem De onde vêm os dados Como são transformados Segurança e Privacidade Controle de acesso Mascaramento de PII Stewardship Donos de domínio Políticas e SLAs
Catálogo de dados
Inventário centralizado de todos os ativos de dados: tabelas, APIs, dashboards, modelos de ML. Contém metadados técnicos (schema, localização) e metadados de negócio (definição, dono, glossário).
Qualidade de dados
Conjunto de regras que definem o que é um dado “bom” e monitoram continuamente o pipeline. As dimensões clássicas são: completude, unicidade, validade, consistência, precisão e atualidade.
Linhagem de dados
Rastreabilidade ponta a ponta: de onde os dados vieram, por quais transformações passaram e onde chegaram. Essencial para investigar problemas e cumprir requisitos regulatórios.
Segurança e privacidade
Controle de quem acessa quais dados (RBAC/ABAC), mascaramento de PII e anonimização. Regulações como LGPD e GDPR tornam isso obrigatório, não opcional.
Stewardship
Papéis humanos dentro da governança. Um data steward é o responsável por um domínio de dados: define regras, resolve conflitos de definição e garante a qualidade do que está sob sua curadoria.
Modelo de responsabilidade
| Papel | Responsabilidade |
|---|---|
| Data Owner | Dono executivo de um domínio, aprova políticas de acesso |
| Data Steward | Responsável operacional: qualidade, definições, catalogação |
| Data Engineer | Implementa pipelines e regras técnicas de qualidade |
| Data Consumer | Usa os dados conforme as políticas definidas |
Governança e arquitetura
Governança não é independente da arquitetura: ela se manifesta de formas diferentes dependendo do modelo adotado.
- Data Warehouse centralizado: governança também centralizada, mais fácil de controlar mas cria gargalos
- Data Lake: governança mais difícil pelo volume e variedade; catálogo e linhagem se tornam críticos
- Data Mesh: governança descentralizada por domínio, com um plano de controle central (federated governance)
- Data Fabric: governança automatizada via metadados e ML, com descoberta e catalogação automáticas
Ver também: governanca-de-dados-frameworks | governanca-de-dados-ferramentas | governanca-de-dados-aplicacao | pipeline-de-dados | python-qualidade-dados | data-lake-lakehouse