Governança de dados é o conjunto de políticas, processos, papéis e padrões que garantem que os dados de uma organização sejam precisos, seguros, acessíveis e usados de forma responsável.

Não é uma ferramenta nem um projeto pontual: é um programa contínuo que define quem pode fazer o quê com quais dados e como.

Por que governança importa

Sem governança, organizações data-driven enfrentam:

  • Dados inconsistentes: “receita” significa coisas diferentes em cada relatório
  • Silos de conhecimento: ninguém sabe onde os dados estão ou quem é o dono
  • Riscos de compliance: dados sensíveis sem controle de acesso (LGPD, GDPR)
  • Baixa confiança: times param de usar dados quando não confiam neles

Os cinco pilares

mindmap
  root((Governança de Dados))
    Catálogo
      Inventário de ativos
      Metadados de negócio
    Qualidade
      Regras de validação
      Monitoramento contínuo
    Linhagem
      De onde vêm os dados
      Como são transformados
    Segurança e Privacidade
      Controle de acesso
      Mascaramento de PII
    Stewardship
      Donos de domínio
      Políticas e SLAs

Catálogo de dados

Inventário centralizado de todos os ativos de dados: tabelas, APIs, dashboards, modelos de ML. Contém metadados técnicos (schema, localização) e metadados de negócio (definição, dono, glossário).

Qualidade de dados

Conjunto de regras que definem o que é um dado “bom” e monitoram continuamente o pipeline. As dimensões clássicas são: completude, unicidade, validade, consistência, precisão e atualidade.

Linhagem de dados

Rastreabilidade ponta a ponta: de onde os dados vieram, por quais transformações passaram e onde chegaram. Essencial para investigar problemas e cumprir requisitos regulatórios.

Segurança e privacidade

Controle de quem acessa quais dados (RBAC/ABAC), mascaramento de PII e anonimização. Regulações como LGPD e GDPR tornam isso obrigatório, não opcional.

Stewardship

Papéis humanos dentro da governança. Um data steward é o responsável por um domínio de dados: define regras, resolve conflitos de definição e garante a qualidade do que está sob sua curadoria.

Modelo de responsabilidade

PapelResponsabilidade
Data OwnerDono executivo de um domínio, aprova políticas de acesso
Data StewardResponsável operacional: qualidade, definições, catalogação
Data EngineerImplementa pipelines e regras técnicas de qualidade
Data ConsumerUsa os dados conforme as políticas definidas

Governança e arquitetura

Governança não é independente da arquitetura: ela se manifesta de formas diferentes dependendo do modelo adotado.

  • Data Warehouse centralizado: governança também centralizada, mais fácil de controlar mas cria gargalos
  • Data Lake: governança mais difícil pelo volume e variedade; catálogo e linhagem se tornam críticos
  • Data Mesh: governança descentralizada por domínio, com um plano de controle central (federated governance)
  • Data Fabric: governança automatizada via metadados e ML, com descoberta e catalogação automáticas

Ver também: governanca-de-dados-frameworks | governanca-de-dados-ferramentas | governanca-de-dados-aplicacao | pipeline-de-dados | python-qualidade-dados | data-lake-lakehouse