Engenharia de Dados

Área central do meu trabalho. Organiza conhecimentos sobre pipelines, arquiteturas, plataformas e ferramentas do ecossistema de dados.

Fundamentos

Arquitetura e Padrões

Ecossistema e Ferramentas

Plataformas

Databricks

Google Cloud Platform (GCP)

  • gcp: visão geral da plataforma, hierarquia, IAM, regiões

Storage e Warehouse

Processamento

Orquestração e Transformação

Apache Airflow

Governança e BI

Referência

Governança de Dados

Python