Skip to content

surocham/azul_ops_analyticss

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

dbt

Pipeline de dados para análise de performance operacional do grupo Azul Linhas Aéreas, construída com dbt + DuckDB seguindo a arquitetura medalhão (Bronze → Silver → Gold).

Contexto

A aviação brasileira gera volumes expressivos de dados públicos. Este projeto transforma os dados abertos da ANAC em indicadores acionáveis de pontualidade, cancelamento e performance por rota, o tipo de análise que suporta decisões operacionais em companhias aéreas.

Arquitetura

Seeds (CSV)         Bronze              Silver                Gold
─────────────────────────────────────────────────────────────────────
AerodromosPublicos → raw_aerodromos → stg_aerodromos ─┐
                                                        ├─→ mart_rotas
azul_vra          → raw_vra        → stg_vra        ───┤
                                                        └─→ mart_pontualidade
Camada Materialização Responsabilidade
Bronze view Renomeia colunas, preserva dado bruto
Silver view Limpeza, padronização, joins, enriquecimento
Gold table KPIs prontos para consumo em BI

Fontes de dados

  • VRA (Voo Regular Ativo) — ANAC. Registros mensais de pontualidade e cancelamento por voo do grupo Azul (AZU + ACN), período 2024–2025.
  • Aeródromos Públicos — ANAC. Cadastro com localização geográfica e situação operacional de 497 aeródromos brasileiros.

KPIs gerados

  • OTP estimado (On-Time Performance): percentual de voos sem atraso acima de 30 minutos
  • Taxa de cancelamento por rota e por mês
  • Ranking de rotas por volume de etapas previstas
  • Coordenadas geográficas de origem e destino para visualização em mapa

Stack

  • dbt Core — transformação e documentação
  • DuckDB — banco de dados local (zero infraestrutura)
  • uv — gerenciamento de dependências Python

Como rodar

Pré-requisitos

  • Python 3.11+
  • uv instalado

Instalação

git clone https://github.com/SEU_USUARIO/azul-ops-analytics.git
cd azul-ops-analytics
uv sync

Executar a pipeline completa

# Carrega os dados brutos
uv run dbt seed

# Executa todos os modelos
uv run dbt run

# Roda os testes de qualidade
uv run dbt test

# Gera e abre a documentação com lineage
uv run dbt docs generate
uv run dbt docs serve

Testes de qualidade

O projeto conta com testes automatizados em todas as camadas:

  • not_null — campos obrigatórios nunca vazios
  • unique — chaves sem duplicata
  • accepted_values — empresas restritas a AZU e ACN

Estrutura do projeto

azul_ops_analytics/
├── seeds/              # Dados brutos da ANAC (CSV)
├── models/
│   ├── bronze/         # Modelos raw_*
│   ├── silver/         # Modelos stg_* e int_*
│   └── gold/           # Modelos mart_*
├── tests/              # Testes customizados
└── dbt_project.yml     # Configuração principal

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors