Pipeline de dados para análise de performance operacional do grupo Azul Linhas Aéreas, construída com dbt + DuckDB seguindo a arquitetura medalhão (Bronze → Silver → Gold).
A aviação brasileira gera volumes expressivos de dados públicos. Este projeto transforma os dados abertos da ANAC em indicadores acionáveis de pontualidade, cancelamento e performance por rota, o tipo de análise que suporta decisões operacionais em companhias aéreas.
Seeds (CSV) Bronze Silver Gold
─────────────────────────────────────────────────────────────────────
AerodromosPublicos → raw_aerodromos → stg_aerodromos ─┐
├─→ mart_rotas
azul_vra → raw_vra → stg_vra ───┤
└─→ mart_pontualidade
| Camada | Materialização | Responsabilidade |
|---|---|---|
| Bronze | view | Renomeia colunas, preserva dado bruto |
| Silver | view | Limpeza, padronização, joins, enriquecimento |
| Gold | table | KPIs prontos para consumo em BI |
- VRA (Voo Regular Ativo) — ANAC. Registros mensais de pontualidade e cancelamento por voo do grupo Azul (AZU + ACN), período 2024–2025.
- Aeródromos Públicos — ANAC. Cadastro com localização geográfica e situação operacional de 497 aeródromos brasileiros.
- OTP estimado (On-Time Performance): percentual de voos sem atraso acima de 30 minutos
- Taxa de cancelamento por rota e por mês
- Ranking de rotas por volume de etapas previstas
- Coordenadas geográficas de origem e destino para visualização em mapa
- dbt Core — transformação e documentação
- DuckDB — banco de dados local (zero infraestrutura)
- uv — gerenciamento de dependências Python
- Python 3.11+
- uv instalado
git clone https://github.com/SEU_USUARIO/azul-ops-analytics.git
cd azul-ops-analytics
uv sync# Carrega os dados brutos
uv run dbt seed
# Executa todos os modelos
uv run dbt run
# Roda os testes de qualidade
uv run dbt test
# Gera e abre a documentação com lineage
uv run dbt docs generate
uv run dbt docs serveO projeto conta com testes automatizados em todas as camadas:
not_null— campos obrigatórios nunca vaziosunique— chaves sem duplicataaccepted_values— empresas restritas a AZU e ACN
azul_ops_analytics/
├── seeds/ # Dados brutos da ANAC (CSV)
├── models/
│ ├── bronze/ # Modelos raw_*
│ ├── silver/ # Modelos stg_* e int_*
│ └── gold/ # Modelos mart_*
├── tests/ # Testes customizados
└── dbt_project.yml # Configuração principal
