Skip to content

lucas-aulas/template-data_project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


PROJECT: for ...



What is it?

Description paragraph

Table of Contents

Main Features

⠀⠀some_function(): quick description
⠀⠀some_feature: quick description
⠀⠀SomeClass: quick description
⠀⠀...

Where to get it / Install

The source code is currently hosted on GitHub at: https://github.com/_____

Warning

It's essential to use Python 3.10 version

  • GitHub

     # GitHub
     pip install git+https://github.com/_____
  • Setup

     # Linux
     python3.10 -m venv .venv  # cria ambiente virtual
     source .venv/bin/activete # ativa o ambiente virtual
     python script.py          # executa o script
     # macOS
     ...
     # Windows
     ...

Documentation

License

Dependencies

Project Structure

•
├── README.md # Visão geral e instruções do projeto
├── requirements.txt # Dependências Python
│
├── artifacts # Modelos .pkl, embeddings e objetos serializados
│   └── revenue_model.pkl
│
├── bin # Binários e executáveis auxiliares
│   └── chromedriver.exe
│
├── dashboard # Dashboards e arquivos visuais
│   └── marvel_vs_dc.pbix
│
├── data # Camadas do Data Lake
│   ├── bronze # Dados brutos ingeridos
│   │   └── bronze_imdb_movies_raw.csv
│   │
│   ├── gold # Camada analítica/modelagem dimensional
│   │   └── fact_movie_performance.parquet
│   │
│   ├── raw # Dados originais das fontes externas
│   │   └── imdb_movies.csv
│   │
│   └── silver # Dados tratados e enriquecidos
│       └── silver_movies.parquet
│
├── docs # Documentação técnica
│   └── architecture.md
│
├── logs # Logs de execução e erros
│   └── pipeline.log
│
├── notebooks # Exploração e validação analítica
│   └── exploration.ipynb
│
├── pipelines # Pipelines ETL principais
│   ├── gold # Construção da camada Gold
│   │   └── build_fact_table.py
│   │
│   ├── ingestion # Ingestão de dados
│   │   └── ingest_imdb.py
│   │
│   └── transformation # Transformação e limpeza
│       └── transform_movies.py
│
├── secrets # Credenciais e arquivos sensíveis
│   └── service_account.json
│
├── sql # Scripts SQL analíticos e estruturais
│   └── analytics_queries.sql
│
├── src # Código-fonte principal da aplicação
│   ├── database # Persistência e conexão com banco
│   │   └── postgres_connection.py
│   │
│   ├── gold # Regras da camada Gold
│   │   └── build_dimensions.py
│   │
│   ├── ingestion # Funções auxiliares de ingestão
│   │   └── imdb_loader.py
│   │
│   ├── transform # Funções de transformação
│   │   └── financial_metrics.py
│   │
│   └── utils # Funções utilitárias reutilizáveis
│       └── parsing.py
│
├── tests # Testes automatizados
│   └── test_metrics.py
│
├── tmp # Arquivos temporários
│   ├── cache # Cache intermediário
│   │   └── cached_movies.pkl
│   │
│   ├── checkpoints # Controle de execução
│   │   └── pipeline_checkpoint.json
│   │
│   └── exports # Exportações temporárias
│       └── movies_export.csv
│
└── utils # Helpers e scripts utilitários independentes
    └── file_utils.py

⇧ Go to Top

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors