🏠 Airbnb Data Engineering Project (AWS + Snowflake + dbt)

📌 Overview

This project demonstrates an end-to-end modern data engineering pipeline built using AWS, Snowflake, and dbt (Data Build Tool). It focuses on transforming raw Airbnb data into clean, analytics-ready datasets using a layered architecture (Bronze → Silver → Gold).

🧰 Tech Stack

☁️ AWS – Data storage and orchestration (e.g., S3)
❄️ Snowflake – Cloud data warehouse for scalable analytics
🔧 dbt (Data Build Tool) – Data transformation and modeling
🐍 Python – Environment and dependency management
🔁 Git & GitHub – Version control

🏗️ Architecture

The project follows a Medallion Architecture:

🥉 Bronze Layer

Raw ingestion from source systems
Minimal transformations
Tables: bronze_bookings, bronze_hosts, bronze_listings

🥈 Silver Layer

Data cleaning and standardization
Handling nulls, data types, and basic transformations
Tables: silver_bookings, silver_hosts, silver_listings

🥇 Gold Layer

Business-level aggregations and analytics-ready models
Fact and dimension tables
Tables: fact, obt

🔄 Data Flow

Raw Airbnb data is stored in AWS (S3)
Data is loaded into Snowflake staging tables
dbt transforms data through Bronze → Silver → Gold layers
Final models are ready for BI tools and analytics

⚙️ Key Features

Modular dbt models with clear layer separation
Reusable macros for transformations
Source definitions and testing
Snapshotting for historical tracking
Scalable cloud-based architecture

📂 Project Structure

airbnb_snowflake_dbt_project/
│
├── models/
│   ├── bronze/
│   ├── silver/
│   ├── gold/
│   └── sources/
│
├── macros/
├── snapshots/
├── tests/
├── dbt_project.yml
├── profiles.yml

🚀 How to Run

dbt debug        # Check connection
dbt compile      # Compile models
dbt run          # Run transformations
dbt test         # Run tests

🎯 Outcome

This project showcases how to:

Build scalable data pipelines
Transform raw data into insights
Apply best practices in modern data engineering

📌 Future Improvements

Add orchestration using AWS Airflow
Integrate BI tools (Power BI / Tableau)
Implement CI/CD for dbt pipelines

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
airbnb_snowflake_dbt_project		airbnb_snowflake_dbt_project
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🏠 Airbnb Data Engineering Project (AWS + Snowflake + dbt)

📌 Overview

🧰 Tech Stack

🏗️ Architecture

🥉 Bronze Layer

🥈 Silver Layer

🥇 Gold Layer

🔄 Data Flow

⚙️ Key Features

📂 Project Structure

🚀 How to Run

🎯 Outcome

📌 Future Improvements

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🏠 Airbnb Data Engineering Project (AWS + Snowflake + dbt)

📌 Overview

🧰 Tech Stack

🏗️ Architecture

🥉 Bronze Layer

🥈 Silver Layer

🥇 Gold Layer

🔄 Data Flow

⚙️ Key Features

📂 Project Structure

🚀 How to Run

🎯 Outcome

📌 Future Improvements

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages