Este repo fue realizado para resolver el challenge adjunto: Challenge_Data_Analytics_con_Python.
Primero hay que crear e iniciarse en el entorno virtual con el comando: python -m venv venv.
Luego, es necesario instalar las dependencias para la ejecución correcta: pip install -r requirements.txt.
Una vez ya instalado, para correr el programa es necesario ejecutar el Main: python main.py.
El logueo está grabado en el archivo datos_generados.log.
El detalle de los módulos que alimentan al main se encuentra en los archivos presentes en la carpeta.
- Descarga de los datos desde las 3 fuentes en archivos .csv.
- Genera los directorios específicos para cada archivo de los datos-fuente.
- Transforma los datos-fuente en las tablas generales con columnas normalizadas.
- Genera tabla general normalizada con los datos de las 3 fuentes.
- Envía estas tablas (pandas Data Frames) a los archivos correspondientes.
- Genera el motor y la conexión con la base de datos PostgreSQL.
- Genera tablas extras de análisis desde archivos de datos-fuente.
- Alimenta la base de datos.
- Genera archivo de logging y manejo de errores.