Skip to content

romi-escobar/Examenes_de_Certificacion_CodingDojo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data Science + Machine Learning Bootcamp

Repositorio de Examenes de Certificación

Descripción

  • DS_Fundamentals
  1. Intento 1: Este proyecto se centra en el análisis de salarios en el campo de la ciencia de datos para el año 2023. Utilizando un conjunto de datos que incluye información sobre salarios, tipos de empleo, niveles de experiencia y más, se llevan a cabo análisis estadísticos y visualizaciones exploratorias para identificar tendencias y patrones en el mercado laboral de ciencia de datos.
  2. Intento 2: Este proyecto se centra en el análisis de datos de reservas hoteleras para explorar la satisfacción del cliente en la industria. Utilizando un conjunto de datos que incluye información sobre reservas, tipos de hotel, tiempos de anticipación (lead time), estados de las reservas y más, se llevan a cabo análisis estadísticos y visualizaciones exploratorias para identificar patrones y tendencias en el comportamiento de las reservas y características de los huéspedes.
  3. Intento 3
  • Machine Learning
  1. Intento 1

Contenido

El repositorio incluye:

  • data/: Carpeta que contiene el archivo de datos original (ds_salaries.csv y hotel_bookings.csv).
  • src/: Carpeta que contiene los Jupyter Notebooks con análisis y limpieza de datos.
  • requirements.txt: Lista de dependencias necesarias para ejecutar el proyecto.

Requisitos

Para ejecutar el análisis, necesitarás tener instalado Python 3 y las siguientes bibliotecas:

  • numpy
  • pandas
  • matplotlib
  • seaborn
  • scikit-learn
  • catboost
  • lightgbm
  • xgboost
  • json
  • re
  • warning

Puedes instalar las bibliotecas necesarias ejecutando:

pip install -r requirements.txt

Análisis Realizados

Limpieza de Datos

  • Se eliminan duplicados
  • Se normalizó la capitalización de los títulos de trabajo, preservando ciertas siglas.
  • Se manejaron valores nulos y se aseguraron tipos de datos adecuados.

Exploración de Datos

  • Estadísticas Descriptivas: Se generó un resumen estadístico del dataset, incluyendo medidas de tendencia central y dispersión para las variables numéricas.
  • Visualizaciones Univariadas
  • Visualizaciones Multivariadas
  • Identificación de Tendencias: Se discutieron tendencias notables observadas en los datos.

Cómo Ejecutar

Clona el repositorio:

git clone https://github.com/tu_usuario/tu_repositorio.git
cd tu_repositorio

Instala las dependencias:

pip install -r requirements.txt

Abre el Jupyter Notebook:

jupyter notebook notebooks/tu_notebook.ipynb

Contribuciones

Las contribuciones son bienvenidas. Si deseas mejorar este proyecto, por favor haz un fork del repositorio y envía un pull request.

Licencia

Este proyecto está licenciado bajo la Licencia Apache.

Contacto

Para más información, contactame romi.escobar1615@gmail.com

About

Archivo .ipynb comentado con todo el código utilizado para la limpieza y exploración de datos.

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors