Набор данных - Human Resources Data Set разработан Dr. Rich и периодически обновляется.
Сейчас доступна 13 версия Codebook - HR Dataset v13 от 9/27/2019
Также данный набор данных анализировался:
- Kathy Sun - в рамках её проекта Final Project for R
- CSV файлы с данными v.9 были получены из github Patricia Rollins
Данные анализировались в рамках курсового проекат универиситета Skillbox и изначально были представлены БД PostgreSQL на сервере университета.
Для соблюдение конфиденциальности БД компании Skillbox, при опубликовании данного проекта используется SQLite в которую распакованы таблицы с данными из файлов CSV.
- Преобразуем данные из CSV-файлов из репозитория Patricia Rollins в таблицы в БД SQLite (HR.db)
- В ходе преобразования сделаем следующие корректировки (для соответствия с БД Skillbox):
- Таблица
salary_grid- нужно заменить_на(пробел) в названиях столбцов. - Таблица
recruiting_costs:- убрать
_2018в месяцах - Добавить пробелы в
EmploymentSource - Создать столбец
Total
- убрать
- Таблица
production_staff:- Заменить
['LastName', 'FirstName']наEmployee Name. FirstName + LastName - Добавить
id- просто порядковый номер. CamelCase- добавить пробелыCamel CaseHireDate-Date of HireTermDate-TermDate- не произволить изменений.AbutmentsPerHourWk1-Abutments/Hour Wk1AbutmentsPerHourWk2-Abutments/Hour Wk2Complaints_90Days-90-day Complaints
- Заменить
- Таблица
hr_dataset:id- Добавить столбец с нумерацией['LastName', 'FirstName']-Employee Name- FirstName + LastName- Перевести в строчные буквы:
['MarriedID', 'MaritalStatusID', 'GenderID', 'EmpStatusID', 'DeptID', 'PerfScoreID', 'Age', 'Zip', 'DOB', 'Sex', 'MaritalDesc', 'CitizenDesc', 'RaceDesc', 'Department', 'Position'] PerfScoreID-perf_scoreidEmpstatusID-empstatus_idHispanic_Latino-Hispanic/LatinoHireDate-Date of HireTerminationDate-Date of TerminationCamelCase- добавить пробелыCamel Casedepartment: ИзменитьIT - Information SystemsнаIT/IS
- Доработаем функцию подключения к базе данных из-за изменения PostgreSQL -> SQLite.
- Перепроверим SQL-выражения, которые использовались для выполнения запросов.
- Изменения отметим знаком ⚠