ํด๋น ํ๋ก์ ํธ๋ ๋ฆฌํ ์ผ ์คํ ์ด์์ ๊ณ ๊ฐ ๊ฑฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ์๋น ํจํด์ ํ์ ํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๊ฒ ๋ง์ผํ ์ ๋ต์ ์ ์ํ๊ธฐ ์ํด ์ํ๋์๋ค.
- ๊ณ ๊ฐ๊ตฐ๋ณ ํน์ฑ, ์๋น ํจํด์ ํ์ ํ์ฌ ์ธ๊ทธ๋จผํธ๋ณ ์๋น ์ฑํฅ ์ดํด
- ๊ฐ ์ธ๊ทธ๋จผํธ๋ณ ์ ํฉํ ํ๊ฒ ๋ง์ผํ ์ ๋ต์ ๊ฐ๋ฐํ์ฌ ๋ง์ผํ ํจ์จ์ฑ ๊ฐํ
- ๊ณ ๊ฐ ํ๋ ๋ถ์ : ์ธ๊ตฌํ์ ์ ๋ณด, ๊ตฌ๋งค์ฒ, ๊ตฌ๋งค์ํ, ๊ตฌ๋งค ํ๋ ๊ฐ ์ฃผ์ ๊ด๊ณ ํ์
- ๋จธ์ ๋ฌ๋ ํ์ฉ : ๊ตฐ์ง ๋ชจ๋ธ์ ํ์ฉํด ๊ณ ๊ฐ ๊ฐ ์ ์ฌ์ฑ์ ํ์ ํ๊ณ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์ ์ง์
- ๋ง์ผํ ์ ๋ต ์๋ฆฝ : ๊ณ ๊ฐ ์ธ๊ทธ๋จผํธ๋ณ ์ ํฉํ ๋ง์ผํ ์ ๋ต์ ์ ์ํ์ฌ ๋ง์ถคํ ์๋น์ค ์ ๊ณต
1. ๋ฐ์ดํฐ ํ์ ๋ฐ ์ ์ฒ๋ฆฌ
- ํ์์ ๋ฐ์ดํฐ ๋ถ์์ ํตํด ๋ฆฌํ ์ผ ์คํ ์ด ๋ด ์ฃผ์ ํจํด ๋ฐ ์๊ด๊ด๊ณ ํ์
- ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ, ๋ฐ์ดํฐ ์ ๊ทํ ๋ฑ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ์ํ
2. ๋ชจ๋ธ ๊ฐ๋ฐ
- K-Means++ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๊ตฐ์ง ๋ถ์ ํ, PCA(์ฃผ์ฑ๋ถ๋ถ์)๋ฅผ ํ์ฉํ์ฌ ๊ตฐ์ง ์๊ฐํ
- Elbow Method์ ์ฌ์ฉํ์ฌ ์ต์ ์ k๊ฐ ํ์
3. ์ธ๊ทธ๋จผํธ ๊ตฌ๋ถ
- ๊ณ ๊ฐ ์ธ๊ทธ๋จผํธ๋ณ ํ๋ ๋ฐ ํน์ฑ ๋ถ์
- ๊ฐ ์ธ๊ทธ๋จผํธ๋ณ ํน์ฑ์ ๋ง๋ ๋ง์ถคํ ์ ๋ต ์๋ฆฝ
- ๋ง์ผํ ์บ ํ์ธ ์ต์ ํ : ๊ณ ๊ฐ ์ธ๊ทธ๋จผํธ๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ตฐ์ง๋ณ ๋ง์ถคํ ์บ ํ์ธ ์ ์
- ๋ง์ผํ ํจ์จ์ฑ ํฅ์ : ์ธ๊ทธ๋จผํธ๋ณ ๋ง์ถคํ ์บ ํ์ธ ์ ์์ ํตํด ROI ํฅ์ ๊ธฐ๋
- ๊ณ ๊ฐ ๋ง์กฑ๋ ํฅ์ : ์ธ๊ทธ๋จผํธ๋ณ ์ ํธ๋์ ๊ธฐ๋ฐํ ์๋น์ค ์ ๊ณต์ผ๋ก ๊ณ ๊ฐ ๊ฒฝํ ๊ฐ์
- ์ฃผ์ ์ธ์ฌ์ดํธ : ๊ตฐ์ง๋ณ๋ก ๊ฐ์กฑ ์ ํ, ๋ฐฉ๋ฌธ ํ์, ์ง๋ถ ๊ธ์ก, ๊ตฌ๋งค์ฒ ์ ํธ๋์์ ์ฐจ์ด๊ฐ ๋ํ๋จ
- ๋ง์ผํ ์ ๋ต : ๊ฐ์กฑ ๊ณ ๊ฐ์๊ฒ๋ ์จ๋ผ์ธ ๋ฉค๋ฒ์ญ ์๋น์ค ์ถ์ฒ, ์ฑ๊ธ ๊ณ ๊ฐ์๊ฒ๋ ํ๋ฆฌ๋ฏธ์ ์ ํ๊ตฐ ์ง์ค
- Python | Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn

