|
684 | 684 | "metadata": {}, |
685 | 685 | "source": [ |
686 | 686 | "데이터 시각화는 히스토그램, 산점도 등 다양한 방식으로 가능하다.\n", |
687 | | - "여기서는 데이터셋에 포함된 경도와 위도 정보를 이용한 시각화를 진행한다." |
| 687 | + "여기서는 데이터셋에 포함된 경도와 위도 정보를 이용한 시각화를 진행한다.\n", |
| 688 | + "점의 클 수록 해당 구역의 인구가 많음을 의미한다." |
688 | 689 | ] |
689 | 690 | }, |
690 | 691 | { |
|
698 | 699 | }, |
699 | 700 | "source": [ |
700 | 701 | "훈련셋에 포함된 16,512개 구역의 \n", |
701 | | - "경도와 위도 정보를 이용하여 구역 정보를 산포도로 나타내면 인구의 밀집 정도를 확인할 수 있다. \n", |
702 | | - "예를 들어, 샌프란시스코의 Bay Area, LA, 샌디에고 등 유명 대도시의 특정 구역이 높은 인구 밀도를 갖는다." |
| 702 | + "경도와 위도 정보를 이용하여 구역 정보를 산포도로 나타내면 \n", |
| 703 | + "지역별 인구의 밀집 정도가 다름을 확인할 수 있다. \n", |
| 704 | + "예를 들어, 일부 지역(샌프란시스코의 Bay Area, LA, 샌디에고 등 유명 대도시)에\n", |
| 705 | + "인구가 많은 구역이 모여 있는 반면에,\n", |
| 706 | + "내륙으로 들어가거가 북쪽으로 올라갈 수록 인구 밀도가 낮아지는 경향이 있다." |
703 | 707 | ] |
704 | 708 | }, |
705 | 709 | { |
706 | 710 | "cell_type": "markdown", |
707 | 711 | "metadata": {}, |
708 | 712 | "source": [ |
709 | 713 | "<div align=\"center\">\n", |
710 | | - " <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-10a.png?raw=true\" width=\"600\">\n", |
| 714 | + " <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-09a.png?raw=true\" width=\"600\">\n", |
711 | 715 | "</div>" |
712 | 716 | ] |
713 | 717 | }, |
|
1524 | 1528 | "- 점의 크기는 구역 인구에 비례한다.\n", |
1525 | 1529 | "\n", |
1526 | 1530 | "<div align=\"center\">\n", |
1527 | | - " <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-cluster.png?raw=true\" width=\"550\">\n", |
| 1531 | + " <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-cluster.png?raw=true\" width=\"600\">\n", |
| 1532 | + "</div>" |
| 1533 | + ] |
| 1534 | + }, |
| 1535 | + { |
| 1536 | + "cell_type": "markdown", |
| 1537 | + "metadata": {}, |
| 1538 | + "source": [ |
| 1539 | + "아래 그래프와 비교해보면 일부 군집, 특히 해안가에 위치한 밀도가 높은 군집에서는 군집 중심에 가까울 수록\n", |
| 1540 | + "중위 주택가격이 높아짐을 알 수 있다.\n", |
| 1541 | + "머신러닝 모델이 이런 특성을 활용할 수 있도록 단순한 위도, 경도 정보대신 군집과 유사도 정보를 새로운 특성으로\n", |
| 1542 | + "제공하면 모델의 성능이 보다 좋아질 수 있다." |
| 1543 | + ] |
| 1544 | + }, |
| 1545 | + { |
| 1546 | + "cell_type": "markdown", |
| 1547 | + "metadata": {}, |
| 1548 | + "source": [ |
| 1549 | + "<div align=\"center\">\n", |
| 1550 | + " <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-10a.png?raw=true\" width=\"600\">\n", |
1528 | 1551 | "</div>" |
1529 | 1552 | ] |
1530 | 1553 | }, |
|
0 commit comments