Skip to content

Commit f75cec2

Browse files
committed
Update end2end_ml_project.ipynb
1 parent a4031d4 commit f75cec2

1 file changed

Lines changed: 28 additions & 5 deletions

File tree

end2end_ml_project.ipynb

Lines changed: 28 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -684,7 +684,8 @@
684684
"metadata": {},
685685
"source": [
686686
"데이터 시각화는 히스토그램, 산점도 등 다양한 방식으로 가능하다.\n",
687-
"여기서는 데이터셋에 포함된 경도와 위도 정보를 이용한 시각화를 진행한다."
687+
"여기서는 데이터셋에 포함된 경도와 위도 정보를 이용한 시각화를 진행한다.\n",
688+
"점의 클 수록 해당 구역의 인구가 많음을 의미한다."
688689
]
689690
},
690691
{
@@ -698,16 +699,19 @@
698699
},
699700
"source": [
700701
"훈련셋에 포함된 16,512개 구역의 \n",
701-
"경도와 위도 정보를 이용하여 구역 정보를 산포도로 나타내면 인구의 밀집 정도를 확인할 수 있다. \n",
702-
"예를 들어, 샌프란시스코의 Bay Area, LA, 샌디에고 등 유명 대도시의 특정 구역이 높은 인구 밀도를 갖는다."
702+
"경도와 위도 정보를 이용하여 구역 정보를 산포도로 나타내면 \n",
703+
"지역별 인구의 밀집 정도가 다름을 확인할 수 있다. \n",
704+
"예를 들어, 일부 지역(샌프란시스코의 Bay Area, LA, 샌디에고 등 유명 대도시)에\n",
705+
"인구가 많은 구역이 모여 있는 반면에,\n",
706+
"내륙으로 들어가거가 북쪽으로 올라갈 수록 인구 밀도가 낮아지는 경향이 있다."
703707
]
704708
},
705709
{
706710
"cell_type": "markdown",
707711
"metadata": {},
708712
"source": [
709713
"<div align=\"center\">\n",
710-
" <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-10a.png?raw=true\" width=\"600\">\n",
714+
" <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-09a.png?raw=true\" width=\"600\">\n",
711715
"</div>"
712716
]
713717
},
@@ -1524,7 +1528,26 @@
15241528
"- 점의 크기는 구역 인구에 비례한다.\n",
15251529
"\n",
15261530
"<div align=\"center\">\n",
1527-
" <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-cluster.png?raw=true\" width=\"550\">\n",
1531+
" <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-cluster.png?raw=true\" width=\"600\">\n",
1532+
"</div>"
1533+
]
1534+
},
1535+
{
1536+
"cell_type": "markdown",
1537+
"metadata": {},
1538+
"source": [
1539+
"아래 그래프와 비교해보면 일부 군집, 특히 해안가에 위치한 밀도가 높은 군집에서는 군집 중심에 가까울 수록\n",
1540+
"중위 주택가격이 높아짐을 알 수 있다.\n",
1541+
"머신러닝 모델이 이런 특성을 활용할 수 있도록 단순한 위도, 경도 정보대신 군집과 유사도 정보를 새로운 특성으로\n",
1542+
"제공하면 모델의 성능이 보다 좋아질 수 있다."
1543+
]
1544+
},
1545+
{
1546+
"cell_type": "markdown",
1547+
"metadata": {},
1548+
"source": [
1549+
"<div align=\"center\">\n",
1550+
" <img src=\"https://github.com/codingalzi/code-workout-ml/blob/master/images/ch02/homl02-10a.png?raw=true\" width=\"600\">\n",
15281551
"</div>"
15291552
]
15301553
},

0 commit comments

Comments
 (0)