Scatter는, 여러 데이터가 한 군데에 뭉치면 육안으로 판단하기 어렵다.
해결법 : hist2d() 이용 -> 밀도를 나타내는데 좋다.
plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20)
plt.colorbar()
plt.title("배기량과 연비의 관계")
plt.xlabel("배기량 (L)")
plt.ylabel("연비 (mpg)")
plt.show()
plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20)
-> data = 시각화 할 데이터(DataFrame 이어야 한다)
-> x, y = x축, y축에 표시할 데이터
-> cmin = 색상 맵 기준 표시되는 최소 데이터 빈도(작을수록 더 낮은 빈도의 데이터도 시각화 포함)
-> cmap = 색상 맵 지정, 색상 맵은 데이터 값의 크기를 색상으로 나타나는 데 사용된다(기본값 : viridis)
-> bins = 구간 개수(기본값 10개)
plt.colorbar()
-> 색상 막대를 추가하는 함수로, 데이터 값에 대한 색상을 알려준다.
-> plt.legend()와 비슷하게 시각적인 요소를 추가하며 차트 해석에 도움을 준다.