본문 바로가기
Python/Matplotlib

[Python] Matplotlib scatter()는 여러 데이터가 뭉치면 보기 힘든데 이 때 해결법 plt.hist2d(), plt.colorbar()

by dong_su 2023. 11. 20.

Scatter는, 여러 데이터가 한 군데에 뭉치면 육안으로 판단하기 어렵다. 

 

해결법 : hist2d() 이용 -> 밀도를 나타내는데 좋다.

plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20)
plt.colorbar()

plt.title("배기량과 연비의 관계")
plt.xlabel("배기량 (L)")
plt.ylabel("연비 (mpg)")

plt.show()

plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20)

-> data = 시각화 할 데이터(DataFrame 이어야 한다)

-> x, y = x축, y축에 표시할 데이터 

-> cmin = 색상 맵 기준 표시되는 최소 데이터 빈도(작을수록 더 낮은 빈도의 데이터도 시각화 포함) 

-> cmap = 색상 맵 지정, 색상 맵은 데이터 값의 크기를 색상으로 나타나는 데 사용된다(기본값 : viridis)

-> bins = 구간 개수(기본값 10개)


plt.colorbar()

-> 색상 막대를 추가하는 함수로,  데이터 값에 대한 색상을 알려준다.

-> plt.legend()와 비슷하게 시각적인 요소를 추가하며 차트 해석에 도움을 준다.