구간을 설정해, 해당 구간에 포함되는 데이터의 개수를 세어서 몇개인지 차트로 나타내는 것을 "히스토그램" 이라고 한다.
히스토그램을 이용하면 -> 데이터의 분포를 눈으로 파악이 가능하다.
구간을 bin이라고 부르고 구간이 여러 개니까 bins라고 부른다.
히스토그램은 똑같은 데이터를 가지고서 차트 모양이 전혀 다르게 나타날 수 있으므로, 해석을 잘 해야 한다.
plt.hist(data=df, x="speed", rwidth=0.8, bins=my_bins)
plt.show()
plt.hist(data = df , x = "speed" , rwidth = 0.8 , bins = my_bins)
-> data = 차트화 시킬 데이터( DataFrame 이여야 한다)
-> x = x축에 나타낼 데이터의 컬럼을 넣는다.
-> rwidth = 구간(bin)끼리의 거리 (작을수록 멀어짐)
-> bins = 구간의 개수 (설정하지 않으면 bin 기본값은 10개)
-> 구간(bin) 변경 하는 법
np.arange(최소값, 최대값, 간격)사용한다.