본문 바로가기

Python/Matplotlib9

[Python] Matplotlib Jupyter Notebook에서 한글 처리하는 법(차트 그릴 때 한글 사용 가능 방법) 주피터 노트북 최상단에 이 코드를 복붙하고 시작한다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_.. 2023. 11. 20.
[Python] Matplotlib scatter()는 여러 데이터가 뭉치면 보기 힘든데 이 때 해결법 plt.hist2d(), plt.colorbar() Scatter는, 여러 데이터가 한 군데에 뭉치면 육안으로 판단하기 어렵다. 해결법 : hist2d() 이용 -> 밀도를 나타내는데 좋다. plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20) plt.colorbar() plt.title("배기량과 연비의 관계") plt.xlabel("배기량 (L)") plt.ylabel("연비 (mpg)") plt.show() plt.hist2d(data=df , x="displ", y="comb", cmin = 0.5, cmap="viridis_r", bins=20) -> data = 시각화 할 데이터(DataFrame 이어야 한다) -> x, y = x축, y축에 표시할 데이.. 2023. 11. 20.
[Python] Matplotlib 두 변수 간의 상관 관계를 나타내는 차트 그리는 법, 상관계수 확인하는 법 Scatter(), regplot(), pairplot(), corr() 배기량 displ(컬럼)과 연비 comb(컬럼)의 관계를 파악하고 싶다. => 비례, 반비례, 관계없음 이냐? 순서) 1. 상관분석 : 상관계수를 확인한다. 2. 차트로 확인한다. 상관계수란) 변수들간의 관련성을 의미한다. -1 ~ 1 사이의 숫자(수치), 관련 없으면 0 양수 일 경우 밀접해 있을수록 증가한다. -> displ과 comb의 상관계수 값이 마이너스이기 때문에 우하향 그래프가 나올 것이다. 차트 1 : plt의 scatter() 이용 plt.scatter(data=df, x="displ", y="comb") plt.title("Displ Vs Comb") plt.xlabel("Displacement(L)") plt.ylabel("Combined Fuel Eff (mpg)") plt.show.. 2023. 11. 20.
[Python] Matplotlib 하나의 차트 영역에 여러개의 차트 그리는 법 plt.figure(), plt.subplot() plt.figure( figsize= (12, 5) ) plt.subplot(1, 2, 1) plt.title("speed his. bins 3") plt.xlabel("Speed") plt.ylabel("# of Characters") my_bins = np.arange(5,163,3) plt.hist(data=df, x="speed", rwidth=0.8, bins=my_bins) plt.subplot(1, 2, 2) plt.title("speed his. bins 10") plt.xlabel("Speed") plt.ylabel("# of Characters") my_bins = np.arange(5, 170, 10) plt.hist(data=df, x="speed", rwidth=0.8, bins=.. 2023. 11. 19.
[Python] Matplotlib 히스토그램 그리는 법, bin 변경하는 법 plt.hist(), np.arange() 구간을 설정해, 해당 구간에 포함되는 데이터의 개수를 세어서 몇개인지 차트로 나타내는 것을 "히스토그램" 이라고 한다. 히스토그램을 이용하면 -> 데이터의 분포를 눈으로 파악이 가능하다. 구간을 bin이라고 부르고 구간이 여러 개니까 bins라고 부른다. 히스토그램은 똑같은 데이터를 가지고서 차트 모양이 전혀 다르게 나타날 수 있으므로, 해석을 잘 해야 한다. plt.hist(data=df, x="speed", rwidth=0.8, bins=my_bins) plt.show() plt.hist(data = df , x = "speed" , rwidth = 0.8 , bins = my_bins) -> data = 차트화 시킬 데이터( DataFrame 이여야 한다) -> x = x축에 나타낼 데이터의 컬럼을.. 2023. 11. 19.
[Python] Matplotlib 파이 차트(Pie Chart) 그리는 법 plt.pie(), plt.legend() 파이 차트는 데이터를 퍼센테이지(%)로 비교해서 보고 싶을 때 사용한다. (원 모양) plt.pie(df2, labels=df2.index, autopct="%.1f", startangle=90, wedgeprops={"width":0.7}) plt.legend() plt.title("Generation ID Pie Chart") plt.show() plt.pie(df2 , labels = df2.index , autopct = "%.1f" , startangle = 90 , wedgeprops = {"width" : 0.7}) -> df = 차트화 시킬 데이터 (Series 데이터여야 한다.) -> labels = 데이터의 인덱스에 해당하는 부분 -> autopct = 소수점 몇 자리 까지 표시 할 건.. 2023. 11. 19.
[Python] Matplotlib 차트 꾸미는 함수들 plt.title(), plt.xlabel(), plt.ylabel(), plt.xticks() plt.title() = 차트의 title명 지정하는 함수 plt.xlabel(), plt.ylabel() = x축 이름 지정 함수 , y축 이름 지정 함수 plt.xticks(rotation = ) = x축의 눈금을 설정하는 데 사용하는 함수, 키워드 인자 rotation(각도)에 값을 넣으면 반시계방향으로 적용된다. 예시를 위해 바 차트를 가져왔지만, 바 차트는 각 데이터가 몇개씩 있는지 차트로 나타내기 위한 것이기 때문에 보통 x,y 축 이름을 바꾸지 않는다. 2023. 11. 19.
[Python] Matplotlib 바 차트 그리는 법 sb.countplot(), sb.color_palette() 특정 컬럼이 카테고리컬 데이터일 때 각 데이터가 몇개씩 있는지를 차트로 나타내고 싶을 때 seaborn 라이브러리를 이용해 countplot()을 사용해 바 차트를 그리면 된다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb -> 사용할 라이브러리를 import 한다. df = pd.read_csv("../data/pokemon.csv") -> 데이터를 가져온다. sb.countplot(data=df, x='generation_id', color=base_color, order=base_order) # 색깔이 뒤죽박죽임 plt.show() # 메모리상태 지우기 -> sb.countplot.. 2023. 11. 19.
[Python] Matplotlib 기본적인 차트 만들기 plt.plot(), plt.show(), plt.savefig() import matplotlib.pyplot as plt import numpy as np -> 가장 먼저 필요한 라이브러리들을 import 한다. -> np.array 형태로 만들어야 한다. -> plt.plot() 사용 -> plt.savefig(파일명) = 차트를 파일로 저장하는 함수이다. 확장자(jpg 등)는 맘대로 -> plt.save() = 메모리 상태 빼고 차트만 나오게 해주는 함수이다. 2023. 11. 19.