여러 데이터 프레임의 컬럼명이 같다면 하나의 데이터 프레임으로 합칠 수 있다.
-> pd.concat([ 데이터 프레임 1 , 데이터 프레임 2, ... , ])
공통되는 컬럼을 기준으로 합치는 방법
-> pd.merge(데이터 프레임 1, 데이터 프레임 2, on=공통 컬럼, how=left or right)
on = 공통되는 컬럼명
how = 데이터 프레임 1과 데이터 프레임 2가 행의 개수가 다를 경우, 첫번째 인자에 오는 데이터프레임(left)과 두번째 인자에 오는 데이터프레임(right) 중 어떤 데이터프레임의 행 개수를 기준으로 할건지
ex) pd.merge(행 개수 10개, 행 개수 9개, on=공통 컬럼, how = left)
-> how가 left기 때문에 행 개수 10개의 dataframe 생성, 행 개수 9개의 dataframe이 가지고 있지 않은 값은 NaN으로 됨.
merge()는 딱 2개의 데이터 프레임만 합칠 수 있다.
'Python > Pandas' 카테고리의 다른 글
[Python] DataFrame 원하는 컬럼에서만 NaN 값 삭제하는 법 subset (0) | 2023.11.18 |
---|---|
[Python] DataFrame csv파일 읽어온 데이터에 Unnamed가 있을 때 index_col (0) | 2023.11.18 |
[Python] DataFrame 오름차순, 내림차순 하는 법 sort_values(), ascending (0) | 2023.11.18 |
[Python] DataFrame 데이터 엑세스 시 부등식 조합하는 방법 & , | (0) | 2023.11.18 |
[Python] DataFrame 조건이 있을 때, 함수를 이용하는 법 apply() (0) | 2023.11.18 |