본문 바로가기
Python/Pandas

[Python] DataFrame 값이 NaN인 데이터 처리 방법 isna(), dropna(), fillna()

by dong_su 2023. 11. 18.

값이 NaN인 요소가 3개 있는 데이터

-> isna()은 NaN인 요소는 True, 아닌 요소는 False로 나온다

-> sum()은 더한다는 함수인데, True는 1, False는 0이기 때문에 True(NaN)인 개수를 알 수 있다.

sum()을 한번 했을때는 각 컬럼의 NaN의 개수가 나오고, 한번 더 하면 모든 컬럼의 NaN의 개수를 알려준다.

 

isna()의 값과 반대로 나오는 notna() 함수

-> notna()는 isna()과는 반대로, NaN인 요소는 False, 아닌 요소는 True로 나온다.


방법 1 : 삭제(NaN이 있는 행)

NaN 값이 있는 행이 다 삭제되어 store 2만 남은 상태

-> 변수.dropna()

 

방법 2 : 특정 값으로 채움

NaN을 "없음"으로 채운 상태

-> 변수.fillna(채울 값)

 

채우는 방법 중, 각 컬럼별 평균값, 최소값, 최대값으로 채우기

각 컬럼의 평균 구하는 법

-> 평균 = mean(), 최소값 = min(), 최대값 = max()

fillna() 인자에 각 컬럼 평균을 넣은 모습
fillna() 인자에 각 컬럼의 최소값을 넣은 모습
fillna() 인자에 각 컬럼의 최대값을 넣은 모습