[Python] DataFrame 값이 NaN인 데이터 처리 방법 isna(), dropna(), fillna()
-> isna()은 NaN인 요소는 True, 아닌 요소는 False로 나온다 -> sum()은 더한다는 함수인데, True는 1, False는 0이기 때문에 True(NaN)인 개수를 알 수 있다. sum()을 한번 했을때는 각 컬럼의 NaN의 개수가 나오고, 한번 더 하면 모든 컬럼의 NaN의 개수를 알려준다. -> notna()는 isna()과는 반대로, NaN인 요소는 False, 아닌 요소는 True로 나온다. 방법 1 : 삭제(NaN이 있는 행) -> 변수.dropna() 방법 2 : 특정 값으로 채움 -> 변수.fillna(채울 값) 채우는 방법 중, 각 컬럼별 평균값, 최소값, 최대값으로 채우기 -> 평균 = mean(), 최소값 = min(), 최대값 = max()
2023. 11. 18.
[Python] Pandas 데이터 생성 pd.Series(), pd.DataFrame(), ndim, size, shape, index, values
먼저 pandas 라이브러리를 import한다. import pandas as pd Pandas의 1차원 데이터를 시리즈(Series)라고 한다. 변수[해당 index명 or 해당 index] = 해당하는 index의 value 반환 (딕셔너리 타입에서 key로 value를 구하는 것과 비슷하다.) 관련 함수들 ndim = 차원 반환 size = 총 데이터 개수 반환 shape = 모양(ex = (4,)) 반환 index = 모든 index명 반환 values = 모든 value값 반환 Pandas의 2차원 데이터를 데이터프레임(DataFrame)이라고 한다. Series 데이터와 마찬가지로 ndim,size,shape,index,values 등 함수 사용 가능. 행 = index , 열 = column..
2023. 11. 18.