[python] 결측값(null/nan) 개수/ 존재 구하는 방법

2023. 3. 18. 01:07·python
728x90
반응형
df_last = pd.read_csv("data/분양가격13_15.csv", encoding="cp949")

df_last 데이터는 13년도부터 15년도까지의 지역/규모/연도/월/분양가격 정보가 포함된 데이터이다.

 

.isnull() 함수를 이용하면 결측값의 유/무를 True/False로 출력이 된다. 

해당 값이 결측값이라면 True가 결측값이 아니라면 False로 출력이 된다.

df_last.isnull()

 

.isnull().sum() 함수를 이용하면 True/False가 아닌 각 열의 결측치의 개수가 출력된다. 직관적으로 결측치가 칼럼마다 몇 개씩 존재하는지를 출력해 주기 때문에 자주 사용한다.

df_last.isnull().sum()

특정 칼럼 null값의 개수 구하기

df_last 데이터셋에서 분양가격(m) 칼럼에 존재하는 null값의 개수를 구하는 두 가지 방법이다.

df_last["분양가격(㎡)"].isnull().sum()
nan_cnt=0
for x in df_last["분양가격(㎡)"]:
    if x!=x:
        nan_cnt+=1
nan_cnt

# 결측값 중앙값으로 채우기
for i in X_train.describe().columns :
	X_train[i] = X_train[i].fillna(X_train[i].median())
  X_test[i] = X_test[i].fillna(X_test[i].median())

# 결측값 0으로 채우기
for i in X_train.describe().columns :
	X_train[i] = X_train[i].fillna(0)
  X_test[i] = X_test[i].fillna(0)

#  결측값 평균으로 채우기
for i in X_train.describe().columns :
	 X_train[i] = X_train[i].fillna(X_train[i].mean())
	 X_test[i] = X_test[i].fillna(X_test[i].mean())

# 결측값 이전값으로 채우기
for i in X_train.describe().columns :
	 X_train[i] = X_train[i].fillna(method='ffill')
   X_test[i] = X_test[i].fillna(method='ffill')
728x90
반응형
저작자표시 (새창열림)

'python' 카테고리의 다른 글

[python] dataframe replace / rename / value_counts / unique / nunique  (0) 2023.03.25
[python] matplotlib - plt.bar (xlabel / ylabel / xticks / yticks / legend)  (0) 2023.03.24
[python] Class, __init__, 상속  (0) 2023.02.15
[python] apply lambda  (0) 2022.05.30
[python] reset_index( )  (0) 2022.05.30
'python' 카테고리의 다른 글
  • [python] dataframe replace / rename / value_counts / unique / nunique
  • [python] matplotlib - plt.bar (xlabel / ylabel / xticks / yticks / legend)
  • [python] Class, __init__, 상속
  • [python] apply lambda
ISFP의 블로그
ISFP의 블로그
이건 첫 번째 레슨, 업무에서 마주친 문제 해결 경험 공유하기 이건 두 번째 레슨, 개인적으로 공부한 데이터/AI 지식을 기록하기 이건 세 번째 레슨, 다른 사람과 비교하지 말고 오직 어제의 나와 비교하기
  • ISFP의 블로그
    resultofeffort
    ISFP의 블로그
  • 전체
    오늘
    어제
    • 분류 전체보기 (117)
      • python (25)
      • pythonML (27)
      • Linux (0)
      • 오류Error (8)
      • information (7)
      • Deep learning (5)
      • pytorch (29)
      • 코딩테스트 (4)
      • 밑바닥 DL (4)
      • 논문 리뷰 (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Ai
    토큰화
    딥러닝
    cnn
    Deep Learning
    pytorch
    nlp
    인공지능
    데이터분석
    konlpy
    Pandas
    오블완
    deeplearning
    machinelearning
    텍스트전처리
    머신러닝
    자연어처리
    티스토리챌린지
    분류
    Python
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
ISFP의 블로그
[python] 결측값(null/nan) 개수/ 존재 구하는 방법
상단으로

티스토리툴바