728x90
반응형

dataframe 3

[python] pandas stack / unstack

# stack / unstack의 형태 dataframe.stack(level = -1, dropna = True) dataframe.stack(level = -1, dropna = True) level : default 값은 -1입니다. 하나의 index 혹은 columns를 쌓을 수준입니다. (한 번에 여러 level을 선택할 수 없습니다.) dropna : default 값은 True 입니다. False로 설정할 경우, nan 값이 출력됩니다. - stack : 칼럼을 인덱스로! 파라미터 level: stack을 수행할 인덱스 레벨을 지정합니다. 여러 개의 레벨을 지정할 수 있으며, 이 경우 데이터프레임이 멀테인덱스를 가지게 됩니다. 기본값은 -1로, 마지막 인덱스 레벨을 사용합니다. dropna:..

python 2023.03.27

[python] dataframe groupby / pivot tabel

gropuby 함수는 저어엉말 자주 사용한다. 그룹별로 어떤 특징을 갖는지 알고 싶을때 주로 사용하는 것 같다. 먼저 이번 포스팅에 예시로 사용할 df_last부터 살펴보자 df_last df_last 는 보다시피 "지역명", "분양가격", "평당분양가격" 으로 이루어진 데이터이다. 만약 지역별로 분양가격과 평당분양가격이 궁금하다면? groupby 함수를 이용해서 구할 수 있다. 지역별 분양가격과 평당분양가격의 평균 df_last.groupby(['지역명']).mean()[['분양가격','평당분양가격']] 결과를 살펴보니 강원의 분양가격의 평균은 2391만원, 평당분양가격은 7890만원이다. 이런식으로 값을 구하면 어떤 지역에 분양가격이 가장 비싼지, 저렴한지를 알 수 있다. sort_values 함수를..

python 2023.03.27

[python] dataframe replace / rename / value_counts / unique / nunique

머신러닝 전처리 하면서 매번 사용하는 함수들을 정리해 보았다. 할 때마다 기억 안 나서 검색 검색 또 검색 맨날 검색 검색 해서^^ 일주일에 한 번은 꼭 사용하는 것 같은데 왜 기억을 못 하니...... 휴 절레절레 1. replace : 문자열을 변경해 주는 함수 1.1 특정 피처에서 전체 값을 변경할 경우 1.2 특정 피처에서 일부 값만 변경할 경우 1.3 특정 피처가 아닌 전체 데이터셋에서 전체 값을 변경할 경우 2. rename : 피처명(칼럼명)을 변경해 주는 함수 3. value_counts : 고윳값과 고윳값의 개수를 출력해 주는 함수 4. unique : 고윳값의 종류를 출력해 주는 함수 5. nunique : 고윳값 종류의 수를 출력해 주는 함수 1. replace : 문자열을 변경해 주..

python 2023.03.25
728x90
반응형