728x90
반응형

python 24

[python] stack & unstack

damn = pd.DataFrame({'대청':[36.477629,127.480822], '용담':[35.945119,127.524596], '보령':[36.248082,126.645782], '밀양':[35.462742,128.928952], '보현산':[36.126778,128.949904]}) damn stack : 컬럼(column) => 인덱스(index) 컬럼에 있는 댐이름들을 인덱스로 옮김 damn.stack() 0 대청 36.477629 용담 35.945119 보령 36.248082 밀양 35.462742 보현산 36.126778 1 대청 127.480822 용담 127.524596 보령 126.645782 밀양 128.928952 보현산 128.949904 dtype: float64 un..

python 2022.05.19

[python] axis=0 axis=1

매번 헷갈려서 적어보는 포스팅.......................... axis=1은 행방향(가로방향) 인데 drop함수(열방향)에서만 예외다 라고 외워야 겠다................ import pandas as pd df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) df # mean, sum, max, min 등등 에서 axis=1 은 행방향(가로방향) df.mean(axis=1) # 행의 평균 (가로) 0 1.0 1 2.0 2 3.0 dtype: float64 # drop 에서 axis=1 은 열방향(세로방향) df.drop('col1', axis=1) ..

python 2022.04.18

[python] DataFrame 생성하기/ 넘파이 ndarray, 리스트, 딕셔너리로 변환하기

1. 넘파이 ndarray, 리스트, 딕셔너리를 => DataFrame으로 변환하기 1.1 리스트 list= > dataframe으로 변환 df_list2=pd.DataFrame([[1,2,3],[11,12,13]],columns=['col1','col2','col3']) df_list2 1.2 ndarray = > dataframe으로 변환 df_array2=pd.DataFrame(np.array([[1,2,3],[11,12,13]]), columns=col_name2) df_array2 1.3 딕셔너리 = > dataframe으로 변환 # key => 문자열 칼럼명, value=> 칼럼 데이터로 매핑 dict={'col1':[1,11], 'col2': [2,22], 'col3': [3,33]} df_..

python 2022.03.24

[python] groupby절

df_last 데이터로 groupby를 해보겠다 # 지역별로 groupby 한 결과를 살펴보면 for gp, df in df_last.groupby(['지역명']): gp df # 지역별로 groupby를 한 후 분양가격의 column만 추출 for gp,sr in df_last.groupby(['지역명'])['분양가격']: gp sr # 지역별 분양가격의 평균 df_last.groupby(['지역명'])['분양가격'].mean() # 전용면적, 지역별 평당분양가격 df_last.groupby(["전용면적", "지역명"])["평당분양가격"].mean()

python 2022.03.23

[python] object 형 => numerical 형태로 변경해주는 to_numeric 함수

df_last["분양가격(㎡)"] * 3.3 이라는 식을 계산해야 하는데 df_last["분양가격(㎡)"]의 type이 object이기 때문에 오류가 발생함. int 나 float 형태가 아니기 때문에 3.3을 곱할 수 가 없는거임 그래서 int나 float으로 바꿔줘야해 to_numeric을 이용하여 숫자형식으로 변경 df_last["분양가격(㎡)"] #변경전 object타입 0 5841 1 5652 2 5882 3 5721 4 5879 ... 4330 3882 4331 NaN 4332 3898 4333 NaN 4334 3601 Name: 분양가격(㎡), Length: 4335, dtype: object df_last["분양가격"] = pd.to_numeric(df_last["분양가격(㎡)"], err..

python 2022.03.22

[python] 결정 트리 시각화 Graphviz 설치

결정 트리 알고리즘이 어떠한 규칙을 가지고 트리를 생성하는지 시각적으로 보기 위해 Graphviz 을 설치합니다. Graphviz는 파이썬으로 개발된 패키지가 아니기 때문에 파이썬 기반의 모듈과 인터페이스 해주기 위해서 Graphviz를 설치한 후 파이썬과 인터페이스 할 수 있는 파이썬 래퍼(Wrapper)모듈을 별도로 설치해야 합니다. 1. https://graphviz.org/download/ 에서 운영체제에 맞는 설치 파일을 다운로드하여 설치합니다. 2. 설치 후 Anaconda Prompt 을 관리자 권한으로 들어간 후 Graphviz 파이썬 래퍼 (wrapper) 모듈을 설치합니다. pip 명령어를 사용하여 graphviz 모듈을 설치합니다. (pip install graphviz 를 입력) 3..

python 2022.03.20
728x90
반응형