728x90
반응형

전체 글 112

[python] Class, __init__, 상속

# 함수를 사용하지 않은경우 메이플스토리로 예시를 들어보자면 D_name = "듀얼블레이드" D_HP = 1000 D_MP = 200 print("{0} 캐릭터가 생성되었습니다.".format(D_name)) print("체력 {0}, 공격력 {1}".format(D_HP,D_MP)) 듀얼블레이드 캐릭터가 생성되었습니다. 체력 1000, 공격력 200 A_name = "아델" A_HP = 900 A_MP = 150 print("{0} 캐릭터가 생성되었습니다.".format(A_name)) print("체력 {0}, 공격력 {1}".format(A_HP,A_MP)) 아델 캐릭터가 생성되었습니다. 체력 900, 공격력 150 # 함수를 사용한 경우 위와 같은 코드를 함수를 이용해서 간략하게 작성을 해보면 d..

python 2023.02.15

[Deep learning] Callback 함수

ModelCheckpoint(filepath, monitor='val_loss', verbose=0, save_best_only=False, save_weights_only=False, mode='auto', period=1) : 특정 조건에 맞춰서 모델을 파일로 저장함 filepath: filepath는 (on_epoch_end에서 전달되는) epoch의 값과 logs의 키로 채워진 이름 형식 옵션을 가질 수 있음. (ex. weights.{epoch:02d}-{val_loss:.2f}.hdf5) monitor: 모니터할 지표(loss 또는 평가 지표) save_best_only: 가장 좋은 성능을 나타내는 모델만 저장할 여부 save_weights_only: Weights만 저장할 지 여부 (True..

Deep learning 2023.02.06

[pythonML] classification Metrics (분류 평가지표)

분류는 2개의 결괏값만 가지는 이진분류와, 여러 개의 결괏값을 가지는 다중 분류로 나뉠 수 있다. 정밀도 재현율 F1 score ROC AUC 이 네 가지 지표는 다중분류보다 이중 분류에서 중요하게 강조하는 지표이다. 1. 정확도 (Accuracy) 정확도는 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표이다. 하지만 이진 분류의 경우 데이터의 구성에 따라 모델의 성능을 왜곡할 수 있기 때문에 정확도 수치 하나만 가지고 성능을 평가하지는 않는다. ex) 타이타닉 탑승객이 여자인 경우에 생존 확률이 높은 경우 (여 90 남 10) 무조건 성별이 여자는 생존, 남자는 사망으로 예측해도 정확도가 높은 수치가 나올 수 있다. → 즉, 정확도는 불균형한(Imbalanced) 레이블 값 분포에서는 적합..

pythonML 2023.01.26

[colab] 코랩에 csv 파일 불러오는법

여기서 사용한 타이타닉 csv 파일을 구글 드라이브에 넣는 법은 이전 포스팅에 있습니다! https://resultofeffort.tistory.com/59 [Colab] 구글 드라이브에 csv 파일 넣는법 저는 학교에 입학한 후에 Jupyter notebook 만 주로 사용을 했었습니다. 그러다 3학년이 되면서 colab을 사용하시는 교수님이 종종 계셔서 코랩을 접하게 된 거 같아요 솔직히 그땐 코랩이 너무 불편했 resultofeffort.tistory.com 이전 포스팅에서 넣은 csv 파일을 이제 코랩으로 가져와보겠습니다. # 코랩으로 csv 파일 불러오기 타이타닉 폴더에서 오른쪽 마우스 - 더보기 - Google Colaboratory 클릭 코랩 환경으로 들어오셨다면 코랩과 구글을 마운트(연결)..

information 2022.09.26

[colab] 구글 드라이브에 csv 파일 추가하는법

저는 학교에 입학한 후에 Jupyter notebook 만 주로 사용을 했었습니다. 그러다 3학년이 되면서 colab을 사용하시는 교수님이 종종 계셔서 코랩을 접하게 된 거 같아요 솔직히 그땐 코랩이 너무 불편했었습니다. 많은 사람들이 코랩이 편하다고 하는데 이해할 수 없었습니다. 구글 드라이브조차 사용할 줄 몰랐으니까요,,ㅎㅎ 그런데 구글 드라이브를 조금씩 사용하게 되면서 코랩이 왜 편한지를 점차 느끼게 된 것 같습니다. 그래서 제가 코랩을 처음 접할 때 불편했던 점과 이해하기 어려웠던 점들을 포스팅해보려 합니다.! 코랩을 설치하는 방법은 구글에 검색하시면 쉽게 찾아보실 수 있을 거예요. 꼭 코랩을 먼저 설치하셔야 합니다! # 구글 드라이브에 파일 넣는 법 먼저 구글에 접속해줍니다. 오른쪽 상단에 점 ..

information 2022.09.26

[pythonML] 회귀 트리

# 회귀 트리 :리프 노드에 속한 데이터값의 평균값을 구해 회귀 예측값을 계산 # RandomForestRegressor 로 예측 from sklearn.datasets import load_boston from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestRegressor import pandas as pd import numpy as np # 보스턴 데이터 세트 로드 boston = load_boston() bostonDF = pd.DataFrame(boston.data, columns = boston.feature_names) bostonDF['PRICE'] = boston.target ..

pythonML 2022.07.16

[pythonML] 회귀- 다항회귀

다항회귀 : 회귀가 독립변수의 단항식이 아닌 2차, 3차 방정식과 같은 다항식으로 표현되는 것 # 1차 단항식 계수를 2차 다항식 계수로 변환 from sklearn.preprocessing import PolynomialFeatures import numpy as np # 다항식으로 변환한 단항식 생성, [[0,1],[2,3]]의 2X2 행렬 생성 X = np.arange(4).reshape(2,2) print('일차 단항식 계수 feature:\n',X ) # degree = 2 인 2차 다항식으로 변환하기 위해 PolynomialFeatures를 이용하여 변환 poly = PolynomialFeatures(degree=2) poly.fit(X) poly_ftr = poly.transform(X) p..

pythonML 2022.07.16

[pythonML] 부스팅(Boosting)-LGBM(Light Gradient Boost Machine)

# LGBM 의 개요 LGBM은 일반 GBM 계열의 트리 분할 방법과 다르게 리프 중심 트리 분할 방식을 사용함. 이는 트리의 균형을 맞추지 않고 최대 손실 값을 가지는 리프 노드를 지속적으로 분할하면서 드리의 깊이가 깊어지고 비대칭적인 규칙 트리가 생성됨. 이렇게 지속적으로 분할해 생성된 규칙 트리는 학습을 반복할수록 예측 오류 손실을 최소화 할수 있음 # LGBM 의 장점 더 빠른 학습과 예측 수행 시간 더 작은 메모리 사용량 카테고리형 피처의 자동 변환과 최적의 분할 단점 : 적은 데이터 세트에 적용하면 과적합이 발생하기 쉬움 # LightGBM의 파이썬 패키지인 lightgbm에서 LGBMClassifier 임포트 from lightgbm import LGBMClassifier import pan..

pythonML 2022.07.15
728x90
반응형