728x90
반응형

분류 전체보기 113

[Dacon] 데이콘에 csv 파일 제출하는 법

머신러닝을 학습하고 예측하는 법 까지는 알겠는데 배운 것들을 어떻게 써먹어야 하는지도 모르겠고,, 그럴때가 있었다. 교수님께서 데이콘이라는 경진대회 플랫폼을 알려주셨지만 데이터를 다운로드 한 후 채점을 위한 제출파일은 어떻게 만드는건지 아무리 검색해봐도 나오지 않았고, 결국 헤매다 포기했었던 기억이 있다. 혹여나 나같은 사람이 또 있지 않을까 싶어서 포스팅 해보기로 결심! 나는 코랩 환경에서 실습할 것이다. 실습에 사용할 타이타닉 데이터는 데이콘에서 무료로 제공중이다. (연습문제 풀어보라고 제공해줌) 타이타닉 생존 예측 경진대회 (참여 후 데이터 탭에서 다운로드를 클릭해서 다운 받으면 된다.) 타이타닉 생존 예측 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능..

information 2023.02.21

[python] Class, __init__, 상속

# 함수를 사용하지 않은경우 메이플스토리로 예시를 들어보자면 D_name = "듀얼블레이드" D_HP = 1000 D_MP = 200 print("{0} 캐릭터가 생성되었습니다.".format(D_name)) print("체력 {0}, 공격력 {1}".format(D_HP,D_MP)) 듀얼블레이드 캐릭터가 생성되었습니다. 체력 1000, 공격력 200 A_name = "아델" A_HP = 900 A_MP = 150 print("{0} 캐릭터가 생성되었습니다.".format(A_name)) print("체력 {0}, 공격력 {1}".format(A_HP,A_MP)) 아델 캐릭터가 생성되었습니다. 체력 900, 공격력 150 # 함수를 사용한 경우 위와 같은 코드를 함수를 이용해서 간략하게 작성을 해보면 d..

python 2023.02.15

[Deep learning] Callback 함수

ModelCheckpoint(filepath, monitor='val_loss', verbose=0, save_best_only=False, save_weights_only=False, mode='auto', period=1) : 특정 조건에 맞춰서 모델을 파일로 저장함 filepath: filepath는 (on_epoch_end에서 전달되는) epoch의 값과 logs의 키로 채워진 이름 형식 옵션을 가질 수 있음. (ex. weights.{epoch:02d}-{val_loss:.2f}.hdf5) monitor: 모니터할 지표(loss 또는 평가 지표) save_best_only: 가장 좋은 성능을 나타내는 모델만 저장할 여부 save_weights_only: Weights만 저장할 지 여부 (True..

Deep learning 2023.02.06

[pythonML] classification Metrics (분류 평가지표)

분류는 2개의 결괏값만 가지는 이진분류와, 여러 개의 결괏값을 가지는 다중 분류로 나뉠 수 있다. 정밀도 재현율 F1 score ROC AUC 이 네 가지 지표는 다중분류보다 이중 분류에서 중요하게 강조하는 지표이다. 1. 정확도 (Accuracy) 정확도는 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표이다. 하지만 이진 분류의 경우 데이터의 구성에 따라 모델의 성능을 왜곡할 수 있기 때문에 정확도 수치 하나만 가지고 성능을 평가하지는 않는다. ex) 타이타닉 탑승객이 여자인 경우에 생존 확률이 높은 경우 (여 90 남 10) 무조건 성별이 여자는 생존, 남자는 사망으로 예측해도 정확도가 높은 수치가 나올 수 있다. → 즉, 정확도는 불균형한(Imbalanced) 레이블 값 분포에서는 적합..

pythonML 2023.01.26

[colab] 코랩에 csv 파일 불러오는법

여기서 사용한 타이타닉 csv 파일을 구글 드라이브에 넣는 법은 이전 포스팅에 있습니다! https://resultofeffort.tistory.com/59 [Colab] 구글 드라이브에 csv 파일 넣는법 저는 학교에 입학한 후에 Jupyter notebook 만 주로 사용을 했었습니다. 그러다 3학년이 되면서 colab을 사용하시는 교수님이 종종 계셔서 코랩을 접하게 된 거 같아요 솔직히 그땐 코랩이 너무 불편했 resultofeffort.tistory.com 이전 포스팅에서 넣은 csv 파일을 이제 코랩으로 가져와보겠습니다. # 코랩으로 csv 파일 불러오기 타이타닉 폴더에서 오른쪽 마우스 - 더보기 - Google Colaboratory 클릭 코랩 환경으로 들어오셨다면 코랩과 구글을 마운트(연결)..

information 2022.09.26

[colab] 구글 드라이브에 csv 파일 추가하는법

저는 학교에 입학한 후에 Jupyter notebook 만 주로 사용을 했었습니다. 그러다 3학년이 되면서 colab을 사용하시는 교수님이 종종 계셔서 코랩을 접하게 된 거 같아요 솔직히 그땐 코랩이 너무 불편했었습니다. 많은 사람들이 코랩이 편하다고 하는데 이해할 수 없었습니다. 구글 드라이브조차 사용할 줄 몰랐으니까요,,ㅎㅎ 그런데 구글 드라이브를 조금씩 사용하게 되면서 코랩이 왜 편한지를 점차 느끼게 된 것 같습니다. 그래서 제가 코랩을 처음 접할 때 불편했던 점과 이해하기 어려웠던 점들을 포스팅해보려 합니다.! 코랩을 설치하는 방법은 구글에 검색하시면 쉽게 찾아보실 수 있을 거예요. 꼭 코랩을 먼저 설치하셔야 합니다! # 구글 드라이브에 파일 넣는 법 먼저 구글에 접속해줍니다. 오른쪽 상단에 점 ..

information 2022.09.26

[pythonML] 회귀 트리

# 회귀 트리 :리프 노드에 속한 데이터값의 평균값을 구해 회귀 예측값을 계산 # RandomForestRegressor 로 예측 from sklearn.datasets import load_boston from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestRegressor import pandas as pd import numpy as np # 보스턴 데이터 세트 로드 boston = load_boston() bostonDF = pd.DataFrame(boston.data, columns = boston.feature_names) bostonDF['PRICE'] = boston.target ..

pythonML 2022.07.16

[pythonML] 회귀- 다항회귀

다항회귀 : 회귀가 독립변수의 단항식이 아닌 2차, 3차 방정식과 같은 다항식으로 표현되는 것 # 1차 단항식 계수를 2차 다항식 계수로 변환 from sklearn.preprocessing import PolynomialFeatures import numpy as np # 다항식으로 변환한 단항식 생성, [[0,1],[2,3]]의 2X2 행렬 생성 X = np.arange(4).reshape(2,2) print('일차 단항식 계수 feature:\n',X ) # degree = 2 인 2차 다항식으로 변환하기 위해 PolynomialFeatures를 이용하여 변환 poly = PolynomialFeatures(degree=2) poly.fit(X) poly_ftr = poly.transform(X) p..

pythonML 2022.07.16
728x90
반응형