머신러닝을 학습하고 예측하는 법 까지는 알겠는데
배운 것들을 어떻게 써먹어야 하는지도 모르겠고,, 그럴때가 있었다.
교수님께서 데이콘이라는 경진대회 플랫폼을 알려주셨지만
데이터를 다운로드 한 후 채점을 위한 제출파일은 어떻게 만드는건지
아무리 검색해봐도 나오지 않았고, 결국 헤매다 포기했었던 기억이 있다.
혹여나 나같은 사람이 또 있지 않을까 싶어서 포스팅 해보기로 결심!
나는 코랩 환경에서 실습할 것이다.
실습에 사용할 타이타닉 데이터는 데이콘에서 무료로 제공중이다.
(연습문제 풀어보라고 제공해줌)
타이타닉 생존 예측 경진대회 (참여 후 데이터 탭에서 다운로드를 클릭해서 다운 받으면 된다.)
먼저 경로를 설정해 준다.
%cd '/content/drive/MyDrive/타이타닉'
실습할 때 필요한 판다스 라이브러리와 데이터들을 불러온다.
train.csv : 모델을 학습하기 위해 사용하는 데이터이다.
test.csv : 모델을 통해 정답을 예측하기 위해 사용하는 데이터이다.
sample_submission.csv : 예측한 정답 값을 기록하여 제출하기 위한 샘플 정답 파일이다.
import pandas as pd
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
sample_submission = pd.read_csv('submission.csv')
가져온 sample_submission 파일은 target(survived)값이 0으로 채워져있다.
우리는 학습한 후 예측한 값을 sample_submission 파일에 넣어 제출하면 되는 것이다.
하지만 이번 실습에서는 학습과 예측은 하지 않을 예정이다.
제출 파일값에 예측한 값 대신에 1(생존)을 넣어 보겠다.
sample_submission['Survived'] = 1
sample_submission
.to_csv 를 이용해서 제출파일 (sample_submission) 을 저장한 후 제출하면 된다.
sample_submission.to_csv('submission.csv', index = False)
제출해보니 점수는 0.5점이 나왔다.
여러분들도 제출해보세룡
'information' 카테고리의 다른 글
[Git] git branch 생성 (0) | 2023.05.01 |
---|---|
[Git] 로컬 저장소(repository) 생성 후 원격 저장소(Github)와 연결 (0) | 2023.05.01 |
[Git] Git 설치(Window10), username / useremail 등록 (0) | 2023.04.30 |
[colab] 코랩에 csv 파일 불러오는법 (0) | 2022.09.26 |
[colab] 구글 드라이브에 csv 파일 추가하는법 (0) | 2022.09.26 |