information

[Dacon] 데이콘에 csv 파일 제출하는 법

독립성이 강한 ISFP 2023. 2. 21. 23:23
728x90
반응형

머신러닝을 학습하고 예측하는 법 까지는 알겠는데
배운 것들을 어떻게 써먹어야 하는지도 모르겠고,, 그럴때가 있었다.
교수님께서 데이콘이라는 경진대회 플랫폼을 알려주셨지만

데이터를 다운로드 한 후 채점을 위한 제출파일은 어떻게 만드는건지
아무리 검색해봐도 나오지 않았고, 결국 헤매다 포기했었던 기억이 있다.
혹여나 나같은 사람이 또 있지 않을까 싶어서 포스팅 해보기로 결심!

나는 코랩 환경에서 실습할 것이다.

실습에 사용할 타이타닉 데이터는 데이콘에서 무료로 제공중이다.
(연습문제 풀어보라고 제공해줌)

타이타닉 생존 예측 경진대회 (참여 후 데이터 탭에서 다운로드를 클릭해서 다운 받으면 된다.)

 

타이타닉 생존 예측 경진대회 - DACON

분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.

dacon.io


먼저 경로를 설정해 준다.

%cd '/content/drive/MyDrive/타이타닉'



실습할 때 필요한 판다스 라이브러리와 데이터들을 불러온다.

train.csv : 모델을 학습하기 위해 사용하는 데이터이다.
test.csv : 모델을 통해 정답을 예측하기 위해 사용하는 데이터이다.
sample_submission.csv : 예측한 정답 값을 기록하여 제출하기 위한 샘플 정답 파일이다.

import pandas as pd

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
sample_submission = pd.read_csv('submission.csv')

가져온 sample_submission 파일은 target(survived)값이 0으로 채워져있다.

우리는 학습한 후 예측한 값을 sample_submission 파일에 넣어 제출하면 되는 것이다.
하지만 이번 실습에서는 학습과 예측은 하지 않을 예정이다.
제출 파일값에 예측한 값 대신에 1(생존)을 넣어 보겠다.

sample_submission['Survived'] = 1
sample_submission


.to_csv 를 이용해서 제출파일 (sample_submission) 을 저장한 후 제출하면 된다.

sample_submission.to_csv('submission.csv', index = False)

제출해보니 점수는 0.5점이 나왔다. 

여러분들도 제출해보세룡

728x90
반응형