[오류Error] 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte

2022. 5. 21. 00:52·오류Error
728x90
반응형

문제 상황

Python의 Pandas 라이브러리를 사용하여 CSV 파일을 불러오는 과정에서 다음과 같은 인코딩 오류가 발생했습니다.

train = pd.read_csv("산림청 산림항공본부_진화헬기 투입 산불건수_20201231.csv", encoding="UTF-8")


오류 원인

이 오류는 파일이 UTF-8이 아닌 다른 인코딩 방식으로 저장되었을 때 발생합니다. 한국에서 많이 사용되는 인코딩 방식 중 하나인 CP949로 파일이 저장된 경우, UTF-8로 읽으려고 할 때 이런 문제가 발생할 수 있습니다.

 


해결 방법

파일의 인코딩을 'UTF-8'에서 'cp949' 로 지정하여 파일을 올바르게 읽을 수 있습니다. 코드는 다음과 같이 수정할 수 있습니다.

train = pd.read_csv("산림청 산림항공본부_진화헬기 투입 산불건수_20201231.csv", encoding="cp949")


이 변경을 통해 파일을 정상적으로 불러올 수 있으며, 데이터 분석을 계속 진행할 수 있습니다.

 

결론

파일을 다룰 때는 항상 올바른 인코딩 방식을 사용하는 것이 중요합니다. 인코딩 문제는 데이터 손실을 초래할 수 있으므로, 오류 메시지를 정확히 해석하고 적절히 대응하는 것이 필요합니다.

728x90
반응형
저작자표시 (새창열림)

'오류Error' 카테고리의 다른 글

[오류Error] VS Code Remote-SSH: "원격 호스트가 VS Code Server를 실행하기 위한 필수 구성 요소를 충족하지 않습니다" 오류 해결 후기  (7) 2025.04.11
[오류Error] Resource punkt_tab not found. Please use the NLTK Downloader to obtain the resource:  (0) 2024.11.22
[오류Error] FileNotFoundError: [Errno 2] JVM DLL not found: /Library/Java/JavaVirtualMachines/microsoft-11.jdk/Contents/Home/lib/jli/libjli.dylib"  (1) 2024.11.15
[오류Error] RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same  (0) 2024.04.17
[오류Error] exception: install mecab in order to use it: http://konlpy.org/en/latest/install/  (0) 2024.02.08
'오류Error' 카테고리의 다른 글
  • [오류Error] Resource punkt_tab not found. Please use the NLTK Downloader to obtain the resource:
  • [오류Error] FileNotFoundError: [Errno 2] JVM DLL not found: /Library/Java/JavaVirtualMachines/microsoft-11.jdk/Contents/Home/lib/jli/libjli.dylib"
  • [오류Error] RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same
  • [오류Error] exception: install mecab in order to use it: http://konlpy.org/en/latest/install/
ISFP의 블로그
ISFP의 블로그
이건 첫 번째 레슨, 업무에서 마주친 문제 해결 경험 공유하기 이건 두 번째 레슨, 개인적으로 공부한 데이터/AI 지식을 기록하기 이건 세 번째 레슨, 다른 사람과 비교하지 말고 오직 어제의 나와 비교하기
  • ISFP의 블로그
    resultofeffort
    ISFP의 블로그
  • 전체
    오늘
    어제
    • 분류 전체보기 (117)
      • python (25)
      • pythonML (27)
      • Linux (0)
      • 오류Error (8)
      • information (7)
      • Deep learning (5)
      • pytorch (29)
      • 코딩테스트 (4)
      • 밑바닥 DL (4)
      • 논문 리뷰 (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    오블완
    deeplearning
    티스토리챌린지
    딥러닝
    Pandas
    분류
    토큰화
    인공지능
    Python
    machinelearning
    텍스트전처리
    머신러닝
    Ai
    Deep Learning
    konlpy
    자연어처리
    cnn
    데이터분석
    nlp
    pytorch
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
ISFP의 블로그
[오류Error] 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte
상단으로

티스토리툴바