728x90
반응형

정확도 2

[pythonML] classification Metrics (분류 평가지표)

분류는 2개의 결괏값만 가지는 이진분류와, 여러 개의 결괏값을 가지는 다중 분류로 나뉠 수 있다. 정밀도 재현율 F1 score ROC AUC 이 네 가지 지표는 다중분류보다 이중 분류에서 중요하게 강조하는 지표이다. 1. 정확도 (Accuracy) 정확도는 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표이다. 하지만 이진 분류의 경우 데이터의 구성에 따라 모델의 성능을 왜곡할 수 있기 때문에 정확도 수치 하나만 가지고 성능을 평가하지는 않는다. ex) 타이타닉 탑승객이 여자인 경우에 생존 확률이 높은 경우 (여 90 남 10) 무조건 성별이 여자는 생존, 남자는 사망으로 예측해도 정확도가 높은 수치가 나올 수 있다. → 즉, 정확도는 불균형한(Imbalanced) 레이블 값 분포에서는 적합..

pythonML 2023.01.26

[pythonML] 데이터셋분리/학습/예측/평가 - 붓꽃 품종 예측

사이킷런(Scikit-learn)은 파이썬에서 사용할 수 있는 강력한 머신러닝 라이브러리입니다. 사이킷런은 다양한 머신러닝 알고리즘과 유틸리티 함수들을 제공하여 데이터 분석과 예측 모델링을 쉽게 할 수 있도록 도와줍니다. 분류(Classification)는 지도학습(Supervised Learning)의 한 종류로, 주어진 데이터를 미리 정의된 클래스 레이블 중 하나로 분류하는 문제를 말합니다. 이를 위해 분류 모델은 입력 데이터와 해당 데이터의 정답인 클래스 레이블 사이의 관계를 학습하여 새로운 데이터에 대한 클래스를 예측합니다. 붓꽃이란? 붓꽃은 세포핵을 둘러싼 꽃받침(sepal)과 꽃잎(petal)으로 구성되어 있으며, 이러한 특징을 기반으로 붓꽃의 품종을 식별할 수 있습니다. 붓꽃의 품종은 주로 ..

pythonML 2022.02.22
728x90
반응형