728x90
반응형

예측 3

[pythonML] 정밀도와 재현율 - 평가

# 평가 지표 -회귀 평균 오차 -분류 정확도 오차행렬 정밀도 재현율 F1스코어 ROC AUC 3. 정밀도와 재현율 (Precision과 Recall) 불균형한 데이터 세트에서 정확도보다 더 선호되는 평가 지표 positive 데이터 세트의 예측 성능에 초점을 맞춘 평가 지표 재현율과 정밀도 모두 TP를 높이는 데 동일한 초점임 BUT 재현율은 FN을 낮추고, 정밀도는 FP를 낮추는데 초점 가장 좋은 성능 평가는 재현율, 정밀도 모두 높은 수치를 얻는 것. 반면 둘 중 하나만 높고 하나만 낮은 결과일 경우 바람직하지 않음) 정밀도 = TP / (FP +TP ) 정밀도가 더 중요한 경우 : 실제 Negative 음성인 데이터 예측을 Positive 양성으로 잘못 판단하게 될 경우 ( ex. 스팸메일이 아닌..

pythonML 2022.07.11

[pythonML] 회귀- LinearRegression

# LinearRegression 클래스 LinearRegression 클래스는 예측값과 실제값의 RSS 를 최소화해 OLS 추정 방식으로 구현한 클래스이다. class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True,n_jobs=1) -입력파라미터 fit_intercept : intercept(절편) 값을 계산할 것인지 말지를 지정함. (False이면 y축좌표가 0) normalize: True이면 회귀를 수행하기 전에 데이터 세트를 정규화 함. -속성 coef_ : fit() 메서드를 수행했을 때 회귀 계수가 배열 형태로 저장되는 속성. shape =( Target값 개수, 피처 개수) inte..

pythonML 2022.05.09

[pythonML] 데이터셋분리/학습/예측/평가 - 붓꽃 품종 예측

사이킷런(Scikit-learn)은 파이썬에서 사용할 수 있는 강력한 머신러닝 라이브러리입니다. 사이킷런은 다양한 머신러닝 알고리즘과 유틸리티 함수들을 제공하여 데이터 분석과 예측 모델링을 쉽게 할 수 있도록 도와줍니다. 분류(Classification)는 지도학습(Supervised Learning)의 한 종류로, 주어진 데이터를 미리 정의된 클래스 레이블 중 하나로 분류하는 문제를 말합니다. 이를 위해 분류 모델은 입력 데이터와 해당 데이터의 정답인 클래스 레이블 사이의 관계를 학습하여 새로운 데이터에 대한 클래스를 예측합니다. 붓꽃이란? 붓꽃은 세포핵을 둘러싼 꽃받침(sepal)과 꽃잎(petal)으로 구성되어 있으며, 이러한 특징을 기반으로 붓꽃의 품종을 식별할 수 있습니다. 붓꽃의 품종은 주로 ..

pythonML 2022.02.22
728x90
반응형