728x90
반응형
bar(막대) 그래프는 범주가 있는 데이터 값을 직사각형의 막대로 표현하는 그래프입니다.
Matplotlib 에서는 matplotlib.pyplot 모듈의 bar() 함수를 이용해서 막대그래프를 간단하게 표현할 수 있습니다.
train 데이터셋은 Transported 가 True인지 False인지를 예측하는 문제입니다.
Transported 피처에서 True, False 가 각각 몇 개씩 분포하고 있는지를 bar 그래프로 표현해 보려합니다.
train.head()
value_counts 함수를 사용하면 Transported의 고유값이 몇 개씩 존재하는지 수치로 확인할 수 있습니다.
True는 4378개, False는 4315개씩 존재하네요.
train['Transported'].value_counts().values
수치로 나온 결과를 보기 쉽게 그래프를 이용해서 그려보겠습니다.
x축_값 = np.arange(2)
y축_값 = train['Transported'].value_counts().values
plt.ylabel('ylabel 자리입니다.')
plt.xlabel('xlabel 자리입니다.')
plt.title('title 자리 입니다.')
plt.bar(x축_값, y축_값, label = 'label 자리입니다.')
plt.legend()
plt.xticks(x축_값, ['True','False'])
plt.show()
x축_값 : X축에 표시될 숫자 입니다. (numpy의 np.arange() 함수는 주어진 범위와 간격에 따라 균일한 값을 갖는 array를 반환합니다. )
y축_값 : Y축에 표시될 값 입니다.
plt.xlabel : X축 레이블에 표시될 문자입니다.
plt.ylabel : Y축 레이블에 표시될 문자입니다.
plt.title : 제목에 표시될 문자입니다.
label : 범례에 표시될 문자입니다. plot 함수에 label 문자열을 지정하고, plt.legend() 함수를 호출합니다.
plt.xticks : xticks에 표시될 문자입니다. x축_값 [0, 1] -> ['True','False'] 로 수정한다는 의미입니다.
728x90
반응형
'python' 카테고리의 다른 글
[python] dataframe groupby / pivot tabel (1) | 2023.03.27 |
---|---|
[python] dataframe replace / rename / value_counts / unique / nunique (0) | 2023.03.25 |
[python] 결측값(null/nan) 개수/ 존재 구하는 방법 (0) | 2023.03.18 |
[python] Class, __init__, 상속 (0) | 2023.02.15 |
[python] apply lambda (0) | 2022.05.30 |