Today
- K-means를 통해 수강생들을 그룹화하는 작업을 하는중
2개의 그룹을 하나로 합치는것
을 왜 생각을 못했는지 모르겠다. - 또 하차 수강생은 그냥 따로 빼서
하차 그룹
으로 미리 만들면되는데 일부러 하차생들만 모이게 하는 군집화를 했다는게 조금 바보 같았다. - 수강생의 상, 중, 하를 30, 40, 30의 비율로 맞추고 해당 위치의 점수 구해 군집의 평균이 어느 지점에 위치하는지 확인하여 상중하를 나누었다.
- 이렇게 데이터에 기반해서 의사결정을 해야해는데, 그간 진행한건 그냥 임의대로 상,중,하를 나눈것이라 좀 별로다.
TIL
- Seaborn에 kde 플롯은 양끝단을 추정치로 나타낸다. 그래서
cut=0
옵션을 주면 추정된 부분은 삭제된다. - 구간을 정해 색을 칠하는 방법은
fill_between
을 사용하면 된다. - kde의 상위값은
np.interp
을 사용하면 된다.1 2 3 4 5
ax = sns.kde(data) x = ax.lines[-1].get_xdata() y = ax.lines[-1].get_ydata() ax.fill_between(x, y, where=x >= q70, color='seagreen', alpha=0.3, label='상') ax.vlines(q70, 0, np.interp(q70, x, y), linestyle='—', color='r', alpha=0.5)
오늘의 결론
- 그래프를 이쁘게