Today

K-means를 통해 수강생들을 그룹화하는 작업을 하는중 2개의 그룹을 하나로 합치는것을 왜 생각을 못했는지 모르겠다.
또 하차 수강생은 그냥 따로 빼서 하차 그룹으로 미리 만들면되는데 일부러 하차생들만 모이게 하는 군집화를 했다는게 조금 바보 같았다.
수강생의 상, 중, 하를 30, 40, 30의 비율로 맞추고 해당 위치의 점수 구해 군집의 평균이 어느 지점에 위치하는지 확인하여 상중하를 나누었다.
이렇게 데이터에 기반해서 의사결정을 해야해는데, 그간 진행한건 그냥 임의대로 상,중,하를 나눈것이라 좀 별로다.

TIL

Seaborn에 kde 플롯은 양끝단을 추정치로 나타낸다. 그래서 cut=0 옵션을 주면 추정된 부분은 삭제된다.
구간을 정해 색을 칠하는 방법은 fill_between을 사용하면 된다.

kde의 상위값은 np.interp을 사용하면 된다.

ax = sns.kde(data)
x = ax.lines[-1].get_xdata()
y = ax.lines[-1].get_ydata()
ax.fill_between(x, y, where=x >= q70, color='seagreen', alpha=0.3, label='상')
ax.vlines(q70, 0, np.interp(q70, x, y), linestyle='—', color='r', alpha=0.5)

오늘의 결론

그래프를 이쁘게

TIL, 2022년

TIL

This post is licensed under CC BY 4.0 by the author.

2022-07-26 TIL

Today

TIL

오늘의 결론

Recent Update

Trending Tags

Contents

Trending Tags

2022-07-26 TIL

Today

TIL

오늘의 결론

Recent Update

Trending Tags

Contents

Further Reading

2022-06-21 TIL

2022-06-22 TIL

2022-06-23 TIL

Trending Tags