Posts 2022-07-26 TIL
Post
Cancel

2022-07-26 TIL

Today

  • K-means를 통해 수강생들을 그룹화하는 작업을 하는중 2개의 그룹을 하나로 합치는것을 왜 생각을 못했는지 모르겠다.
  • 또 하차 수강생은 그냥 따로 빼서 하차 그룹으로 미리 만들면되는데 일부러 하차생들만 모이게 하는 군집화를 했다는게 조금 바보 같았다.
  • 수강생의 상, 중, 하를 30, 40, 30의 비율로 맞추고 해당 위치의 점수 구해 군집의 평균이 어느 지점에 위치하는지 확인하여 상중하를 나누었다.
  • 이렇게 데이터에 기반해서 의사결정을 해야해는데, 그간 진행한건 그냥 임의대로 상,중,하를 나눈것이라 좀 별로다.

TIL

  • Seaborn에 kde 플롯은 양끝단을 추정치로 나타낸다. 그래서 cut=0 옵션을 주면 추정된 부분은 삭제된다.
  • 구간을 정해 색을 칠하는 방법은 fill_between을 사용하면 된다.
  • kde의 상위값은 np.interp을 사용하면 된다.
    1
    2
    3
    4
    5
    
    ax = sns.kde(data)
    x = ax.lines[-1].get_xdata()
    y = ax.lines[-1].get_ydata()
    ax.fill_between(x, y, where=x >= q70, color='seagreen', alpha=0.3, label='상')
    ax.vlines(q70, 0, np.interp(q70, x, y), linestyle='—', color='r', alpha=0.5)
    

오늘의 결론

  • 그래프를 이쁘게
This post is licensed under CC BY 4.0 by the author.