1. MinMax, Standard 스케일러
1.1 스케일러(Scaler)
- 실수(숫자, 소수점)으로 된 데이터들을 일정한 범위를 가진 수치로 변경하기 위해 필요함
- 예를들어 어떤 데이터에서 A컬럼은 0 ~ 100의 값을 가지고, B의 컬럼은 0.1 ~ 1을 가진다고 하면 두 컬럼의 데이터들은 간격이 너무 큰 수치들로 이루어져있음
- 컬럼들의 최대/최소 범위가 각각 다르고, 평균과 분산이 각각 다름
- 해당 이슈를 처리하기 위해서 스케일러(Scaler)를 사용함
- 주로 Cost Function을 최적화 할때 유효함
- sklearn을 사용하여 할수 있음
1
2
3
4
5
6
7
8
9
10
11
12
13
from sklearn.preprocessing import MinMaxScaler, StandardScaler
# 스케일러 객체 생성
mms = MinMaxScaler()
ss = StandardScaler()
# 적용
ss.fit(X)
mms.fit(X)
# 변환
X_ss = ss.transform(X)
X_mms = mms.transform(X)
1.1.1 MinMax Scaler?
- 최소값과 최대값을 0과 1로 맞춰주는 스케일러
1.1.2 Standard Scaler?
- 평균을 0으로 표준편차를 1로 맞춰주는 스케일러