2022-02-10 프로그래머스 데브코스 DAY

오늘 배운것

  • 스터디
    • 카테고리 변수 인코딩
    • autoML

깨달은 것

카테고리 변수를 전처리하는 방법으로 onehot encoding, label encoding 외에도 해당 카테고리에 속하는 데이터들의 target 변수의 평균을 이용해 인코딩하는 방법도 있다는 것을 알게되었다. 실제로 kaggle competition에서 이 방법을 사용햇더니 mae가 크게 떨어졌다. 처음엔 data leakage로 테스트 셋에는 mae가 떨어지지 않을 것이라고 생각했지만 오히려 성적이 좋아졌다. 다음엔 카테고리 변수를 처리할 때는 좀 더 이 방법을 자주 써야겠다는 생각을 했다.

'TIL' 카테고리의 다른 글

2022-02-18 TIL  (0) 2022.02.19
2022-02-15 TIL  (0) 2022.02.15
2022-01-28 TIL  (0) 2022.01.28
2022-01-26 TIL  (0) 2022.01.27
2022-01-25 TIL  (0) 2022.01.26

+ Recent posts