2022-02-10 프로그래머스 데브코스 DAY
오늘 배운것
- 스터디
- 카테고리 변수 인코딩
- autoML
깨달은 것
카테고리 변수를 전처리하는 방법으로 onehot encoding, label encoding 외에도 해당 카테고리에 속하는 데이터들의 target 변수의 평균을 이용해 인코딩하는 방법도 있다는 것을 알게되었다. 실제로 kaggle competition에서 이 방법을 사용햇더니 mae가 크게 떨어졌다. 처음엔 data leakage로 테스트 셋에는 mae가 떨어지지 않을 것이라고 생각했지만 오히려 성적이 좋아졌다. 다음엔 카테고리 변수를 처리할 때는 좀 더 이 방법을 자주 써야겠다는 생각을 했다.
'TIL' 카테고리의 다른 글
2022-02-18 TIL (0) | 2022.02.19 |
---|---|
2022-02-15 TIL (0) | 2022.02.15 |
2022-01-28 TIL (0) | 2022.01.28 |
2022-01-26 TIL (0) | 2022.01.27 |
2022-01-25 TIL (0) | 2022.01.26 |