2022-03-22 프로그래머스 데브코스
오늘 배운 것
- 데브코스
- Transformer
- BERT
깨달은 것
이제까지 TIL이 좀 뜸했다. 그도 그럴것이 이제까지 뭔가를 배웠다기보다는 프로젝트 기획하고 과제하는데 바빴기 때문이다. 그런 과정속에서 뭔가를 배웠다고 쓰기도 그렇고 딱히 쓸 말이 없어 이제까지 TIL을 미뤄왔다.
오늘은 Transformer와 BERT에 대해서 배웠다. 수업 중 인상 깊은 부분이 있었는데, 어려운 딥러닝 모델을 이해하는 방법에 대한 것이었다. 먼저 무슨 목적을 위한 모델인지 살피고 모델의 input, output, 그리고 모델의 추론과정을 이해하라고 했다. 학습은 나중이다. 이 과정으로 transformer를 이해하니 이제까지 transformer에 대해 오개념이 있었던 부분이 풀렸다. 나는 이제까지 Transformer의 multi-head self attention이 multi-head와 self attention이 같은 의미인줄 알았다. 한 단어와 여러 단어(이 부분을 멀티 헤드라고 이해)에 대해 관련성을 계산하는 것이 멀티 헤드이자 셀프 어텐션인줄 안 것이다. 하지만 이번에 공부하고보니 CNN에서 여러 필터를 쓰듯 셀프 어텐션을 여러번 행하는 것이었다. 솔직히 이제까지 Transformer에 대해 절반 정도 밖에 이해 못했다고 생각했는데 이번 기회에 정말 완전히 이해하게 되었다.
'TIL' 카테고리의 다른 글
2022-02-25 TIL (0) | 2022.02.26 |
---|---|
2022-02-22 TIL (0) | 2022.02.23 |
2022-02-21 TIL (0) | 2022.02.22 |
2022-02-19 TIL (0) | 2022.02.20 |
2022-02-18 TIL (0) | 2022.02.19 |