1) 학습 내용 정리
DKT(Deep Knowledge Tracing) 라는 조금은 생소한 개념에 대해 학습했다.
DKT는 딥러닝(DL)을 이용해 지식 상태를 추적(KT)하는 것으로, 교육 AI의 중심이라고 할 수 있다.
알게된 점
- AUC(Area Under the roc Curve)가 왜 binary classification metric으로 많이 쓰이는지 알 수 있었다.
- 척도, 분류 임계값에 불변하기 때문에, 척도나 분류 임계값에 상관 없이 모델의 예측 품질을 잘 측정하기 때문이다.
- 하지만 이러한 특징이 항상 이상적인 건 아니며, 경우에 따라 단점이 될 수 있다.
- Sequence 데이터에 대한 2가지 접근 방식
- sequence 데이터를 잘 가공해 정형 데이터로 취급해 LGBM과 같은 모델로 예측하는 Tabular approach
- sequence 데이터를 RNN, LSTM, Transformer와 같은 시계열 모델로 예측하는 Sequential approach
2) 미션
미션 1에서는 EDA, 그리고 미션 2에서는 LGBM 모델을 돌려봤다.
많이 다뤄보지 않은 sequence 데이터라, 이전과 다르게 생각해봐야 할 점이 많은 것 같다.
또 효과적인 좋은 feature를 만들기 위한 방법을 많이 구상해봐야 할 것 같다.
LGBM은 원래 sequence 데이터에 적합한 모델은 아니지만,
sequence 데이터를 잘 가공해 tableur 데이터로 취급해 돌리면 꽤 좋은 성능을 얻을 수 있다.
실제로 미션 결과를 리더보드에 제출했는데, 꽤 괜찮은 성능이 나와 놀랐다.
이런 접근 방법 자체가 신기하고, 더 발전시키기 위한 방법도 찾아봐야겠다는 생각이 든다.
3) 피어세션
오늘 vscode에서 ssh 접속하는 데 애를 먹었는데, 열심히 알려주시는 팀원 분들 덕분에 빠르게 해결할 수 있었다.
모두 열정 넘치고 뛰어나셔서 많이 자극 받고 배워가는 것 같다.
특히 모두 기록을 중요하게 여기고 체계적으로 열심히 기록하고 있는 게 아주 만족스럽다.
노션을 마스터 하신 모더레이터 팀원 분 덕에 많은 노션 스킬들을 배웠다!
아직 첫 주임에도 서로 공부한 내용을 정리해서 공유하는 문화가 생긴 것도 좋았고, 다들 소통이 원활하게 잘 되는 것도 좋았다.
그냥 정말 아쉬웠던 점이 전혀 없었다. 팀 분위기도 너무 마음에 들고, 레벨2 스타트가 아주 좋은 것 같다~!
4) 학습 회고
칭찬할 점
이전보다 적극적인 자세로 팀원/멘토 분께 모르는 것을 질문하여 효율을 높인 것에 칭찬하고 싶다.
처음이 어렵지, 하다보면 질문도 늘 것 같다. 더 적극적으로 해 보자~!
또 정말 느낀 건, 정말 깊이 공부해야 학습에 관련한 질문이 생긴다는 것이다. 앞으로는 학습 관련 질문도 많이 해보기 위해 노력하자!
아쉬운 점
아쉬웠던 건, 계획만 거창하고 실행하지 못한 점이다. 3일만 부캠이 진행되다보니 상대적으로 몰입도가 떨어진 것이 아쉽다.
다시 공부할 개념도 정말 많다고 느꼈다. 특히 모델들.. 다시 깊이 공부해볼 필요가 있다. 일단 예전 Transformer 강의부터 다시 보자.
개선할 점
계획을 다시 체계적으로 잘 짜서 학습/작업 효율을 높이자. 다음주는 몰입할 수 있도록 복습 탄탄히 해가자!
시도할 점
멘토 님께서 조언해주신 방식으로 강의를 수강하는 것. 여러 번 들으며 내 것 만들기!!
또, 모델 실험 하나라도 깊게 잘 해보는 것.
'NAVER boostcamp AI Tech' 카테고리의 다른 글
[NAVER boostcamp AI Tech 5기] 11주차 학습 정리 (0) | 2023.05.19 |
---|---|
[NAVER boostcamp AI Tech 5기] 10주차 학습 정리 (0) | 2023.05.10 |
[NAVER boostcamp AI Tech 5기] 8주차 학습 정리 (0) | 2023.04.28 |
[NAVER boostcamp AI Tech 5기] 7주차 학습 정리 (0) | 2023.04.21 |
[NAVER boostcamp AI Tech 5기] 6주차 학습 정리 (0) | 2023.04.14 |