팀원별로 머신러닝 모델을 사용해 보며 MAE 점수를 낮추기 위해 노력했다.
오후에는 프로젝트 마무리에 대해 고민했고, 프로젝트멘토 피드백이 있었다.
모델 사용 및 결과 제출
각자 맡은 모델을 사용하며 피처 엔지니어링, 하이퍼파라미터 튜닝 등을 적용했다.
나는 랜덤포레스트 모델의 n_estimators와 max_depth를 데이콘 최종 결과 상위 랭커분이 사용하신 것과 같게 설정해 봤으나 변수가 달라서 그런지 결과가 좋지 않았다.
하이퍼파라미터를 따로 설정하지 않은 모델을 사용한 경우가 제일 점수가 좋았다. 오전 중으로 계속 팀원들도 많은 시도를 하셨지만 유의미하게 개선된 경우는 없는 것 같다.
그리고 데이콘 제출 횟수의 제한으로 인해 많이 제출하고 점수를 확인하지 못한 부분이 아쉽다.
gridsearch를 사용했음에도 하이퍼파라미터 튜닝을 하지 않은 모델과 큰 차이 없는 결과를 받았다.
오후 쟁점
발표와 발표에 쓰일 PPT를 어떤 방향으로 풀어나갈지 결정하는 시간을 가졌다.
EDA와 파생변수 생성 및 예측 플로우 설명, 머신러닝 모델별로 적용한 방식과 그에 대한 결과를 정리하는 형식이 될 것 같다.
16:00 프로젝트 멘토 피드백
- 성능이 꼭 좋아야 할 필요는 없다. 좋지 않았어도 그 이유에 대한 고민을 해보는 것이 의미가 있다
- 성능보단 데이터를 어떻게 보고 분석했는지에 초점을 맞추자. (전처리 방식 등)
느낀 점
머신러닝을 이용한 회귀 예측 경진대회 데이터셋을 가지고 데이터 분석적인 측면에 더 초점을 맞추어 접근해야 한다는 부분이 어려웠다. 타깃을 잘 예측하고 좋은 점수를 받는 목적이 기저에 깔리다 보니..
정규 시간 후에 밤에 팀원들과 모여 PPT 작성을 시작했다. 내일 마무리될 것 같다.
반응형
'AI SCHOOL > TIL' 카테고리의 다른 글
[DAY 71] 미드프로젝트2 발표와 피드백, 종합 회고 (0) | 2023.04.06 |
---|---|
[DAY 70] 미드프로젝트2 마무리 (0) | 2023.04.05 |
[DAY 68] 미드프로젝트2 데이터 준비, EDA (0) | 2023.04.03 |
[DAY 67] 코딩테스트 연습 - 시간복잡도, 스택, 큐, 연결리스트 (0) | 2023.03.31 |
[DAY 66] Week 15 Insight Day 미드프로젝트2 시작 (0) | 2023.03.30 |
댓글