13주차에는 머신러닝 여러 모델을 다루어 분류, 회귀 예측을 했다. 더 좋은 결과를 얻기 위한 과정을 경험했다.
이번주의 키워드로 scikit-learn, Classification(분류), Regression(회귀), RandomForest, ExtraTrees, GradientBoosting, train_test_split, encoding, cross validation(교차 검증), GridSearchCV를 선정한다.
학습 내용 요약 - 각 세부 사항은 TIL 작성
디시전트리 기반의 앙상블 알고리즘 Random Forest에 대해 배웠다. 캐글에서 통신사 고객 정보 데이터를 로드하여 이탈 여부를 예측했다. pandas의 get_dummies를 이용한 One Hot Encoding과 train_test_split을 이용한 Hold out 검증을 통해 모델의 성능을 향상시켰다.
DAY 53
DAY 54에는 DAY 53과 같은 데이터를 활용했으나 전처리, 머신러닝 모델, 검증 방법에 차이점을 두고 결과가 달라지는 것을 확인하였다.
DAY 54
Kaggle의 회귀문제 Competition의 데이터 준비, 학습, 예측, 제출, 결과 확인까지의 과정을 경험했다. GradientBoostingRegressor 모델을 사용하고 로그 변환, 변환된 로그 복원, GridSearchCV를 통한 최적의 하이퍼 파라미터를 찾는 과정 등을 기반으로 좋은 점수를 얻었다.
DAY 55
어떻게 하면 더 좋은 성능을 낼 수 있을까 고민하고 탐색하는 접근이 재미있었고 그것을 이루어냈을 때 성취감이 느껴졌다.
반응형
'AI SCHOOL > WIL' 카테고리의 다른 글
[WEEK 14] 멋쟁이사자처럼 AI 스쿨 14주차 (0) | 2023.03.23 |
---|---|
[WEEK 12] 멋쟁이사자처럼 AI 스쿨 12주차 (0) | 2023.03.09 |
[WEEK 11] 멋쟁이사자처럼 AI 스쿨 11주차 (0) | 2023.03.02 |
[WEEK 8] 멋쟁이사자처럼 AI 스쿨 8주차 (0) | 2023.02.09 |
[WEEK 7] 멋쟁이사자처럼 AI 스쿨 7주차 (0) | 2023.02.02 |
댓글