부스팅3 [WEEK 14] 멋쟁이사자처럼 AI 스쿨 14주차 14주차에는 scikit-learn에서 제공하는 부스팅 모델과 scikit-learn이 아닌 라이브러리에서 제공하는 부스팅 모델을 익히고 회귀 문제에 적용해봤다. 또한 랜덤서치를 이용한 하이퍼파라미터 튜닝을 통해 모델의 성능 향상을 도모했다. 이번주의 키워드로 GradientBoosting, XGBoost, LightGBM, CatBoost, 랜덤서치, 익명화된 데이터, 하이퍼파라미터 튜닝을 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 사이킷런의 앙상블 회귀 모델 GradientBoostingRegressor를 이용해 회귀 문제를 경험했다. RandomizedSearchCV의 결과로 구한 best_estimator_를 활용했으며 kaggle에 제출 후 GridSearchCV로 얻은 점수와 .. 2023. 3. 23. [DAY 58] 머신러닝으로 자전거 수요 예측 - GradientBoostingRegressor, RandomizedSearchCV 회귀 문제에 성능이 좋은 부스팅 모델을 사용하여 자전거 수요를 예측했다. RandomizedSearchCV를 통해 최적의 하이퍼파라미터를 탐색하고 GridSearchCV와 비교했다. 데이터 준비 캐글 페이지에서 학습, 예측, 제출에 사용할 파일 train.csv, test.csv, sampleSubmission.csv를 다운로드했다. 그 후 pandas를 통해 train과 test 데이터를 로드하여 형태를 확인했다. print(train.shape) train.head() train 데이터의 shape와 처음 5개 행을 확인 print(test.shape) test.head() test도 마찬가지로 확인 casual, registered, count는 자전거 수요를 의미한다. test 데이터를 활용하여 .. 2023. 3. 20. [DAY 55] 캐글 경진대회 상위 3% 경험하기 - 수요 예측(회귀), 부스팅 모델, GridSearchCV Kaggle Competition : Bike Sharing Demand를 경험했다. 자전거 수요를 회귀 모델을 사용해 예측하고 제출하여 점수를 확인했다. Gradient Boosting 모델을 사용했으며 GridSearchCV를 통해 최적의 하이퍼 파라미터를 탐색했다. 데이터 준비 competition page에서 train.csv, test.csv, sampleSubmission.csv를 다운로드했다. 각각 학습, 예측, 제출에 사용할 파일이다. 그 후 train.csv와 test.csv를 로드하여 각각 변수에 저장했다. print(train.shape) train.head() train 데이터의 shape와 처음 5개 행 확인 print(test.shape) test.head() test 데이터의 .. 2023. 3. 15. 이전 1 다음 반응형