본문 바로가기

AI SCHOOL/WIL8

[WEEK 14] 멋쟁이사자처럼 AI 스쿨 14주차 14주차에는 scikit-learn에서 제공하는 부스팅 모델과 scikit-learn이 아닌 라이브러리에서 제공하는 부스팅 모델을 익히고 회귀 문제에 적용해봤다. 또한 랜덤서치를 이용한 하이퍼파라미터 튜닝을 통해 모델의 성능 향상을 도모했다. 이번주의 키워드로 GradientBoosting, XGBoost, LightGBM, CatBoost, 랜덤서치, 익명화된 데이터, 하이퍼파라미터 튜닝을 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 사이킷런의 앙상블 회귀 모델 GradientBoostingRegressor를 이용해 회귀 문제를 경험했다. RandomizedSearchCV의 결과로 구한 best_estimator_를 활용했으며 kaggle에 제출 후 GridSearchCV로 얻은 점수와 .. 2023. 3. 23.
[WEEK 13] 멋쟁이사자처럼 AI 스쿨 13주차 13주차에는 머신러닝 여러 모델을 다루어 분류, 회귀 예측을 했다. 더 좋은 결과를 얻기 위한 과정을 경험했다. 이번주의 키워드로 scikit-learn, Classification(분류), Regression(회귀), RandomForest, ExtraTrees, GradientBoosting, train_test_split, encoding, cross validation(교차 검증), GridSearchCV를 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 디시전트리 기반의 앙상블 알고리즘 Random Forest에 대해 배웠다. 캐글에서 통신사 고객 정보 데이터를 로드하여 이탈 여부를 예측했다. pandas의 get_dummies를 이용한 One Hot Encoding과 train_te.. 2023. 3. 16.
[WEEK 12] 멋쟁이사자처럼 AI 스쿨 12주차 오늘은 감회가 새롭다. 이번주 들어 AI SCHOOL 8기 기간의 50% 지점을 지났고, 오늘로써 전체 101일의 일정 중 50%가 넘어간다. 시간이 빠르게 느껴진다. 12주차에는 이커머스 데이터 분석을 했고, 연결 지어서 머신러닝에 입문했다. 이번주의 키워드로 RFM, 머신러닝, K-means, clustering, classification, Decision Tree를 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 고객의 거래 데이터(거래일, 거래 금액 등)을 이용하여 고객 가치를 분석하는 RFM에 대한 개념을 익혔고, 영국 온라인 소매점 거래 데이터셋에 적용하여 Recency, Frequency, Monetary를 계산하고 활용했다. DAY 48 [DAY 48] RFM - 과거 내역을 .. 2023. 3. 9.
[WEEK 11] 멋쟁이사자처럼 AI 스쿨 11주차 AI SCHOOL 8기의 절반 지점을 앞두고 있는 11주차에는 메모리와 스토리지 관리, 이커머스 데이터 분석을 했다. 미드프로젝트1 발표와 회고, 공휴일이 있었기 때문에 학습량은 많지 않았다. 이번주의 키워드로 parquet, csv, file format, downcast, 이커머스 데이터 EDA를 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 저장하는 파일 형식에 따라 저장소를 덜 차지하도록 저장할 수 있다는 것을 배웠고, 실제로 같은 데이터를 csv와 parquet 형식으로 각각 저장하여 파일 사이즈 차이를 확인하였다. 또한 downcast를 통해 판다스 데이터프레임의 메모리 사용량을 줄이는 방법을 알게 되었다. DAY 44 [DAY 44] 스토리지, 메모리 사용량 관리 parquet,.. 2023. 3. 2.
[WEEK 8] 멋쟁이사자처럼 AI 스쿨 8주차 8주차에는 지도 시각화 등 다양한 데이터 시각화를 했다. 이번주의 키워드로 Tidy Data, melt, plotly, 버거지수, seaborn, folium을 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 분석을 위해 잘 가공된 깔끔한 데이터 Tidy Data에 대한 개념을 배웠다. 그 후 아파트 분양가 분석을 위한 데이터 전처리 과정에서 pandas의 melt를 사용하여 Tidy Data를 만들었다. DAY 29 TIL [DAY 29] Tidy Data(깔끔한 데이터), melt, 아파트 분양가 분석 분석하기 좋은 깔끔한 데이터 Tidy Data에 대해 간단히 알아보았다. 그 후 Tidy Data를 생각하며 아파트 분양가 분석을 했다. Tidy Data 강의에선 Tidy Data에 대해 .. 2023. 2. 9.