본문 바로가기

머신러닝13

[WEEK 12] 멋쟁이사자처럼 AI 스쿨 12주차 오늘은 감회가 새롭다. 이번주 들어 AI SCHOOL 8기 기간의 50% 지점을 지났고, 오늘로써 전체 101일의 일정 중 50%가 넘어간다. 시간이 빠르게 느껴진다. 12주차에는 이커머스 데이터 분석을 했고, 연결 지어서 머신러닝에 입문했다. 이번주의 키워드로 RFM, 머신러닝, K-means, clustering, classification, Decision Tree를 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 고객의 거래 데이터(거래일, 거래 금액 등)을 이용하여 고객 가치를 분석하는 RFM에 대한 개념을 익혔고, 영국 온라인 소매점 거래 데이터셋에 적용하여 Recency, Frequency, Monetary를 계산하고 활용했다. DAY 48 [DAY 48] RFM - 과거 내역을 .. 2023. 3. 9.
[DAY 50] Decision Tree를 이용한 분류, 학습과 예측, Accuracy 분류, 회귀 모두 사용 가능한 Decision Tree의 기본 원리를 이해하고 머신러닝에 활용했다. scikit-learn의 DecisionTreeClassifier 모델을 사용하여 고객 행동 예측을 경험해보고 Accuracy를 평가해보는 과정으로 머신러닝 모델의 동작(학습 -> 예측 -> 평가)을 이해하였다. 데이터 준비 데이터는 Kaggle에 있는 Telco Customer Churn 데이터를 로드하여 df에 저장하였다. 인구통계, 구독과 관련된 정보 등 고객 정보가 들어 있으며 이를 이용하여 이탈 여부를 예측하였다. customerID를 index로 지정, TotalCharges 컬럼을 numeric으로 변환, 결측치 제거 등의 전처리 과정을 거쳤다. 11개 행에 대해 결측치가 있었는데, 전체 70.. 2023. 3. 8.
[DAY 49] 머신러닝, K-means clustering algorithm 머신러닝과 scikit-learn에 대해 학습하는 것으로 강의가 시작되었다. 어제 retail data를 기반으로 만든 RFM 데이터와 군집화 알고리즘 K-means를 이용하여 실습하였다. 머신러닝, scikit-learn 파이썬의 머신러닝 라이브러리 scikit-learn의 대표적 기능 1. Classification(분류) 2. Regression(회귀) 3. Clustering(군집화) 4. Dimensionality Reduction(차원 축소) 5. Model selection and evaluation(모델 선택 및 평가) 6. Preprocessing(전처리) 머신러닝, 딥러닝에서 추상화된 도구(scikit-learn, TensorFlow, pyTorch, FastAI 등)를 사용했을 때 장.. 2023. 3. 7.
반응형