멋쟁이사자처럼109 [DAY 49] 머신러닝, K-means clustering algorithm 머신러닝과 scikit-learn에 대해 학습하는 것으로 강의가 시작되었다. 어제 retail data를 기반으로 만든 RFM 데이터와 군집화 알고리즘 K-means를 이용하여 실습하였다. 머신러닝, scikit-learn 파이썬의 머신러닝 라이브러리 scikit-learn의 대표적 기능 1. Classification(분류) 2. Regression(회귀) 3. Clustering(군집화) 4. Dimensionality Reduction(차원 축소) 5. Model selection and evaluation(모델 선택 및 평가) 6. Preprocessing(전처리) 머신러닝, 딥러닝에서 추상화된 도구(scikit-learn, TensorFlow, pyTorch, FastAI 등)를 사용했을 때 장.. 2023. 3. 7. [DAY 48] RFM - 과거 내역을 통해 고객의 미래 가치를 추출하는 분석 방법 고객의 과거 데이터를 통해 미래 가치를 추출하고 계산하며 고객을 분류할 수 있는 간단하고 유용한 방법인 RFM에 대해 공부했다. 분석 과정을 통해 데이터를 의미 있는 정보로 전환하여 마케팅에 가장 많이 사용되고 있다. RFM RFM은 고객의 가치를 아래 세 가지 기준에 근거해 계산한다. 1. Recency : 거래의 최근성 - 고객이 얼마나 최근에 구입했는가? 2. Frequency : 거래 빈도 - 고객이 얼마나 빈번하게 구입했는가? 3. Monetary : 거래 규모 - 고객이 구입한 총 금액은 어느 정도인가? RFM의 개념을 익힌 후 이를 적용해 데이터를 분석했다. 데이터 준비 영국 온라인 소매점 거래 데이터셋을 이용했다. raw = pd.read_csv('online_retail.csv') raw.. 2023. 3. 6. [DAY 47] Tableau 시작 - 원본 페이지, 주요 키워드, 차트 그리기 Special Lecture Tableau 첫 강의였다. 오전 시간에는 비디오 강의를 통해 태블로의 기본적인 것을 학습한 후 오후 실시간 강의에서 다양한 데이터를 시각화했다. Tableau(태블로) 데이터 리터러시가 강조되고 있는 요즘, 태블로는 국내와 세계에서 점차 활용 기업이 늘어나고 있는 시각화 도구다. Data Literacy : 데이터를 보고 활용할 수 있는 능력 - 탐색(Explore)을 통해 본인이 이해(Understand)하고 이를 다른 사람과의 대화(Communication)와 협업(Collaboration)을 통해 찾은 통찰(Insight)을 공유(Share)하는 일련의 능력 태블로 시작 파일에 연결을 통해 excel 파일의 데이터를 사용할 수 있다 연결한 후 이름을 확인하면 엑셀 시트.. 2023. 3. 4. [WEEK 11] 멋쟁이사자처럼 AI 스쿨 11주차 AI SCHOOL 8기의 절반 지점을 앞두고 있는 11주차에는 메모리와 스토리지 관리, 이커머스 데이터 분석을 했다. 미드프로젝트1 발표와 회고, 공휴일이 있었기 때문에 학습량은 많지 않았다. 이번주의 키워드로 parquet, csv, file format, downcast, 이커머스 데이터 EDA를 선정한다. 학습 내용 요약 - 각 세부 사항은 TIL 작성 저장하는 파일 형식에 따라 저장소를 덜 차지하도록 저장할 수 있다는 것을 배웠고, 실제로 같은 데이터를 csv와 parquet 형식으로 각각 저장하여 파일 사이즈 차이를 확인하였다. 또한 downcast를 통해 판다스 데이터프레임의 메모리 사용량을 줄이는 방법을 알게 되었다. DAY 44 [DAY 44] 스토리지, 메모리 사용량 관리 parquet,.. 2023. 3. 2. [DAY 46] Week 11 Insight Day 20230302(목) 인사이트 데이 오랜만인 인사이트 데이로 머리를 식힌 것 같다. 으쌰으쌰팀2와는 첫 인사이트데이였고 그와 동시에 으쌰으쌰팀3이 공지되었다. 오전 으쌰으쌰팀2와 함께 소회의실에서 자습을 했다. 이번주에는 EDA연습과 머신러닝 예습 과제가 있어서 과제를 하며 시간을 보냈다. 으쌰으쌰팀2 팀원들과는 프로젝트를 열심히 하느라 프로젝트 외적인 얘기는 별로 못한 것 같아서 아쉽다. 오후 지금 우리 SCHOOL은? 수강생 응답 데이터를 봤는데 EDA 주간에 "쉬웠다" 응답자가 한 명도 없었다. 역시 다들 느끼는 게 비슷한 것 같다. 다 같이 어려웠나 보다. 공부 습관, 루틴을 만든 분, 자습하는 것이 즐겁다고 하신 분, 어렵지만 꾸준하게 하고 계신 분처럼 열심히 사는 분들을 보며 나도 자극을 받았.. 2023. 3. 2. 이전 1 ··· 9 10 11 12 13 14 15 ··· 22 다음 반응형