[DAY 68] 미드프로젝트2 데이터 준비, EDA
지난주 금요일인 DAY 67 강의 이후 밤, 주말을 활용해서 으쌰으쌰팀4와 함께 미드프로젝트2의 전체적 타임라인 설정, 파생변수 생성, 데이터셋 분할, 데이터 전처리 및 EDA를 완료했다. 우리 팀은 데이콘의 구내식당 식수 인원 예측 AI 경진대회로 주제를 선정했다. 앞으로 다양한 머신러닝 모델을 사용하여 식수 인원을 예측해 볼 계획이다. 데이터 준비 최초 train set와 test set의 형태를 보면 아래와 같다. 파생변수는 크게 3가지 관점에서 만든다. 1. 일자에서 연, 월, 일, 연월을 추출 2. 총 정원수에서 출장, 시간외근무, 재택근무자 수를 제외한 실근무자수 계산 3. 중식메뉴와 석식메뉴를 밥, 국, 메인, 반찬1, 반찬2로 split하며 New 메뉴가 있으면 신메뉴유무 1, 없으면 0 ..
2023. 4. 3.