본문 바로가기

전체 글135

[DAY 72] 코딩테스트 연습 - Binary Search Tree, DFS, BFS, Sorting algorithms Binary Search Tree와 DFS, BFS의 개념을 이해한 후, 코드로 구현했다. Selection sort, Insertion sort, Merge sort, Quick sort도 다루었다. 워밍업 문제 1. 정수 원소로 이루어진 리스트 numbers에 특정 정수 n이 포함된 횟수 카운트 from collections import Counter Counter(numbers).get(n, 0) collections 모듈의 Counter 함수를 사용하면 각 원소의 빈도를 반환한다. numbers = [1,3,4,4,5,5,5,6] Counter(numbers) # 실행 결과 Counter({1: 1, 3: 1, 4: 2, 5: 3, 6: 1}) 여기에 빈도수를 구하길 원하는 정수를 get 메소드의.. 2023. 4. 7.
[DAY 71] 미드프로젝트2 발표와 피드백, 종합 회고 오전까지 미드프로젝트2의 마지막 시간이었다. 점심식사 후 발표 준비 및 팀별 발표, 종합 회고가 있었다. 오전 프로젝트 결과 최종 제출이 점심시간 전까지였기 때문에 오전 시간이 프로젝트 마무리 시간이었다. 우리 팀은 어제 밤에 마무리를 지어서 오전에는 각자 자습 시간으로 활용했다. 나는 태블로를 공부하며 오전을 보냈다. 오후 점심시간이 지난 후 13시부터 14시까지 발표 준비 시간이었으며 14시부터 랜덤 순서로 팀별 발표와 강사님의 피드백이 있었다. 시각화에 태블로 활용, 여러 파생 변수 사용, 피처 엔지니어링에 집중, 다양한 방향으로 접근, 모델을 많이 사용, 여러 가설 설정 등 각 팀마다 보이는 특징이 재미있었다. 우리 팀에서 생각하지 못 한 부분을 건드려 보신 분들의 발표를 들으며 많이 배웠다. 그.. 2023. 4. 6.
[DAY 70] 미드프로젝트2 마무리 하루동안 미드프로젝트2 마무리를 지었다. PPT와 팀 노션 페이지를 정리했고 발표의 흐름과 내용을 구성했다. 열정적이고 꼼꼼한 팀원들의 덕을 많이 봤다. 프로젝트 요약 데이터 전처리 및 EDA는 팀원 모두가 전부 경험했다. 예측해야 하는 값인 중식계와 석식계가 높은 양의 상관관계를 보이는 것을 확인했고, 산점도를 그려보니 회귀선과 비슷한 분포를 나타내는 것을 보고 머신러닝으로 중식 수요를 예측 후 이 예측값을 다시 독립변수로 사용하여 석식 수요를 예측해 보는 방법을 생각했으며 데이터셋이 2016년부터 2021년까지의 데이터이므로 일부 기간 코로나 기간이어서 재택근무자 수가 생긴 것을 확인하는 등 EDA를 통해 머신러닝을 어떻게 진행해야할지 아이디어를 많이 얻었다. 머신러닝 모델은 AutoML 라이브러리 .. 2023. 4. 5.
[DAY 69] 미드프로젝트2 - 프로젝트 멘토 피드백, 머신러닝 팀원별로 머신러닝 모델을 사용해 보며 MAE 점수를 낮추기 위해 노력했다. 오후에는 프로젝트 마무리에 대해 고민했고, 프로젝트멘토 피드백이 있었다. 모델 사용 및 결과 제출 각자 맡은 모델을 사용하며 피처 엔지니어링, 하이퍼파라미터 튜닝 등을 적용했다. 나는 랜덤포레스트 모델의 n_estimators와 max_depth를 데이콘 최종 결과 상위 랭커분이 사용하신 것과 같게 설정해 봤으나 변수가 달라서 그런지 결과가 좋지 않았다. 하이퍼파라미터를 따로 설정하지 않은 모델을 사용한 경우가 제일 점수가 좋았다. 오전 중으로 계속 팀원들도 많은 시도를 하셨지만 유의미하게 개선된 경우는 없는 것 같다. 그리고 데이콘 제출 횟수의 제한으로 인해 많이 제출하고 점수를 확인하지 못한 부분이 아쉽다. gridsearch.. 2023. 4. 4.
[DAY 68] 미드프로젝트2 데이터 준비, EDA 지난주 금요일인 DAY 67 강의 이후 밤, 주말을 활용해서 으쌰으쌰팀4와 함께 미드프로젝트2의 전체적 타임라인 설정, 파생변수 생성, 데이터셋 분할, 데이터 전처리 및 EDA를 완료했다. 우리 팀은 데이콘의 구내식당 식수 인원 예측 AI 경진대회로 주제를 선정했다. 앞으로 다양한 머신러닝 모델을 사용하여 식수 인원을 예측해 볼 계획이다. 데이터 준비 최초 train set와 test set의 형태를 보면 아래와 같다. 파생변수는 크게 3가지 관점에서 만든다. 1. 일자에서 연, 월, 일, 연월을 추출 2. 총 정원수에서 출장, 시간외근무, 재택근무자 수를 제외한 실근무자수 계산 3. 중식메뉴와 석식메뉴를 밥, 국, 메인, 반찬1, 반찬2로 split하며 New 메뉴가 있으면 신메뉴유무 1, 없으면 0 .. 2023. 4. 3.
반응형