본문 바로가기
AI SCHOOL/TIL

[DAY 86] 파이널프로젝트 시작 - 데이터 수집

2023. 4. 27.

파이널프로젝트는 멋사 측에서 빌딩 하지 않고 수강생들의 선택에 의해 결성된 팀과 함께한다.

자유 주제이니 만큼 며칠 전부터 회의를 거쳤으며 오늘 본격적으로 시작했다.

주제 선정

우리팀은 음식과 그 음식의 레시피 데이터를 수집하고, 이를 이용해서 추천 시스템을 만들기로 했다.
사용자가 현재 냉장고에 보관하고 있는 재료들을 입력하면 그것을 바탕으로 음식을 추천하는 시스템이다.

기대 효과
1. 음식물 쓰레기 줄이기(환경에 대한 사소한 실천)
2. 식재료비, 외식비 등 지출 감소
3. 재료에 따른 요리를 찾아보는 번거로움 해소

재료와 레시피를 기반으로 추천하는 것이 기본 메커니즘이며, 음식의 난이도, 사용자의 선호와 알레르기 정보 등을 고려한 추천 시스템 구현을 목표로 한다.

데이터 수집

최초 구상은 만개의 레시피에서 데이터를 스크래핑하여 사용하는 것이었으나

recipe
만개의 레시피

위 사진과 같이 한식, 중식, 양식 등 요리 분류에 대한 데이터가 없고 요리의 제목이 깔끔한 형태가 아니었기 때문에 다른 사이트로 눈길을 돌렸다. 만개의 레시피는 프로젝트에 사용하지 않더라도 스크래핑해 본 경험으로 만족한다.

wtable
우리의 식탁

이렇게 요리 카테고리가 있으며 제목이 깔끔한 우리의 식탁에서 데이터를 수집하여 사용하기로 결정했다.
난이도와 소요시간 또한 활용도가 있을 것 같다고 생각했다.

data
수집된 데이터

requests와 BeautifulSoup을 활용해서 우리의 식탁에서 요리명, 종류, 난이도, 소요시간, 재료 데이터를 수집했다.

반응형

댓글