본문 바로가기
AI SCHOOL/TIL

[DAY 43] 미드프로젝트1 마무리

2023. 2. 26.

20230224(금) ~ 20230225(토) 이틀간 미드프로젝트1의 마무리를 지었다.

발표에서 무엇을 보여줄 것인지 시각화 자료를 선택하고 흐름을 결정했다. 모든 팀원이 각 주제별 분석결과를 명확히 하기 위한 시각화에 시간을 쏟았다.

프로젝트의 전체적 흐름

전국 단위로도 많은 분석과 시각화를 시도했지만, 몇몇 지역은 프랜차이즈 카페 수 자체가 너무 적은 문제점이 있었으며 커피지수와 연관 지어 함께 분석할 데이터를 찾더라도 전국 시도별 데이터는 찾기 어려운 경우가 많아 서울시에 한해 유의미한 분석을 진행하기로 결정했다.
자치구별 프랜차이즈 매장 수, 주민등록 인구, 생활 인구, 유동 인구, 사업체 수, 사업체 종사자 수, 대규모 점포 수, 재정자립도 등이 어떻게 나타나는지 분석하고 커피지수와의 상관관계를 확인하였다.

또한 종속변수를 총부가가치로 하고 독립변수를 커피지수로 한 회귀분석을 통해 커피지수가 총부가가치를 얼마나 설명하는지 확인했다. 통계학을 전공하신 팀원께서 이 부분 크게 기여해주셨다.
- 약 66.9%의 설명력을 가지며 p-value가 0.000이므로 유의하다고 할 수 있다.
- 잔차분석 : 오차의 등분산성, 독립성, 정규성을 모두 만족한다.

regression

 

graph


커피지수의 활용

커피지수는 지역별 구매력이 전체 평균에 비해 높은지, 낮은지를 나타내는 유용한 지표가 될 수 있으며 커피지수를 통해 각 지역의 물가 수준을 간접적으로 가늠해 볼 수 있는 수단이 될 수 있을 것이다.

최종 마무리

각 매장 데이터 수집 코드, 전처리 코드, 커피지수 도출 코드, 시각화 코드를 취합하여 정리했으며 팀 프로젝트 노션 페이지를 정리하고 발표를 위한 PPT를 작성했다.

반응형

댓글