본문 바로가기
AI SCHOOL/TIL

[DAY 96] 데이터톤 3일차 - 데이터 분석

2023. 5. 12.

데이터톤 3일차 풀필먼트 서비스 시범 도입을 제안할 매장을 선정하기 위해 데이터를 분석해 봤다.

어떤 매장을 전환 대상으로 지정할지 결정하는 근거 마련이 어려웠다.

매출, 매장 데이터 분석

df

위 데이터는 날짜, 매장 번호, 품목별 매출 데이터에 일별 유가, 매장 정보를 병합한 데이터다.
다른 변수들은 모두 매우 직관적이지만 type와 cluster는 직관적이지 않았다. 각각 어떤 의미인지 알아내고 싶었다.

cluster

클러스터별로 매출 합계에 차이가 많이 나는 것을 알 수 있었다. 클러스터별로 속한 매장 수의 차이가 있기 때문에 그런 것 같다.

type

타입별로 각 매장 매출 합계의 평균을 살폈다. 확실히 A 타입의 매장 매출이 높고 C 타입은 낮은 것이 보인다.

클러스터와 타입별 매출을 확인했고 각 매장이 어느 도시에 위치하고 있는지에 대해 함께 봤지만 같은 클러스터 혹은 타입의 매장 사이에 유사한 점은 확인되지 않았다.
또한 판매 제품군에서도 타입끼리, 클러스터끼리 크게 다르지 않고 식료품, 생필품 위주인 것을 확인했다.
결론적으로 타입과 클러스터가 어떤 기준으로 분류되었는지에 대해선 명확히 알아낼 수 없었다.

다음으로는 매장별 매출과 성장률을 살펴봤다.

yearmonth

상위 3위, 하위 3위 매장만 회색이 아닌 색상으로 표시한 라인그래프를 그렸다.
매출이 잘 나오는 매장과 잘 나오지 않는 매장을 직관적으로 확인할 수 있다.

number

약 4년 6개월간 Quito의 각 매장의 매출은 평균 127.96% 증가했다. 그러나 10번 매장은 특히 확연히 낮은 증가율을 보이는 것이 확인된다.

현재 운영 매장을 풀필먼트 센터로 전환하기 위해선 매출, 매장 규모, 매장 위치를 최우선적으로 고려해야 할 것 같은데 가지고 있는 매장 정보가 매장의 규모와 위치를 포함하고 있지 않고 있어서 쉽지 않다.

일단 매출도 가장 낮고, 매출 증가율도 가장 낮은 10번 매장으로 눈이 간다.

앞으로 추가적인 분석을 통해 매장 선정과 논리적 근거를 마련해야겠고 의미 있는 그래프를 시각적으로 그릴 계획이다.

반응형

댓글