본문 바로가기
AI SCHOOL/TIL

[DAY 47] Tableau 시작 - 원본 페이지, 주요 키워드, 차트 그리기

2023. 3. 4.

Special Lecture Tableau 첫 강의였다.

오전 시간에는 비디오 강의를 통해 태블로의 기본적인 것을 학습한 후 오후 실시간 강의에서 다양한 데이터를 시각화했다.

Tableau(태블로)

데이터 리터러시가 강조되고 있는 요즘, 태블로는 국내와 세계에서 점차 활용 기업이 늘어나고 있는 시각화 도구다.

Data Literacy : 데이터를 보고 활용할 수 있는 능력
- 탐색(Explore)을 통해 본인이 이해(Understand)하고 이를 다른 사람과의 대화(Communication)와 협업(Collaboration)을 통해 찾은 통찰(Insight)을 공유(Share)하는 일련의 능력

태블로 시작

파일에 연결을 통해 excel 파일의 데이터를 사용할 수 있다
연결한 후 이름을 확인하면 엑셀 시트의 이름을 확인할 수 있으며 변경이 가능하다.

필드에서 데이터 유형, 필드명, 물리적 테이블, 원격 필드명을 확인할 수 있다.

이름과 필드 우측에 있는 데이터 그리드에서 각각의 필드를 사용할지에 따라 숨기기/숨기기 취소가 가능하며 톱니바퀴 아이콘을 눌러 숨겨진 필드 표시 on/off가 가능하다.

우상단에서 필터 편집이 가능하다.
- ex) 2019~2022년 데이터에서 특정 연도만 확인하고 싶은 경우 등

필터의 좌측에서 라이브 연결과 추출 연결이 라디오버튼으로 되어 있다.
- Live : 데이터를 DB 또는 원본 파일에 남겨둔다. 이 방법은 고성능 DB의 기능을 활용하거나 Tableau에서 시각화된 데이터를 최신 상태로 변경하려는 경우에 적합하다. 그러나 DB에 따라 속도가 느려질 수 있다.
- Extract : Tableau의 고성능 인메모리 데이터 엔진에 데이터를 추출하도록 선택할 수 있다. 느린 DB에 연결하거나 중요한 시스템에서 쿼리 로드를 제거할 때 유용하다. 새로고침을 통해 수동으로 갱신이 가능하다.
- 무료 버전인 Tableau Public에선 추출이 기본 옵션이고 선택이 불가하다.

main
데이터 원본 화면

SUPERSTORE_2019-2022.xlsx 파일을 연결한 화면이다. 이름을 주문->주문 테이블로 변경했으며 배송기간 필드를 숨기기 처리하고 숨겨진 필드 표시 on 상태기 때문에 흐린 색으로 표시된다.

태블로 주요 키워드

연속형 필드는 초록색, 불연속형 필드는 파란색으로 구분한다.

측정값은 숫자 형식이며 액션(drag and drop 또는 double click)을 통해 차트를 생성하고, 차원은 그 숫자들로 만들어진 차트를 어떻게 나누어 볼 것인지 결정한다.
- 측정값은 집계, 기본 속성을 설정
- 차원은 많을수록 그래프의 덩어리가 많다고 이해

색상 마크를 연속형으로 설정 시 그라데이션으로 표시가 가능하며 불연속형으로 설정 시 명확히 구분되는 색으로 표시된다.

계산된 필드 만들기
- 데이터 원본에 없는 새로운 필드를 만드는 것
- 겉으로 드러나지 않은 인사이트를 발굴하는 요소
- ex) 매출이 2억보다 큰 경우와 아닌 경우의 구분이 필요한 경우

1. 기본 계산
- 데이터 원본 세부 수준(행 수준 계산) 또는 Viz 세부 수준(집계 계산)에서 값 또는 멤버를 변환할 수 있다.
- ex) 수익률 : sum([수익]) / sum([매출])
2. LOD(Level of Detail expressions, 세부 수준) 식
- LOD 계산을 사용하면 계산할 세부 수준을 세부적으로 제어
- Viz의 세부 수준을 기준으로 더 세분화된 수준(Include), 덜 세분화된 수준(Exclude) 또는 완전히 독립적인 수준(Fixed)에서 LOD 계산을 수행할 수 있다.
- ex) 고객별 첫 구매일 : {fixed [고객명] : min([주문 일자])}
3. 테이블 계산
- 테이블 계산을 사용하면 Viz 전용 세부 수준에서 값을 변환할 수 있다.
- ex) 구성 비율 : sum([매출]) / total(sum([매출]))

차트 만들기

막대 차트
태블로의 가장 기본적인 시각화 방식
- 범주끼리 비교
- 순위를 비교
- 추세 확인

bar1
범주끼리 비교

제품 중분류별 매출 합계를 표시한 막대 차트로, 매출이 2억 이상일 때와 미만일 때 다른 색의 막대로 표시되도록 필터를 적용하였다.

bar2
추세 확인

2019~2022년의 월별 매출 합계 추세를 막대 차트를 그려 확인하였다.

라인 차트
왼쪽에서 오른쪽으로 이동하면서 확인할 수 있도록 그리기
추세선이나 마크 표시, 예측 표시 가능, 이동평균 적용 가능

lin1
비직관적인 라인 차트

매출 추이를 위에서 아래 방향으로 확인해야 해서 보기에 불편하다.

line2
직관적인 라인 차트

이렇게 왼쪽에서 오른쪽 방향으로 확인하는 라인 차트가 직관적이다.
최소, 최대 값에 레이블 값을 표시했다.

맵 차트
태블로에선 시도명, 시군구명이 있다면 맵 형태로 표현 가능
국가, 지역, 시도, 시군구 계층으로 표현 가능

map1

우리나라 전역의 200여 개 이상의 자치구를 지도에 표현할 수 있다.

이중 축
제한된 공간에서 복수개의 값을 비교할 때 사용
- 축 동기화 가능
- 축 머리글 표시 on/off 가능
- 그래프 겹칠 때 레이블 표시 유의

double1

이중축 차트를 통해 고객 세그먼트별 연도별 수익 추이를 확인했다.

부분 전체 분석
전체에서 각각이 차지하는 비율이 어느 정도인지 계산
- 파이차트와 도넛 차트가 대표적
- 분류가 4개 이하인 경우 추천하며 그 이상인 경우 비직관적일 수 있다.

pie

주문 연도별로 고객 세그먼트별 주문 수량 합계 비율을 파이차트로 시각화했다.
세그먼트별 이름 아래 주문 수량과 비율주문을 표시하였고 수량이 많을수록 파이가 커지도록 했다.

donut

도넛 차트는 파이 차트를 두 개 겹쳐 만든다. 작은 파이 차트를 흰색으로 만들어 큰 파이 차트 가운데 넣으면 도넛 모양이 된다.
세그먼트 이름 아래 비율을 표시하였으며 도넛 가운데에 전체 수량을 표시하였다.

데이터 필터 및 정렬
- 계산식을 만들어 필터 적용
- ex) "계절" 계산식을 만들어 매출을 3개월씩 구분하여 필터링 후 봄, 여름, 가을, 겨울 순으로 정렬

filete

봄, 여름, 가을, 겨울로 패널을 구분짓고 정렬하여 1~12월 순서로 정렬과는 다르다.


지금까지 배운 파이썬, SQL, 통계와 다르게 태블로는 완전 노베이스 상태로 처음이어서 낯설었지만 오히려 재미있었다.

반응형

댓글