ThinkCatLog

[Tableau] 퀵 테이블 계산 (2) : 다양한 계산 기능 본문

데이터 분석/Tableau

[Tableau] 퀵 테이블 계산 (2) : 다양한 계산 기능

생각냥 2024. 1. 17. 17:32

이전 글에서 이어집니다! 

1. [Tableau] 퀵 테이블 계산하기 (1) : 테이블과 패널

퀵 테이블 계산의 다양한 계산 기능

태블로 퀵 테이블 계산에서는 다양한 계산 기능을 제공합니다. 아래의 사진을 보면 총 11가지의 계산 기능을 제공하고 있다는 걸 알 수 있습니다. 한 가지씩 설명해보겠습니다.

퀵 테이블 계산 기능

누계

누계는 처음부터 특정 기준까지의 합을 모두 더한 값을 말합니다. 차례대로 누적해서 더해가는 이미지를 생각하면 좋습니다. 왼쪽의 차트는 2020년 1분기부터 2023년 4분기까지의 반품 건수를 나타낸 차트이며, 오른쪽의 사진은 2020년 1분기부터 계속해서 누적한 값을 나타낸 차트입니다.

분기별 반품 건수(왼) / 분기별 누적 반품 건수(오)

누계 : 이때 사용하면 좋을 것 같다!

특정 값이 1월부터 12월 까지 한해동안 누적된 건수를 확인하고 싶을 때 사용하면 좋을 것 같습니다.

예를 들어, 이커머스 회사라면 올해 월별로 주문건수가 어떻게 증가해왔는지에 대해서 누적건수로 시각화하면 어떻게 증가해왔는지 최종 값은 얼마인지를 효과적으로 나타낼 수 있을 것 같습니다. 

코로나 19가 한창이던 시절에 누적 확진자수도 누계를 활용해서 나타낸 값이라고 할 수 있습니다.


 

차이

차이는 기준 시점과의 차이를 계산합니다. 예를 들면 전년대비 증감폭이 있습니다. 오른쪽 차트는 왼쪽 차트에 대한 전 분기대비 반품 건수의 증감폭을 계산한 차트입니다. 아래 사진은 차이값을 전분기에 대해서 계산하지만 기준을 바꿔 계산할 수 있습니다.

분기별 반품 건수(왼) / 전분기대비 반품 건수 증감폭(오)

차이 : 이때 사용하면 좋을 것 같다!

차이는 기준 시점과의 비교를 하기 위해 사용됩니다. 보통 사회적 현상을 나타낼 때 많이 사용됩니다. 취업자수가 전월대비 증가/감소했다를 나타낼 때 많이 사용됩니다. 아래 취업자 증감 추이를 보면 2020년도에는 전년대비 취업자가 감소했지만, 2020년도부터 점점 취업자가 증가하고 있으며 그 증감 속도가 빨라지고 있다는 것을 알 수 있습니다.

출처 : 통계청 「경제활동인구조사」


비율차이

비율차이는 기준 시점에 대해서 얼마나 증가 또는 감소했는지에 대한 비율을 계산합니다. 아래와 같은 수식으로 나타낼 수 있으며 단위는 %입니다. 비율차이는 증감률이라고도 말합니다. 아래 오른쪽 차트는 왼쪽 차트에 대해서 전분기대비 반품건수가 얼마나 증가했는지에 대한 비율을 나타내는 차트입니다.

특정 시점의 비율차이 = (특정 시점 값 - 기준 시점 값) x 100 / 기준 시점 값 

분기별 반품건수(왼) / 전분기대비 반품건수 증감률(오)

비율차이 : 이때 사용하면 좋을 것 같다!

비율 차이는 증감률을 나타낼 때 사용됩니다. 증감폭이 있는데 증감률을 사용하는 이유는 절대적 비교가 아닌 상대적 비교를 하기 위함입니다. 50에서 50 증가하는 것과 100에서 50 증가하는 것의 차이를 나타내기 위해서입니다. 50에서 50이 증가했을 때는 100% 증가이지만 100에서 50 증가하는 것은 50% 증가하는 것입니다.

구성비율

구성비율은 각 차원값이 어느정도의 비율로 구성되어 있는지에 대한 값을 계산합니다. 아래 차트는 제품 대분류별 반품건수 구성비를 나타낸 파이차트입니다. 총 반품 건수 대비 특정 제품의 반품 건수의 구성비 값을 계산합니다.

제품 대분류별 구성비율 파이차트

구성비율 : 이때 사용하면 좋을 것 같다!

구성비율은 3-4가지의 차원이 있을 때, 그 차원에 해당되는 값을 비교할 때 사용하면 효과적이라고 생각됩니다. 너무 많은 차원이 있을 때 사용하게 된다면 각 차원 값 사이의 비율 차이가 작아져 구분하기 힘들게 됩니다. 

썩 좋지 않은 구성비율 이용 예


순위

순위는 값이 큰 순서대로 순위를 매기는 계산입니다. 아래 막대그래프의 왼쪽을 보면 순위가 매겨져 있습니다. 제품 중분류별 반품 건수를 기준으로 하여 반품 건수가 큰 순위를 매겼습니다.

제품 중분류별 반품 건수 순위

순위 : 이럴 때 이용하면 좋을 것 같다!

고객별 매출 순위를 매기고 싶을 때 사용하면 좋을 것 같습니다. 고객군을 나눌 때 매출 순위를 활용할 수 있을 것이라고 생각됩니다. 또는, 제품군별로 반품 건수 순위를 매겨 순위가 상위인 제품군을 확인하여 반품 대응 전략을 세울 수 있도록 순위값을 활용할 수 있습니다.

백분위수

백분위수는 해당 값이 전체를 0%부터 100 사이의 값으로 어디에 위치해 있는지를 나타내는지 계산합니다. 왼쪽의 테이블과 같이 가장 큰 값을 100%로 두고 계산할 수도 있으며 오른쪽 테이블과 같이 가장 큰 값을 0%로 두고 계산할 수 있습니다.

백분위수 오름차순(왼) / 백분위수 내림차순(오)

백분위수 : 이럴 때 사용하면 좋을 것 같다!

상위 n%를 확인하고 싶을 때 사용하면 좋을 것 같습니다. 만약, 고객 중 상위 10%의 매출 기록이 있는 고객들에게 특별 혜택을 드릴 때 사용할 수 있습니다.

이동평균

이동평균은 시계열 차트에서 주로 사용됩니다. 이동평균은 말그대로 이동하면서 특정기간의 평균값을 계산하는 것입니다. 만약 3개월 이동평균이라면 3개월 간의 평균을 계속해서 이동하면서 평균값을 계산하는 것입니다. 아래 차트는 월별 매출값과 3개월 이동평균, 6개월 이동평균 값을 함께 나타낸 차트입니다. 이동평균을 통해 평범한 매출액의 변동보다 좀 더 안정된 시계열을 그릴 수 있습니다. 이동평균을 통해 좀 더 추세를 정확하게 표현할 수 있습니다.

매출액과 3개월 이동평균과 6개월 이동평균

이동평균 : 이럴때 쓰면 좋을 것 같다!

시계열 차트의 변동이 너무 심할 때, 좀더 안정화된 그래프를 나타내고 싶을때 사용하면 유용하게 사용할 수 있을 것 같습니다. 이동평균 계산의 구간을 잘 선택하면 트렌드를 확인하기 좋은 그래프를 나타낼 수 있을 것 같습니다.


그 외에도...

위에서 서술한 퀵테이블 계산 이외에도 다음과 같은 4가지 퀵 테이블 계산이 있습니다. 이 계산들은 위의 계산들과 특별히 다른 계산은 아니고 위의 계산을 사용하여 만든 특정 용도의 계산입니다. 비즈니스에서 자주 사용하는 계산입니다. 

4가지 퀵 테이블 계산

YTD 총계, YTD 성장률

YTD는 Year-To-Date의 약자로 연도별로 첫 단위날짜부터 계산한 값을 말합니다. 예를 들어, 2023년 3분기 YTD 총계는 2023년 1분기, 2분기, 3분기를 모두 합한 값입니다. YTD 성장률은 2023년 3분기 YTD 총계를 전년도 3분기 YTD 총계에 대한 비율 차이를 계산한 값을 말합니다. 왼쪽 테이블은 YTD 매출 총계 값이고, 오른쪽 테이블은 YTD 성장률 값이다.

YTD 총계(왼) / YTD 성장률(오)

통합 성장률

통합 성장률은 테이블에 나타낸 전체 기간중 첫번째를 기준으로 비율차이(증감율)을 나타낸 값입니다. 아래 테이블은 2020년부터 2023년까지의 통합성장률을 나타낸 테이블입니다. 2020년 1분기가 0%인 이유는 2020년 1분기가 기준이기 때문입니다. 

2020-2023 매출 통합 성장률

전년대비 성장률

전년대비 성장률은 전년도의 같은 기간에 대한 비율 차이(증감률)을 말합니다. 뉴스에서 전년 동월 대비, 전년 동기 대비 등의 말을 들어보셨을 것입니다. 이 말이 전년도 같은 기간에 대한 증감율을 나타내는 말입니다. 아래 테이블은 2020년-2023년 전년 동기 대비 성장률을 나타낸 테이블입니다. 2020년도의 테이블이 비어있는 이유는 2020년도가 테이블에 표시한 첫 연도이기 때문입니다.

전년대비 성장률


기능은 기능일 뿐!

단순히 기능을 아는 것은 의미가 없습니다. 이 기능을 적재적소에 사용하여 사람들에게 인사이트를 전달할 수 있는 시각화를 하는 것이 더 중요합니다. 기능은 알아두되 기능을 사용해보는 것에 매몰되지 않고, 이 기능들이 적절히 사용 될 수 있을 때에 사용 하는 것이 중요할 것 같습니다.


이 글은 부스트코스에서 무료 제공하는 강의인 강승일 강사님의 〖데이터 시각화를 위한 태블로〗의 3장을 듣고 기록을 위해 남기는 글입니다. 강의가 궁금하시면 아래 링크를 참고하시길 바랍니다!

https://www.boostcourse.org/ds121

사용된 툴과 데이터셋

태블로 데스크탑 2023.3
데이터셋 : Superstore (강의에서 제공되는 데이터)