본문 바로가기

Tableau

[Tableau 독학하기] 시작,

 

Intro 

대학교 4학년, R을 활용해 경영데이터를 분석하는 강의를 수강한 적이 있다.

매주 교수님이 주신 과제물 하나만 떠안고 아침부터 밤까지 코드만 짜며 세상을 원망하던 문과생은 뒤죽박죽 결과물을 기어코 만들어 냈을 때 다시금 세상 모든 것이 사랑스러워 보이는 것을 느꼈다.

아마 그때부터 코딩의 '코'자도, 데이터의 '데'자도 모르는 문과생이 험난한 여정을 택한 것 같다.

'데이터 분석가'라는 꿈에 젖은 그는 여러 분석툴을 홀로 공부하고 있다.

이 카테고리는 그중 태블로에 관한 기록이다.

 

Before ...

앞으로 태블로를 사용해 데이터를 시각화하는(대시보드 제작) 절차와 참고해야 할 사항을 아래와 같이 정리하고자 한다.

 

 I. Context 

데이터를 분석해야 하는 가장 큰 이유는 우리가 갖고 있는 문제를 더 정확하게 해결하기 위함일 것이다.

따라서 데이터를 시각화하기 전에 가장 먼저 해야 할 일은 '현재 상황을 파악하는 것'이다.

뭐가 부족한지를 알아야 무엇으로 채워야 할 지 알 수 있기 때문이다.

 

이 단계에서의 구체적인 행동요령은 다음과 같다.

  • 대시보드의 목적 정의하기
  • 목적에 따른 지표 설계하기
  • 대시보드 초안 설계하기

 

II. Risk & Opportunity

현재 처한 문제 상황을 알았다면, 그 상황을 해결할 수 있는 대책을 찾아볼 필요가 있다.

주먹구구식 혹은 카더라로 이루어진 대책은 구멍난 장독대를 손으로 막는 것과 다를 바 없으며, 손으로 하늘을 가리는 것과 같다.

이때 데이터의 힘이 발휘된다.

데이터는 우리의 '진짜' 패턴을 바탕으로 문제 해결 과정에서 만날 위험과 기회를 확인시켜 준다.

따라서 우리는 데이터가 보여주는 정보를 갖고 어떤 액션을 취할지만 고려하면 된다.

 

이 단계에서의 구체적인 행동요령은 다음과 같다.

  • 지표 구성에 필요한 데이터 가공 및 추출
  • 워크시트 및 대시보드 제작

 

III. Insight

이전 단계에서 언급한 바와 같이, 데이터가 정보를 보여줬다면 우리는 앞으로의 행동 방향을 취사선택하면 된다.

이때 우리의 액션을 구체적이고 명확한 표현으로 정리해야 하는데, 그 요소는 다음과 같다.

1) What : 무엇을 해야 하는가?

2) Why : 왜 그것이 변해야 하는가?

3) How : 어떻게 긍정적인 변화를 만들 것인가?

 

이 단계에서의 구체적인 행동요령은 다음과 같다.

  • 사용자에게 대시보드 구성내용 안내하기
  • 대시보드 활용 예시 보여주기

 

IV. 기타

대시보드를 제작하는 목적은 '데이터'라는 복잡하고 방대한 요소를 모든 사람들이 각자의 일상에 적절히 활용할 수 있게 하기 위함이다.

따라서 대시보드는 사용자의 직관성과 편의성을 반드시 고려해야 하는 창작물의 성격을 지니므로, 몇가지 유념사항을 아래와 같이 정리하고자 한다.

 

1) 노이즈는 최소화, 시그널은 최대화

정보 전달의 효율성을 고려해 하나의 시각화 자료에는 사용자가 이해할 수 있는 분량만큼의 데이터만 포함한다.

 

2) 데이터 잉크 비율 높이기

'Data-Ink Ratio(데이터잉크비율)'은 Edward Tufle이 제창한 데이터 시각화 원칙으로, Data-ink 대비 Data-ink와 Non data-ink의 합으로 계산된다.

1번 사항에서 설명한 것에 따라, Data-ink는 시그널로 Non data-ink는 노이즈로 해석할 수 있다.

불필요한 곳에 사용하는 색상은 줄이고 반드시 확인해야 하는 데이터에 색상으로 포인트를 주는 것이 사용자의 직관성을 높이는 방법이다.

 

3) 시각 속성 활용하기

인간은 '위치-길이-방향-각도-면적-부피-채도'의 순으로, 시각자료에 포함된 차이를 인지할 수 있다고 한다.

따라서 길이를 활용한 막대 차트에 비해 각도를 활용한 파이 차트나 면적을 활용한 영역 차트는 정확한 판단이 다소 어려운 측면이 있다.

만일 파이 차트를 사용하고자 한다면, 길이 속성과 텍스트 정보를 함께 쓸 수 있는 도넛 차트를 추천하는 의견도 있다.

 

4) 3D 차트 지양

3D 자료의 특성상 왜곡된 정보가 전달될 수 있으므로 데이터 시각화에는 최대한 활용하지 않는 것이 좋다.

 

5) 막대그래프의 축 시작은 0부터 

축이 0부터 시작하지 않을 경우 요소 간 차이가 과도하게 강조되어 사실을 왜곡할 수 있다.

그러나 경향을 나타내는 꺾은선 그래프의 경우, 뚜렷한 경향 차이를 보이는 부분만 잘라내어 활용하는 것이 더 효과적이다.

 

6) 이중축은 주의해서 활용하기

이중축은 사용자로 하여금 그래프 해석에 혼란을 줄 수 있어 가급적 둘을 분리해서 보여주는 것이 좋다.

 

7) 산포도는 가로축에 '원인', 세로축에 '결과'

산포도의 상관관계는 인과관계를 나타내지는 않지만,

일반론으로 성립된다고 생각할 경우 X축에 선행요소, Y축에 후행요소를 대입하는 것이 해석을 용이하게 할 수 있다.

 

8) 시간 축은 가로축이 기본

시간은 가로로 배치하는 편이 사용자가 경향을 인식하기 훨씬 편리하다.

 

 

본문의 내용은 패스트캠퍼스의 「태블로 데이터 시각화 첫걸음 시작하기」 강의 자료와 태블로 위키 콜라보레이터 정해원님의 게시글(https://tableauwiki.com/tableau-coupon-promotion-monitoring-dashboard/)을 참고하였습니다.