터칭 데이터

다양한 시각화 툴 본문

데이터 웨어하우스(Data Warehouse)

다양한 시각화 툴

터칭 데이터 2023. 12. 1. 15:43

 

시각화 툴이란?

 

대시보드 혹은 BI(Business Intelligence)툴이라고 부르기도 함

 

KPI (Key Performance Indicator), 지표, 중요한 데이터 포인트들을 데이터를 기반으로 계산/분석/표시해주는 툴

 

결국은 결정권자들로 하여금 흔히 이야기하는 데이터 기반 의사결정을 가능하게 함
- 데이터 기반 결정 (Data-Driven Decision)
- 데이터 참고 결정 (Data-Informed Decision)

 

 현업 종사자들이 데이터 분석을 쉽게 할 수 있도록 해줌

 

 

 

 

어떤 툴들이 존재하나?

Excel, Google Spreadsheet: 사실상 가장 많이 쓰이는 시각화 툴
Python: 데이터 특성 분석(EDA: Exploratory Data Analysis)에 더 적합


Looker (구글)
Tableau (세일즈포스)
Power BI (마이크로소프트)


Apache Superset (오픈소스)
Mode Analytics, ReDash
Google Studio
AWS Quicksight(비권장, 성능↓)

 

 

 

 

 

 

 

Looker

2019년 6월 구글이 인수 (현재는 구글 클라우드의 일부)

 

특징

- 초기 학습곡선이 조금 가파르지만 이후에는 self-service와 커스터마이즈가 더 쉽습니다.

(Tableau는 처음의 setup이후에 수정이 매우 어려움)

- Looker는 처음 대시보드를 잘 만들어두면 비숙련자도 쉽게 가져다 사용할 수 있습니다.

(문제는 누구나 쉽게 만들 수 있다보니 시간이 지나면 Discovery문제가 발생할 수 있습니다.)

- LookML이 자체언어로 데이터 모델을 만드는 것으로 시작

 

 

 

 

 

 

 

Tableau

- Looker 이후로 마켓 리더의 지위가 흔들리는 중

- 무료 체험판을 제공

- Tableau와 Looker 모두 초기에 대시보드를 만드는 것은 힘들지만 결정적인 차이점은 만들어진 대시보드를 활용하는 난이도에 있습니다. Tableau는 극소수의 숙련자들이 대시보드를 활용할 수 있어 안정성과 일관성이 있는 반면 비숙련자의 self-service와 커스터마이징이 힘듭니다.

 

 

 

 

 

 

ReDash

(리대시라고 읽습니다.)

 

오픈소스로 시작

 

Superset과 상당히 흡사합니다.

- 더 강력한 쿼리 에디터를 제공하지만 사용자 권한 관련 기능은 부족합니다.

- Superset을 조금 더 많은 기업들이 사용

 

이번 실습에서 사용할 대시보드

 

 

 

 

 

 

 

 

 

Mode Analytics

조금 더 기술적(technical)인 인력을 대상으로한 애널리틱스 기능을 제공합니다.

KPI 대시보드라기 보다는 EDA(Exploratory Data Analysis) 툴에 가깝습니다.

 

 

 

 

 

 

 

 

 

어떤 시각화 툴을 선택할 것인가?

 

Looker 혹은 Tableau가 가장 많이 사용되는 추세

두 툴 모두 처음 배우는데 시간이 필요함(초기 학습곡선이 조금 가파르다)

Tableau의 가격이 더 싸고 투명하며 무료 버전도 존재해 공부가 가능

 

중요한 포인트는 셀프서비스 대시보드를 만드는 것

안 그러면 매번 사람의 노동이 필요해짐
 - 60-70%의 질문을 셀프서비스 대시보드로 할 수 있다면 대성공

 

또한 사용하기가 쉬워야 더 많은 현업 인력들이 직접 대시보드를 만들 수 있음
 - 데이터 민주화 (Data Democratization), 데이터 탈중앙화 (Data Decentralization)
 - 데이터 품질이 점점 더 중요해지며 데이터 거버넌스가 필요한 이유가 됨!


이런 측면에서는 Looker가 더 좋은 선택이지만 가격이 상당히 비쌈

그리고 Looker는 방치할 시 시간이 지나며 Discovery문제가 발생할 확률이 농후