터칭 데이터
다양한 시각화 툴 본문
시각화 툴이란?
대시보드 혹은 BI(Business Intelligence)툴이라고 부르기도 함
KPI (Key Performance Indicator), 지표, 중요한 데이터 포인트들을 데이터를 기반으로 계산/분석/표시해주는 툴
결국은 결정권자들로 하여금 흔히 이야기하는 데이터 기반 의사결정을 가능하게 함
- 데이터 기반 결정 (Data-Driven Decision)
- 데이터 참고 결정 (Data-Informed Decision)
현업 종사자들이 데이터 분석을 쉽게 할 수 있도록 해줌
어떤 툴들이 존재하나?
Excel, Google Spreadsheet: 사실상 가장 많이 쓰이는 시각화 툴
Python: 데이터 특성 분석(EDA: Exploratory Data Analysis)에 더 적합
Looker (구글)
Tableau (세일즈포스)
Power BI (마이크로소프트)
Apache Superset (오픈소스)
Mode Analytics, ReDash
Google Studio
AWS Quicksight(비권장, 성능↓)
Looker
2019년 6월 구글이 인수 (현재는 구글 클라우드의 일부)
특징
- 초기 학습곡선이 조금 가파르지만 이후에는 self-service와 커스터마이즈가 더 쉽습니다.
(Tableau는 처음의 setup이후에 수정이 매우 어려움)
- Looker는 처음 대시보드를 잘 만들어두면 비숙련자도 쉽게 가져다 사용할 수 있습니다.
(문제는 누구나 쉽게 만들 수 있다보니 시간이 지나면 Discovery문제가 발생할 수 있습니다.)
- LookML이 자체언어로 데이터 모델을 만드는 것으로 시작
Tableau
- Looker 이후로 마켓 리더의 지위가 흔들리는 중
- 무료 체험판을 제공
- Tableau와 Looker 모두 초기에 대시보드를 만드는 것은 힘들지만 결정적인 차이점은 만들어진 대시보드를 활용하는 난이도에 있습니다. Tableau는 극소수의 숙련자들이 대시보드를 활용할 수 있어 안정성과 일관성이 있는 반면 비숙련자의 self-service와 커스터마이징이 힘듭니다.
ReDash
(리대시라고 읽습니다.)
오픈소스로 시작
Superset과 상당히 흡사합니다.
- 더 강력한 쿼리 에디터를 제공하지만 사용자 권한 관련 기능은 부족합니다.
- Superset을 조금 더 많은 기업들이 사용
이번 실습에서 사용할 대시보드
Mode Analytics
조금 더 기술적(technical)인 인력을 대상으로한 애널리틱스 기능을 제공합니다.
KPI 대시보드라기 보다는 EDA(Exploratory Data Analysis) 툴에 가깝습니다.
어떤 시각화 툴을 선택할 것인가?
Looker 혹은 Tableau가 가장 많이 사용되는 추세
두 툴 모두 처음 배우는데 시간이 필요함(초기 학습곡선이 조금 가파르다)
Tableau의 가격이 더 싸고 투명하며 무료 버전도 존재해 공부가 가능
중요한 포인트는 셀프서비스 대시보드를 만드는 것
안 그러면 매번 사람의 노동이 필요해짐
- 60-70%의 질문을 셀프서비스 대시보드로 할 수 있다면 대성공
또한 사용하기가 쉬워야 더 많은 현업 인력들이 직접 대시보드를 만들 수 있음
- 데이터 민주화 (Data Democratization), 데이터 탈중앙화 (Data Decentralization)
- 데이터 품질이 점점 더 중요해지며 데이터 거버넌스가 필요한 이유가 됨!
이런 측면에서는 Looker가 더 좋은 선택이지만 가격이 상당히 비쌈
그리고 Looker는 방치할 시 시간이 지나며 Discovery문제가 발생할 확률이 농후
'데이터 웨어하우스(Data Warehouse)' 카테고리의 다른 글
Superset - 만들어 볼 대시보드 소개 (0) | 2023.12.01 |
---|---|
Superset (0) | 2023.12.01 |
Snowflake 기타 기능과 사용 중단하기 (0) | 2023.11.30 |
Snowflake Data Governance 관련 기능 (0) | 2023.11.30 |
Snowflake Role과 User 생성 (0) | 2023.11.30 |