데브코스 TIL

5주차 - 3 [데이터 웨어하우스]

터칭 데이터 2023. 11. 15. 15:04

 

 

 

 

GROUP BY & Aggregate

1. 먼저 그룹핑 할 필드를 결정한다. (GROUP BY)

2. 그룹별로 계산할 내용을 결정한다. (Aggregate)

 

 

 

CTAS & CTE

CTAS는 SELECT를 사용해 테이블을 생성한다. 앞으로 자주 사용할 join등의 테이블을 미리 만들어 편리하게 재사용할 수 있다.

 

CTE는 FROM 안에 SELECT 쿼리를 nesting해주는 대신 With (테이블명) AS로 앞으로 자주 사용할 테이블을 임시로 만들어줄 수 있다.

 

 

 

 

반드시 체크해야할 데이터 품질 확인 방법들

1. 중복된 레코드들 체크하기

2. 최근 데이터의 존재 여부 체크하기

3. Primary key uniqueness가 지켜지는지 체크하기

4. 값이 비어있는 컬럼들이 있는지 체크하기

 

 

 

 

 

 

 

GROUP BY & Aggregate

 

 

 

CTAS & CTE, 테이블 데이터 품질 확인