데브코스 TIL
5주차 - 3 [데이터 웨어하우스]
터칭 데이터
2023. 11. 15. 15:04
GROUP BY & Aggregate
1. 먼저 그룹핑 할 필드를 결정한다. (GROUP BY)
2. 그룹별로 계산할 내용을 결정한다. (Aggregate)
CTAS & CTE
CTAS는 SELECT를 사용해 테이블을 생성한다. 앞으로 자주 사용할 join등의 테이블을 미리 만들어 편리하게 재사용할 수 있다.
CTE는 FROM 안에 SELECT 쿼리를 nesting해주는 대신 With (테이블명) AS로 앞으로 자주 사용할 테이블을 임시로 만들어줄 수 있다.
반드시 체크해야할 데이터 품질 확인 방법들
1. 중복된 레코드들 체크하기
2. 최근 데이터의 존재 여부 체크하기
3. Primary key uniqueness가 지켜지는지 체크하기
4. 값이 비어있는 컬럼들이 있는지 체크하기