데이터 웨어하우스(Data Warehouse)
Redshift 벌크 업데이트 COPY
터칭 데이터
2023. 11. 28. 15:35
Redshift의 벌크 업데이트 방식 - COPY SQL
INSERT INTO는 record by record 방식이기 때문에 너무 많은 데이터 적재에는 시간이 오래 걸립니다.
그래서 모든 데이터 웨어하우스에서는 COPY SQL 기능을 제공하며 이를 이용해 벌크 업데이트를 진행합니다.
1. 먼저 압축율이 좋은 Binary 파일로 만들어 이를 Cloud Storage에 로딩합니다. (Redshift는 S3)
2. 그리고 이를 Redshift의 S3와 같은 Cloud Storage에 로딩합니다.
3. COPY SQL로 S3에서 데이터 웨어하우스 테이블로 한번에 복사합니다.
데이터 웨어하우스에서 일반적으로 사용하는 벌크 업데이트 (레코드 적재) 방식입니다.