터칭 데이터
Redshift Snapshot 백업과 테이블 복구 본문
Redshift가 지원하는 데이터 백업 방식
기본적으로 백업 방식은 마지막 백업으로부터 바뀐 것들만 저장하는 방식:
이를 Snapshot이라고 부름
백업을 통해 과거로 돌아가 그 시점의 내용으로 특정 테이블을 복구하는 것이 가능 (Table Restore)
또한 과거 시점의 내용으로 Redshift 클러스터를 새로 생성하는 것도 가능
자동 백업:
기본은 하루이지만 최대 과거 35일까지의 변경을 백업하게 할 수 있음.
이 경우 백업은 같은 지역에 있는 S3에 이뤄짐.
다른 지역에 있는 S3에 하려면 Cross-regional snapshot copy를 설정해야함. 이는 보통 재난시 데이터 복구에 유용함
매뉴얼 백업:
언제든 원할 때 만드는 백업으로 명시적으로 삭제할 때까지 유지됨 (혹은 생성시 보존 기한 지정)
고정비용인 일반 Redshift 백업
자동백업
기본 1일 보관에서 35일까지 늘리고 싶다면?
관련 Redshift 클러스터의 Maintenance 탭 -> Backup details -> Edit
드롭다운박스에서 원하는 보관일수 선택
매뉴얼 백업
백업에서 테이블 복구
해당 Redshift 클러스터에서 “Restore table” 메뉴 선택
복구 대상이 있는 백업(Snapshot) 선택
원본 테이블 (Source table) 선택
어디로 복구될지 타켓 테이블 선택
Redshift Serverless가 지원하는 데이터 백업 방식
실습에 사용중인 Redshift Serverless는 Redshift와 다르게 가변비용입니다.
고정비용 Redshift에 비하면 제한적이고 조금더 복잡합니다.
일단 Snapshot 이전에 Recovery Points라는 것이 존재합니다.
Recovery Point를 Snapshot으로 바꾼 다음에 여기서 테이블 복구를 하거나 이것으로 새로운 Redshift 클러스터 등을 생성하는 것이 가능합니다.
Recovery Points는 과거 24시간에 대해서만 유지됩니다.
고정비용에서는 스냅샷이 바로 존재하지만 가변비용에서는 Recovery Points에서 스냅샷을 생성해야 합니다.
왜냐하면 고정비용은 이미 비용을 고정적으로 지불했기 때문에 정해진 스토리지가 존재하고 그곳에 바로 스냅샷을 잡을 수 있습니다. 반면에 가변비용은 컴퓨팅과 스토리지가 별개로 존재하고 사용한 만큼 지불하기 때문에 확보된 공간이 없어 계속 스냅샷을 잡을 수 없기 때문입니다.
그래서 Redshift Serverless는 고객의 지난 24시간 기록만 보관하고 이를 백업에 사용할 수 있게 해줍니다.
Redshift 클러스터에서 Redshift Serverless의 네임스페이스를 클릭한 후 위와 같은 화면을 보시면 더 이해하시기 쉬울 것입니다. 지난 24시간의 기록들 중 사용할 복구 시점을 선택해 스냅샷을 생성하고 이를 이용해 백업을 진행합니다.
정리하면 Redshift Serverless는 매뉴얼 백업을 사용할 수 있고 자동백업은 지난 24시간만 그것도 복구 시점(Recovery Points)에서 특정 시간대를 골라 스냅샷을 생성한 뒤 사용할 수 있습니다.
'데이터 웨어하우스(Data Warehouse)' 카테고리의 다른 글
Redshift Spectrum, Athena, ML 개념 (0) | 2023.11.29 |
---|---|
7주차 - 3 [데이터 웨어하우스] (0) | 2023.11.29 |
Redshift 권한 (0) | 2023.11.29 |
Redshift 벌크 업데이트(COPY) - 2 (0) | 2023.11.28 |
Redshift 벌크 업데이트(COPY) - 1 (0) | 2023.11.28 |