Kafka와 Spark Streaming

1장 퀴즈 리뷰

터칭 데이터 2024. 1. 23. 11:58

 

2. Udemy 데이터 시스템 발전 여정 살펴보기


Udemy 데이터 시스템이 어떻게 배치에서 실시간으로 발전했는지 그 여정을 살펴보자

 

 

 

 

 

Contents


1. 1장 퀴즈 리뷰
2. Udemy 데이터팀 빌딩 여정
3. Udemy 추천엔진 발전 요약
4. Udemy 추천엔진 1기
5. Udemy 데이터 인프라 클라우드 이전
6. Udemy 추천엔진 2기
7. 사용자가 유데미를 방문하면 무슨 일이 벌어질까?
8. Udemy 이벤트 처리 시스템 2기

 

 

 

 

 

 

 

1장 숙제 리뷰


1장 퀴즈를 같이 풀어보자


1장 퀴즈: https://forms.gle/3nu6zAQuVkA1cVtF9

 

 

 

구글이 다른 검색엔진보다 뒤어난 결과를 보여주는데 기본이 되었던 알고리즘의 이름은 무엇인가?

 

Brain Rank (존재 X)

Page Rank

Attention is All you Need

 

 

 

 

다음 중 구글이 공헌한 프로젝트나 오픈소스가 아닌 것은?

 

Tensorflow

Docker

Kubernetes

 

 

 

 

다음 중 SLA라는 형태로 약속되는 것이 아닌 것은?

 

Uptime

Latency

Data Freshness

위의 모든 것들이 SLA로 어디까지 보장하는지 정의 가능하다

 

 

 

 

람다 아키텍처에 대한 설명으로 맞는 것은?

 

배치 처리 레이어와 실시간 처리 레이어 두 개를 운영하여 주기적으로 배치 처리를 하고 배치 처리 사이의 데이터는 실시간처리 레이어로 처리

 

람다 아키텍처란 파이썬등에서 Functional programming을 할때 사용되는 함수 정의 방법이다.

 

Serverless Computing을 구현할 때 사용되는 아키텍처이다

 

 

 

 

다음 중 Kafka처럼 메세지 큐를 중심으로 만들어진 실시간 처리 시스템에서 필요하지 않은 컴포넌트는?

 

Producer

Message Queue

Consumer

Worker

 

 

 

 

Kafka에서 이벤트 스트림을 뭐라 부르는가?

 

Partition

Data Block

Topic

 

 

 

 

다음 중 Kafka에 대한 설명으로 틀린 것은?

 

데이터 생성자와 소비자를 분리함으로써 시스템의 안정성이 높다

하나의 이벤트 스트림 데이터에 대한 별다른 노력이 다수의 Consumer 지원이 가능하다

Kafka Topic으로 저장되는 데이터들은 기본적으로 보존 기한이 무한대이다