Published on

스파크 아키텍쳐

Authors

cluster

여러 대의 컴퓨터가 마치 한대의 컴퓨터가 움직이는 것처럼 만든 것을 클러스터(cluster)라고 하며, 이를 통해 고가용성(High Availability)와 로드 밸런싱(load balancing) 그리고 병렬 프로세싱(parallel processing) 이 가능해진다.

YARN Runtime Architecture

PySpark Runtime Architecture