facebook에서 쓴다는걸로 알고있음
no single point of failure → master node가 없음
Cassandra의 목적
CAP → consistency availability, partition tolerance → 셋중에 두개만 가능함
partition tolerance는 부장되어야 함 → 빅데이터
availability가 consistency보다 중요함 → 페북 포스트
tunable consistency → consistency ↔ availability 를 설정할 수 있다고 함
HBase → zookeeper또는 HBase Master가 죽으면 끝나버림
Cassandra는 availability를 어떻게 유지하는가
gossip protocol
row에 빠르게 접근할 수 있음
cassandra를 하나 복사해서 spark와 연동할 수도 있음
CQL
primary key
만 사용할 수 있음
keyspace
로 되어있어야 함
Spark와 같이 사용