一、RDD持久化
1.什么時候該使用持久化(緩存)
2. RDD cache & persist 緩存
3. RDD CheckPoint 檢查點
4. cache & persist & checkpoint 的特點和區別
特點
區別
?二、cache & persist 的持久化級別及策略選擇
Spark的幾種持久化級別:
1.MEMORY_ONLY
2.MEMORY_AND_DISK
3.MEMORY_ONLY_SER
4.MEMORY_AND_DISK_SER
5.DISK_ONLY
6.MEMORY_ONLY_2, MEMORY_AND_DISK_2, 等等
策略選擇