前言
SparkSQL关于缓存的操作语句官方给了三种:
- CACHE TABLE(缓存表)
- UNCACHE TABLE(清除指定缓存表)
- CLEAR CACHE(清除所有缓存表)
下面我们详细讲解这些语句的使用方法。
CACHE TABLE
CACHE TABLE 语句使用给定的存储级别缓存表的内容或查询的输出。如果一个查询被缓存,那么将为此查询创建一个临时视图。这减少了在未来的查询中对原始文件的扫描。说白了就是重复查询一张表,如果该张表被缓存了,那么第二次使用的时候就会从缓存中读数据,显然效率会很快。
- 语法
CACHE [ LAZY ] TABLE table_identifier
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
参数详解:
LAZY
仅在首次使用表时缓存它&#