为什么需要定时任务?
常见业务场景:
1、支付10min失效
2、某系统凌晨进行数据备份
3、视频网站定时发布视频
4、媒体聚合平台每10min抓取某网站数据为己用
……
这些场景需要我们在某个特定时间去做某些事情。
单机定时任务技术有哪些?
Timer
java.util.Timer 是 JDK 1.3 开始就支持的一种定时任务的实现方式。
Timer 内部使用了一个 TaskQueue 的类,它是一个通过最小堆实现的优先队列。TaskQueue 按照任务距离下一次执行时间的大小将任务排序,保证在堆顶的元素最先执行。这样在需要执行任务的时候,每次取出堆顶的元素即可。
Timer 使用起来比较简单,通过下面的方式就能创建一个 2s 之后执行的定时任务。
// 定义一个 task
TimerTask task = new TimerTask() {
@Override
public void run() {
System.out.println("time: " + new Date() + "n" +
" name: " + Thread.currentThread().getName());
}
};
System.out.println("time: " + new Date() + "n" +
" name: " + Thread.currentThread().getName());
Timer timer = new Timer("Timer");
// 延迟时间
long delay = 2000l;
timer.schedule(task, delay);
后一个任务延迟 2s 才进行执行
time: Thu Aug 29 17:15:33 CST 2024n name: main
time: Thu Aug 29 17:15:35 CST 2024n name: Timer
不过 Timer 的任务只能串行执行,对性能的影响比较大,任务执行时间过长会影响其他任务,发生异常的时候会直接停止。
ScheduledThreadPoolExecutor 支持多线程执行定时任务并且功能更强大,是 Timer 的上级替代
ScheduledExecutorService
ScheduledExecutorService 是一个接口,有多个实现类,比较常用的就是 ScheduledThreadPoolExecutor。
ScheduledThreadPoolExecutor 本身是一个线程池,支持任务并发执行。并且其内部使用 DelayQueue 作为任务队列。
// 定义一个 task
TimerTask task = new TimerTask() {
@Override
public void run() {
System.out.println("time: " + new Date() + "n" +
" name: " + Thread.currentThread().getName());
}
};
System.out.println("time: " + new Date() + "n" +
" name: " + Thread.currentThread().getName());
// 创建一个线程池
ScheduledExecutorService executor = Executors.newScheduledThreadPool(3);
// 首次等待时间和间隔等待时间
long delay = 2000L;
long period = 1000L;
executor.scheduleAtFixedRate(task, delay, period,
TimeUnit.MILLISECONDS);
运行结果:
time: Thu Aug 29 17:28:08 CST 2024n name: main
time: Thu Aug 29 17:28:10 CST 2024n name: pool-1-thread-1
time: Thu Aug 29 17:28:11 CST 2024n name: pool-1-thread-1
time: Thu Aug 29 17:28:12 CST 2024n name: pool-1-thread-2
time: Thu Aug 29 17:28:13 CST 2024n name: pool-1-thread-2
time: Thu Aug 29 17:28:14 CST 2024n name: pool-1-thread-2
无论是使用 Timer 还是 ScheduledThreadPoolExecutor 都无法使用 Cron 表达式指定任务执行的具体时间。
* Cron 表达式
Spring Task
我们可以通过 Spring 提供的 @Scheduled 注解即可定义定时任务,非常方便!
/**
* cron:使⽤Cron表达式。 每分钟的1,2秒运⾏
*/
@Scheduled(cron = "1-2 * * * * ? ")
public void reportCurrentTimeWithCronExpression() {
log.info("Cron Expression: The time is now {}", dateFormat.format(new
Date()));
}
如果这个 cron 中不加问号的话,代表的就是每小时的 1-2 分钟运行
Spring 自带的定时调度只支持单机,并且提供的功能比较单一。
Spring Task 底层是基于 ScheduledThreadPoolExecutor 线程池实现的。
优缺点总结:
优点:简单、轻量、支持 Cron 表达式
缺点:功能单一
时间轮
时间轮就是一个环形队列,队列中的每一个元素都是一个定时任务的列表。
时间轮中的每个时间格代表了时间轮的基本时间跨度,如果 1s 走一个时间格的话,这个时间轮的精度就是 1s。(也就是说 1s 和 1.5s 在同一个时间格中)
这是一个时间轮的示意图,它有 12 个时间轮,每个时间轮代表 1s 的时间。3s 和 3.9s 后执行的任务都放在下标为 3 的时间格中。如果我们需要创建一个 15s 后执行的任务的话,那么我们就需要引入 圈数 / 轮数 的概念,这个任务会被放在下标为 3 的时间格中,但是它的圈数为 2。
除了增加圈数这种办法之外,还有一种 多层次时间轮的方案。(Kafka 采用这种方案)
上图中,第一层时间精度为 1,第二层时间精度为 20,第三层时间精度为 400(20 * 20)。
假如我们需要添加一个 350s 后执行的任务 A 的话,这个任务会被放在第 2 层(第二层总跨度为 20 * 20 > 350)的第 350 / 20 = 17 个时间格中。
当第一层转了 17 圈,第二层指针来到第 17 个格子,此时这个格子中的任务会被移动到第 1 层。任务 A 还需要过 10 s 才会执行,因此它会被移动到第 1 层的第 10 个格子。
(这种思路类似于手表,秒针转一圈分针走一格,分针走一圈时针走一格)
分布式定时任务选型有哪些?
上述所说的解决方案都是在单机下执行的!比较适用于简单的定时任务(凌晨备份一次数据等)
如果我们需要一些高级特性比如支持任务在分布式场景下的分片和高可用的话,我们需要用到分布式定时任务调度框架了!
通常情况下一个定时任务需要这些角色:
1、任务
2、调度器
3、执行器
Quartz
很火的开源任务调度框架,完全由 Java 写成。Quartz 可以说是 Java 定时任务领域的老大哥!其他的任务调度框架基本都是基于 Quartz 开发的,比如当当网的 Elastic-Job 就是基于 Quartz 的二次开发。
Quartz 可以很方便地与 Spring 进行集成,并且支持动态添加任务和集群。但是它使用起来比较麻烦,API 繁琐。并且 Quartz 没有内置 UI 管理控制台。
另外,虽然它也支持分布式任务,但是它是在数据库层面,通过数据库的锁实现的,有非常多的弊端比如系统侵入性严重、节点fuza