- Java633
- Distributed189
- Tool133
- Spring102
- MQ89
- Netty88
- Log86
- File72
- RPC65
- SOFA65
- Concurrency60
- IM55
- Memory51
- Apache50
- Engine49
- Net49
- Design Pattern45
- Schedule40
- Lock33
- Basic32
- java31
- JVM26
- Dev24
- Protocol23
- Thread23
- System18
- Network17
- Web17
- SQL11
- Github10
- JMM10
- Jvm10
- Programming Language10
- SSO10
- Safe10
- System-Design10
- ORM10
- Base9
- Go9
- Maven9
- Pattern8
- Theory8
- WEB8
- TOOL7
- Auth6
- Architecture6
- HTTP6
- Python6
- CS4
- Mybatis4
- Concurrent3
- Exception3
- source-code3
- Framework2
- Gateway2
- Http2
- JMS2
- Security2
- Cache2
- DEV1
- Dotnet1
- IO1
- IOC1
- IOS1
- IoT1
- JDBC1
- Best Practice1
- Mybaits1
- PHP1
- Source Code1
- Dubbo1
- MVC1
在学习 apache seatunnel 的批处理时,希望有一个定时调度功能。
于是知道了 Apache DolphinScheduler 这个工具,我们一起简单学习下。
Apache DolphinScheduler
Apache DolphinScheduler 是现代数据编排平台。
它具有创建高性能工作流的敏捷性,且具备低代码特性。
此外,它提供了强大的用户界面,专注于解决数据管道中的复杂任务依赖关系,并提供各种类型的即插即用任务。
DolphinScheduler 的关键特性如下:
XXL-JOB 是一个基于分布式的定时任务调度平台,它的核心设计目标是开发迅速、学习简单、轻量级、易扩展。设计的思想是将调度行为抽象形成调度中心平台平台本身不承担任何的业务逻辑,而只是作为任务的发起者。在调度请求后,由业务代码里的执行器接收调度请求并执行具体的业务。这里的任务抽象为分散的 JobHandler。通过这种方式即可实现调度与任务相互解耦,从而提高系统整体的稳定性和拓展性。不过放今天来看,其实还是存在着一定的不足,如:
数据库支持单一: 仅支持MySQL,使用其他DB需要自己魔改代码
有限的分布式计算能力: 仅支持静态分片,无法很好的完成复杂任务的计算
ElasticJob 是一个分布式调度解决方案,由两个独立的项目 ElasticJob-Lite 和 ElasticJob-Cloud 组成。
通过灵活调度、资源管理、作业管理等功能,打造适合互联网场景的分布式调度解决方案,通过开放式架构设计提供多元化的作业生态系统。 它为每个项目使用统一的作业 API。 开发者只需一次代码,可随意部署。
ElasticJob 于 2020 年 5 月 28 日成为 Apache ShardingSphere 子项目。
介绍
使用 ElasticJob 的开发人员再也不用担心作业横向扩展等非功能性需求,可以更加专注于业务编码。
XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。
现已开放源代码并接入多家公司线上产品线,开箱即用。
特性
1、简单:支持通过Web页面对任务进行CRUD操作,操作简单,一分钟上手;
2、动态:支持动态修改任务状态、启动/停止任务,以及终止运行中任务,即时生效;
3、调度中心HA(中心式):调度采用中心式设计,“调度中心”自研调度组件并支持集群部署,可保证调度中心HA;
4、执行器HA(分布式):任务分布式执行,任务”执行器”支持集群部署,可保证任务执行HA;
5、注册中心: 执行器会周期性自动注册任务, 调度中心将会自动发现注册的任务并触发执行。同时,也支持手动录入执行器地址;
6、弹性扩容缩容:一旦有新执行器机器上线或者下线,下次调度时将会重新分配任务;
7、触发策略:提供丰富的任务触发策略,包括:Cron触发、固定间隔触发、固定延时触发、API(事件)触发、人工触发、父子任务触发;
8、调度过期策略:调度中心错过调度时间的补偿处理策略,包括:忽略、立即补偿触发一次等;
9、阻塞处理策略:调度过于密集执行器来不及处理时的处理策略,策略包括:单机串行(默认)、丢弃后续调度、覆盖之前调度;
10、任务超时控制:支持自定义任务超时时间,任务运行超时将会主动中断任务;
11、任务失败重试:支持自定义任务失败重试次数,当任务失败时将会按照预设的失败重试次数主动进行重试;其中分片任务支持分片粒度的失败重试;
12、任务失败告警;默认提供邮件方式失败告警,同时预留扩展接口,可方便的扩展短信、钉钉等告警方式;
13、路由策略:执行器集群部署时提供丰富的路由策略,包括:第一个、最后一个、轮询、随机、一致性HASH、最不经常使用、最近最久未使用、故障转移、忙碌转移等;
14、分片广播任务:执行器集群部署时,任务路由策略选择”分片广播”情况下,一次任务调度将会广播触发集群中所有执行器执行一次任务,可根据分片参数开发分片任务;
15、动态分片:分片广播任务以执行器为维度进行分片,支持动态扩容执行器集群从而动态增加分片数量,协同进行业务处理;在进行大数据量业务操作时可显著提升任务处理能力和速度。
16、故障转移:任务路由策略选择”故障转移”情况下,如果执行器集群中某一台机器故障,将会自动Failover切换到一台正常的执行器发送调度请求。
17、任务进度监控:支持实时监控任务进度;
18、Rolling实时日志:支持在线查看调度结果,并且支持以Rolling方式实时查看执行器输出的完整的执行日志;
19、GLUE:提供Web IDE,支持在线开发任务逻辑代码,动态发布,实时编译生效,省略部署上线的过程。支持30个版本的历史版本回溯。
20、脚本任务:支持以GLUE模式开发和运行脚本任务,包括Shell、Python、NodeJS、PHP、PowerShell等类型脚本;
21、命令行任务:原生提供通用命令行任务Handler(Bean任务,”CommandJobHandler”);业务方只需要提供命令行即可;
22、任务依赖:支持配置子任务依赖,当父任务执行结束且执行成功后将会主动触发一次子任务的执行, 多个子任务用逗号分隔;
23、一致性:“调度中心”通过DB锁保证集群分布式调度的一致性, 一次任务调度只会触发一次执行;
24、自定义任务参数:支持在线配置调度任务入参,即时生效;
25、调度线程池:调度系统多线程触发调度运行,确保调度精确执行,不被堵塞;
26、数据加密:调度中心和执行器之间的通讯进行数据加密,提升调度信息安全性;
27、邮件报警:任务失败时支持邮件报警,支持配置多邮件地址群发报警邮件;
28、推送maven中央仓库: 将会把最新稳定版推送到maven中央仓库, 方便用户接入和使用;
29、运行报表:支持实时查看运行数据,如任务数量、调度次数、执行器数量等;以及调度报表,如调度日期分布图,调度成功分布图等;
30、全异步:任务调度流程全异步化设计实现,如异步调度、异步运行、异步回调等,有效对密集调度进行流量削峰,理论上支持任意时长任务的运行;
31、跨语言:调度中心与执行器提供语言无关的 RESTful API 服务,第三方任意语言可据此对接调度中心或者实现执行器。除此之外,还提供了 “多任务模式”和“httpJobHandler”等其他跨语言方案;
32、国际化:调度中心支持国际化设置,提供中文、英文两种可选语言,默认为中文;
33、容器化:提供官方docker镜像,并实时更新推送dockerhub,进一步实现产品开箱即用;
34、线程池隔离:调度线程池进行隔离拆分,慢任务自动降级进入”Slow”线程池,避免耗尽调度线程,提高系统稳定性;
35、用户管理:支持在线管理系统用户,存在管理员、普通用户两种角色;
36、权限控制:执行器维度进行权限控制,管理员拥有全量权限,普通用户需要分配执行器权限后才允许相关操作;
基于微服务的云原生数据流和批处理数据处理解决方案,适用于Cloud Foundry和Kubernetes。
Spring Cloud Data Flow 提供了创建复杂的流式和批处理数据管道拓扑的工具。这些数据管道由使用 Spring Cloud Stream 或 Spring Cloud Task 微服务框架构建的 Spring Boot 应用程序组成。
Spring Cloud Data Flow 支持各种数据处理用例,从ETL到导入/导出、事件流处理以及预测性分析。
chat
详细介绍一下 Spring Cloud Data Flow
基于 spring 注解实现定时调度。
maven 依赖
org.springframework
spring-context
5.3.15
org.springframework
spring-context-support
5.3.15
Spring框架提供了异步执行任务和任务调度的抽象,分别通过TaskExecutor和TaskScheduler接口实现。
Spring还提供了这些接口的实现,支持在线程池或在应用服务器环境中委托给CommonJ。最终,这些实现在通用接口背后的使用抽象了Java SE 5、Java SE 6和Java EE环境之间的差异。
Spring还提供了支持使用JDK自1.3版以来一直存在的Timer以及Quartz Scheduler(http://quartz-scheduler.org)的集成类。这两个调度器都是使用FactoryBean设置的,可选地引用Timer或Trigger实例。此外,还提供了对Quartz Scheduler和Timer的便捷类,允许您调用现有目标对象的方法(类似于正常的MethodInvokingFactoryBean操作)。
Saturn (任务调度系统)是唯品会开源的一个分布式任务调度平台,取代传统的Linux Cron/Spring Batch Job的方式,做到全域统一配置,统一监控,任务高可用以及分片并发处理。
Saturn是在当当开源的Elastic Job基础上,结合各方需求和我们的实践见解改良而成。
本文档针适用于3.x版本。
重要特性
-
支持多种语言作业,语言无关(Java/Go/C++/PHP/Python/Ruby/shell)
-
支持秒级调度
-
支持作业分片并行执行
-
支持依赖作业串行执行
-
支持作业高可用和智能负载均衡
-
支持异常检测和自动失败转移
-
支持异地容灾
-
支持多个集群部署
-
支持跨机房区域部署
-
支持弹性动态扩容
-
支持优先级和权重设置
-
支持docker容器,容器化友好
-
支持cron时间表达式
-
支持多个时间段暂停执行控制
-
支持超时告警和超时强杀控制
-
支持灰度发布
-
支持异常、超时和无法高可用作业监控告警和简易的故障排除
-
支持失败率最高、最活跃和负荷最重的各域各节点TOP10的作业统计
-
经受住唯品会生产800多个节点,每日10亿级别的调度考验
概览
BackgroundJob.enqueue(() -> System.out.println("这是在分布式任务中所需的一切!"));