维基百科,统计编辑
创建项目
Flink组件栈
常用算子
Flink分布式运行环境
Flink是基于Master-Slave风格的架构。
Flink集群启动时,会启动一个JobManager进程、至少一个TaskManager进程。
JobManager:1、Flink系统的协调者,它负责接收Flink Job,调度组成Job的多个Task的执行。2、收集Job的状态信息,并管理Flink集群中从节点TaskManager。
TaskManager:1、实际负责执行计算的worker,在其上执行Flink Job的一组Task。2、TaskManager负责管理其所在节点上的资源信息,比如内存、磁盘、网络,在启动的时候将资源的状态向JobManager汇报。
Client:1、用户提交一个Flink程序时,会首先创建一个Client,该Client首先会对用户提交的Flink程序进行预处理,并提交到Flink集群。2、Client会将用户提交的Flink程序组装成一个JobGraph,并且是以JobGraph的形式提交的。
flinl程序的基础构建块是流+转换,每个数据流始于一个或多个source、止于sink
env是flink的运行环境、上下文,然后消费获取kafka中的数据进行一系列转化操作,最后addsink将处理好的数据落地。
flink支持并行
mark
Flink课程大纲
Flink的架构
Flink的架构
streams 流
transformations: map reduce
Flink课程大纲
窗口函数图解
架构、容错
flink优势
flink组件栈
flink课程大纲
curl https://flink.apache.org/q/quickstart.sh | bash
quickstart version:0.1
窗口的分类
Flink优势:
1、支持高吞吐、低延迟、高性能流处理。
2、支持高度灵活的窗口操作。
3、支持有状态计算的Exactly-once语义。
4、提供DataStream API和DataSet API。
libraries
api 层
runtime
flink on yarn
flink课程大纲
Flink组件栈
Flink概览