继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

Spark内核分析之Master的注册机制实现原理

慕侠2389804
关注TA
已关注
手记 273
粉丝 55
获赞 156

 这篇文章我们来讨论一下Master的注册机制;那么有哪些信息需要注册到Master上面去呢?很简单,分别有Worker的注册,Driver的注册,Application的注册。明确了这个以后我们来看一张图;

webp

Master注册流程图

关于Worker和Driver的注册,上面图中已经说的很详细了,我们着重来看看Application的注册流程是如何实现的。

1.在Driver注册完成之后,接着执行Application代码,初始化SparkContext,通过              SparkDeploySchedulerBackend的AppClient内部的线程,ClientActor发送RegisterApplication到Master进行注册;

2.Master接收到请求后,将Application信息写入到内存缓冲中,并将其加入到等待调度队列中;

3.使用持久化引擎将数据进行持久化操作,最后调用Schedule开始相关任务的调度执行;

下面我们看看spark源码是怎么对其进行实现的。

webp

Application注册实现

解释:上图中的sender其实是代表了ClientActor,所以会讲Application的注册信息发送给ClientActor。

webp

加入缓存调度队列实现

总结,本篇内容较短,但是完整的阐述了Worker,Driver,Application的注册机制,下篇会来阐述一下我们的Driver,Application注册完成以后的scheduler调度是如何实现的,同时也是非常非常重要的一个环节,欢迎关注。如需转载,请注明:

上一篇:Spark内核分析之Spark的HA源码分析

本篇:Spark内核分析之Master的注册机制实现原理

下一篇:Spark内核分析之Scheduler资源调度机制



作者:z小赵
链接:https://www.jianshu.com/p/1aba7f39345a


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP