在我的 sparkJob 中,我执行了几个转换和聚合操作。我需要在管道操作之前和之后通知服务。具体来说,参考下面的代码,我需要在“管道操作1”对RDD中的所有文档完成后,“管道操作2”开始之前进行服务调用。
JavaRDD<Document> stage_y = stage_x.
map(r -> someRddOperation(r) ).
pipe( "pipe operation 1 to external process" ).
map(r -> someMapOps(r) );
// execute something before processing stage_y
JavaRDD<Document> stage_z = stage_y.
pipe( "pipe operation 2 to another external process" ).
map(r -> someMapOps(r) );
肥皂起泡泡
小唯快跑啊
相关分类