我正在阅读Spark:权威指南,但有些东西让我感到困惑。该函数coalesce
在完全不同的上下文中被多次定义。我想知道这是否是相同的功能,我只是没有看到链接,或者这是否只是一个不幸的命名问题。
在第 80 页的“重新分区和合并”一章下,它说:
Coalesce
[...] 不会导致完全洗牌,而是会尝试合并分区。
据我了解,此函数将组合分区,直到它具有函数参数所指示的所需分区数coalesce
。
在第 103 页的“合并”一章下,它说:
Spark 包含一个函数,允许您使用该函数从一组列中选择第一个非空值
coalesce
。
据我了解,此函数将采用一组列,并从第一列中获取所有非空值。然后对于空值,它将查看第二列,并在那里获取所有非空值,依此类推。
我的问题
我对这些功能的理解是否正确?
这些功能有什么关系?有没有我没看到的链接?
如果不是,为什么他们会有相同的名字?(这对我来说似乎真的很困惑。)
小怪兽爱吃肉
模式的秘密什么时候整合一个专栏
利用服务器公钥加密会话秘钥并传给服务器
还是只加密预主秘钥传给服务器?
确认秘密的小对勾问题?
相关分类