我是PySpark的新手,在遇到困难时,我要完成以下任务。我尝试了很少的方法,但是没有一个能正常工作。数据如下:
id|numb_of_count|
1|3|
2|5|
3|6|
4|2|
5|0|
6|15|
7|8|
8|99|
我想要达到以下结果:
id|numb_of_count|banding|
1|3|3-5|
2|5|3-5|
3|6|6-10|
4|2|2|
5|0|0|
6|15|+11|
7|8|6-10|
8|99|+11|
由于我拥有大量数据集,如何以最有效的方式实现这一目标?
四季花海
随时随地看视频慕课网APP
相关分类