如何基于值pyspark创建band列

我是PySpark的新手,在遇到困难时,我要完成以下任务。我尝试了很少的方法,但是没有一个能正常工作。数据如下:


id|numb_of_count|

1|3|

2|5|

3|6|

4|2|

5|0|

6|15|

7|8|

8|99|

我想要达到以下结果:


id|numb_of_count|banding|

1|3|3-5|

2|5|3-5| 

3|6|6-10|

4|2|2|

5|0|0|

6|15|+11|

7|8|6-10|

8|99|+11|

由于我拥有大量数据集,如何以最有效的方式实现这一目标?


四季花海
浏览 154回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python