如下,想要统计词频前五的,请问这行top5=代码的参数如何修改?

#!/bin/python

from pyspark import SparkConf, SparkContext

if __name__ == "__main__":

conf = SparkConf().setMaster("local").setAppName("Challenge")

sc = SparkContext(conf = conf)

sc.setLogLevel("ERROR")

input = sc.textFile("/home/shiyanlou/data/")

words = input.flatMap(lambda line: line.split(' '))

counts = words.map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)

top5 = counts.sortBy(xxxxx, ascending = False).take(5)

for x in top5:
print(x)

sc.stop()

想要统计词频前五的,请问这行top5 = counts.sortBy(xxxxx, ascending = False).take(5)代码的参数如何修改

噜噜哒
浏览 245回答 1
1回答

哈士奇WWW

首先打开“Microsoft Sql Server Management Studio”,然后再打开“Tool->SQL Server Profiler”,如图:如果应用比较多的话,界面可能一下子就满了,不好找对应的SQL,你可以按照下面的步骤做:1、先将程序运行到数据库操作的前一步。2、清除界面内容。3、继续运行源码,直到数据库相关操作的源码执行完。4、暂停‘SQL Server Profiler’的运行。5、Ctrl+F,输入你想查找的表名、存储过程名等。选中该行,在最下面就可以看到生成的SQL语句了。
打开App,查看更多内容
随时随地看视频慕课网APP