我正在使用排序基准测试对Spark进行简单的扩展测试 - 从1核,最多8核。我注意到8个核心比1核心慢。
//run spark using 1 core
spark-submit --master local[1] --class john.sort sort.jar data_800MB.txt data_800MB_output
//run spark using 8 cores
spark-submit --master local[8] --class john.sort sort.jar data_800MB.txt data_800MB_output
每种情况下的输入和输出目录都是HDFS。
1核:80秒
8个核心:160秒
我希望8核性能有x倍的加速。
慕容森