是这样的,毕业设计快要开始了。
最近在选题,由于很早就对爬虫很感兴趣。
所以毕业设计就想做一个关于网络爬虫的小项目。但是觉得单一的单机爬虫可能比较小,不太符合毕业设计的要求。所以打算做一个分布式的网络爬虫。如果有时间会做对数据进行分析的模块。
语言的话暂定java,之前接触过Python但是觉得现在再学然后用来做毕设不太现实。
所以想在这问一下各位大神
分布式爬虫需要学习什么?利用什么框架来完成这个命题?实现的难度如何?推荐的书籍?
先谢谢了!
泛舟湖上清波郎朗
相关分类