请教一个问题哈:
Jsoup官方文档里,重点讲了怎么解析网页,但没很好的讲解怎么download这个问题。
载入一个网页,就这么干巴巴一句:
Document doc = Jsoup.connect("http://example.com/").get();
更别没有提到翻页、判断是否重复爬去等问题。
这个是不是说,用其他的爬虫,比如crawler4j或者HttpClient,先爬取网页,然后再使用Jsoup来解析?
还是说Jsoup能强大到先爬取再解析?
还有,对于这个问题,能否推荐几个英文关键词,我去google上搜一下?
水平不高,连关键词是什么都不知道,请见谅。
翻翻过去那场雪
青春有我
相关分类