猿问
我正在写一个爬虫,怎么通过网页内容误别出是否为中文网页?
因定制内容较多,暂时无发现现有爬虫框架满足要求,所以需要自己写(用redis做队列)。
我的问题是在爬虫得到一个网页之后,
怎么识别出这个网页是否为中文网页
?
DIEA
浏览 877
回答 2
2回答
胡子哥哥
用 Google Chrome 的识别算法吧,支持 HTML,有 Python 绑定。
0
0
0
随时随地看视频
慕课网APP
相关分类
爬虫
爬虫抓取网页内容时,如何保证登陆状态?
1 回答
学习Python编程 有哪些爬虫技术需要掌握?
1 回答
我要回答