猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
我正在写一个爬虫,怎么通过网页内容误别出是否为中文网页?
因定制内容较多,暂时无发现现有爬虫框架满足要求,所以需要自己写(用redis做队列)。
我的问题是在爬虫得到一个网页之后,
怎么识别出这个网页是否为中文网页
?
DIEA
浏览 876
回答 2
2回答
胡子哥哥
用 Google Chrome 的识别算法吧,支持 HTML,有 Python 绑定。
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
爬虫
爬虫抓取网页内容时,如何保证登陆状态?
1 回答
学习Python编程 有哪些爬虫技术需要掌握?
1 回答
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续