编码问题,现在是unicode,没法用xpath

来源:2-7 spider文件的编写(2)

慕侠5336557

2020-02-03 21:31

请问老师及各位朋友,我现在抓取的网页,源代码是unicode,直接使用response.xpath是不能正确匹配的。

但是如果,我将response.text转码为utf-8后赋值给一个str变量,str是不能使用xpath的。

但是同时response.text又不能修改(即转码后给自身赋值)。

这种情况有什么好的办法嘛

http://img3.mukewang.com/5e38201c00017a4d06460370.jpg

写回答 关注

1回答

Python最火爬虫框架Scrapy入门与实践

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会!

67418 学习 · 223 问题

查看课程

相似问题