问答详情
源自:2-7 spider文件的编写(2)

编码问题,现在是unicode,没法用xpath

请问老师及各位朋友,我现在抓取的网页,源代码是unicode,直接使用response.xpath是不能正确匹配的。

但是如果,我将response.text转码为utf-8后赋值给一个str变量,str是不能使用xpath的。

但是同时response.text又不能修改(即转码后给自身赋值)。

这种情况有什么好的办法嘛

http://img3.mukewang.com/5e38201c00017a4d06460370.jpg

提问者:慕侠5336557 2020-02-03 21:31

个回答