猿问

Web抓取Python时的编码问题

你知道吗,为什么我得到这个ID ГосРеестра而不是得到这个 ID ГосРеестра。我知道编码存在一些问题,因为它是西里尔文。不知道如何解决它。

抓取网页是链接

我的代码是:

dfo_url = "https://opi.dfo.kz/p/ru/DfoObjects/objects/teaser-view/26730?OptionName=ExtraData"

r = requests.get(dfo_url)


tree = html.fromstring(r.content)

tr_elements = tree.xpath('//tr')

#Create empty list

col=[]

i=0

#For each row, store each first element (header) and an empty list

for t in tr_elements[2]:

    i+=1

    name=t.text_content()


    print ('%d:"%s"'%(i,name))

    col.append((name,[]))


慕村9548890
浏览 98回答 1
1回答

MMMHUHU

这可能会解决它,请尝试在打印之前执行此操作:name.encode(encoding='UTF-8',errors='strict')或者试试这个链接。
随时随地看视频慕课网APP

相关分类

Python
我要回答