Web抓取Python时的编码问题

你知道吗，为什么我得到这个ID ГосРеестра而不是得到这个 ID ГосРеестра。我知道编码存在一些问题，因为它是西里尔文。不知道如何解决它。

抓取网页是链接

我的代码是：

dfo_url = "https://opi.dfo.kz/p/ru/DfoObjects/objects/teaser-view/26730?OptionName=ExtraData"

r = requests.get(dfo_url)

tree = html.fromstring(r.content)

tr_elements = tree.xpath('//tr')

#Create empty list

col=[]

i=0

#For each row, store each first element (header) and an empty list

for t in tr_elements[2]:

i+=1

name=t.text_content()

print ('%d:"%s"'%(i,name))

col.append((name,[]))

慕村9548890

浏览 157回答 1

MMMHUHU

这可能会解决它，请尝试在打印之前执行此操作：name.encode(encoding='UTF-8',errors='strict')或者试试这个链接。

随时随地看视频慕课网APP