猿问

在Python中将Unicode转换为ASCII而没有错误

在Python中将Unicode转换为ASCII而没有错误

我的代码只是抓取一个网页,然后将其转换为Unicode。

html = urllib.urlopen(link).read()html.encode("utf8","ignore")self.response.out.write(html)

但我得到一个UnicodeDecodeError


Traceback (most recent call last):
  File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__
    handler.get(*groups)
  File "/Users/greg/clounce/main.py", line 55, in get
    html.encode("utf8","ignore")UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in range(128)

我认为这意味着HTML包含一些在某处错误形成的Unicode尝试。我可以删除导致问题的任何代码字节而不是出错吗?


沧海一幻觉
浏览 815回答 3
3回答
随时随地看视频慕课网APP

相关分类

Python
我要回答