猿问

如何使python解释器正确处理字符串操作中的非ASCII字符?

我有一个看起来像这样的字符串:


6Â 918Â 417Â 712

修剪此字符串的明确方法(据我了解Python)只是说该字符串位于名为的变量中s,我们得到:


s.replace('Â ', '')

这应该够了吧。但是,当然,它抱怨'\xc2'文件blabla.py 中的非ASCII字符未编码。


我从不完全了解如何在不同的编码之间进行切换。


这是代码,它的确与上面的代码相同,但是现在是在上下文中。该文件在记事本中另存为UTF-8,并具有以下标头:


#!/usr/bin/python2.4

# -*- coding: utf-8 -*-

编码:


f = urllib.urlopen(url)


soup = BeautifulSoup(f)


s = soup.find('div', {'id':'main_count'})


#making a print 's' here goes well. it shows 6Â 918Â 417Â 712


s.replace('Â ','')


save_main_count(s)

它没有比s.replace... 更进一步


慕森卡
浏览 719回答 3
3回答
随时随地看视频慕课网APP

相关分类

Python
我要回答