如何使python解释器正确处理字符串操作中的非ASCII字符？

我有一个看起来像这样的字符串：

6Â 918Â 417Â 712

修剪此字符串的明确方法（据我了解Python）只是说该字符串位于名为的变量中s，我们得到：

s.replace('Â ', '')

这应该够了吧。但是，当然，它抱怨'\xc2'文件blabla.py 中的非ASCII字符未编码。

我从不完全了解如何在不同的编码之间进行切换。

这是代码，它的确与上面的代码相同，但是现在是在上下文中。该文件在记事本中另存为UTF-8，并具有以下标头：

#!/usr/bin/python2.4

# -*- coding: utf-8 -*-

编码：

f = urllib.urlopen(url)

soup = BeautifulSoup(f)

s = soup.find('div', {'id':'main_count'})

#making a print 's' here goes well. it shows 6Â 918Â 417Â 712

s.replace('Â ','')

save_main_count(s)

它没有比s.replace... 更进一步

慕森卡

浏览 782回答 3