用Python从文件中读取字符

在文本文件中,有一个字符串“我不喜欢这样”。


但是,当我将其读取为字符串时,它变为“我不这样\ xe2 \ x80 \ x98t”。我了解\ u2018是“'”的Unicode表示形式。我用


f1 = open (file1, "r")

text = f1.read()

命令来做阅读。


现在,是否可以以这样的方式读取字符串,即当将其读入字符串时,它是“我不喜欢这样”而不是“我不喜欢这样”吗?


第二编辑:我见过有人使用映射解决此问题,但实际上,没有内置的转换可以将这种ANSI转换为unicode(反之亦然)吗?


偶然的你
浏览 1139回答 3
3回答

大话西游666

但这确实是“我不喜欢这样”而不是“我不喜欢这样”。字符u'\ u2018'与“'”是完全不同的字符(并且在视觉上应更对应于“`”)。如果您尝试将编码的unicode转换为纯ASCII,则可以保留要转换为ASCII的unicode标点的映射。punctuation = {  u'\u2018': "'",  u'\u2019': "'",}for src, dest in punctuation.iteritems():  text = text.replace(src, dest)unicode中有很多标点字符,但是我想您只能指望其中的几个实际上被创建您正在阅读的文档的任何应用程序所使用。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python