与Python 3.4,Unicode,不同语言和Windows有什么关系?

与Python 3.4,Unicode,不同语言和Windows有什么关系?

快乐的例子:

#!/usr/bin/env python# -*- coding: utf-8 -*-czech = u'Leoš Janáček'.encode("utf-8")print(czech)pl = u'Zdzisław Beksiński'.encode("utf-8")print(pl)jp = u'リング 山村 貞子'.encode("utf-8")print(jp)chinese = u'五行'.encode("utf-8")print(chinese)MIR = u'Машина для Инженерных Расчётов'.encode("utf-8")print(MIR)pt = u'Minha Língua Portuguesa: çáà'.encode("utf-8")print(pt)

不愉快的输出:

b'Leo\xc5\xa1 Jan\xc3\xa1\xc4\x8dek'b'Zdzis\xc5\x82aw Beksi\xc5\x84ski'b'\xe3\x83\xaa\xe3\x83\xb3\xe3\x82\xb0 \xe5\xb1\xb1\xe6\x9d\x91 \xe8\xb2\x9e\xe5\xad\x90'b'\xe4\xba\x94\xe8\xa1\x8c'b'\xd0\x9c\xd0\xb0\xd1\x88\xd0\xb8\xd0\xbd\xd0\xb0 \xd0\xb4\xd0\xbb\xd1\x8f \xd0\x98\xd0\xbd\xd0\xb6\xd0\xb5\xd0\xbd\xd0\xb5\xd1\x80\xd0\xbd\xd1\x8b\xd1\x85 \xd0\xa0\xd0\xb0\xd1\x81\xd1\x87\xd1\x91\xd1\x82\xd0\xbe\xd0\xb2'b'Minha L\xc3\xadngua Portuguesa: \xc3\xa7\xc3\xa1\xc3\xa0'

如果我像这样打印它们:

jp = u'リング 山村 貞子'print(jp)

我明白了:

Traceback (most recent call last):
  File "x.py", line 5, in <module>
    print(jp)
  File "C:\Python34\lib\encodings\cp850.py", line 19, in encode    return codecs.charmap_encode(input,self.errors,encoding_map)[0]UnicodeEncodeError: 'charmap' codec can't encode characters in position
0-2: character maps to <undefined>

我还尝试了以下问题(以及涉及的其他替代方案sys.stdout.encoding):

#!/usr/bin/env python# -*- coding: utf-8 -*-from __future__ import print_functionimport sysdef safeprint(s):
    try:
        print(s)
    except UnicodeEncodeError:
        if sys.version_info >= (3,):
            print(s.encode('utf8').decode(sys.stdout.encoding))
        else:
            print(s.encode('utf8'))jp = u'リング 山村 貞子'safeprint(jp)

事情变得更加神秘:

πâ¬πâ│πé░ σ▒▒µ¥æ Φ▓₧σ¡É

而且文档不是很有帮助

那么,Python 3.4,Unicode,不同语言和Windows的处理是什么?几乎所有可能的例子我都能找到,处理Python 2.x.

是否有一种通用的跨平台方式在Python 3.4中以一种体面和非讨厌的方式从任何语言打印任何Unicode字符?

编辑:

我试过在终端打字:

chcp 65001

要更改代码页,如此处和注释中所提议的那样,它不起作用(包括使用sys.stdout.encoding的尝试)


拉莫斯之舞
浏览 498回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python