Python爬虫中编码设置问题,系统编码如何正确处理?

有个问题想请交一下。Python中为了确定源文件的编码,所以在文件第一行可以进行设置。在Windows下最简单的方法例子就是#coding=utf-8(Linux下还需要加一行的样子,(不确定))。然后我导入了sys模块,printsys.getdefaultencoding()来看一下默认的编码方式,结果还是ascii而不是utf-8。不解下一步要如何解决这个问题,据说Python3都是utf-8编码的。其次,在Python文件输入unicode时会成为一个类型,而我输入utf-8,或者ascii是会报错没有这个变量之类的。这个问题是如何解决的?谢谢!
题主系统为win7
白猪掌柜的
浏览 714回答 2
2回答

眼眸繁星

你可以这样:importsysreload(sys)sys.setdefaultencoding('utf-8')应该就可以

潇潇雨雨

将所有的输入内容decode,decode后字符串格式为unicode,然后统一encode后输出,utf-8还是GBK随便你。推荐阅读PYTHON-进阶-编码处理小结PragmaticUnicode其实你提问我就没看很明白。还是推荐你先了解了解字符编码相关知识吧
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

JavaScript