猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
如何确定文本的编码?
如何确定文本的编码?
我收到了一些编码的文本,但我不知道使用了什么字符集。是否有方法使用Python确定文本文件的编码?
如何检测文本文件的编码/代码页
处理C#。
子衿沉夜
浏览 711
回答 3
3回答
天涯尽头无女友
计算编码的另一个选项是使用利布魔术(这是档案指挥)。有大量的python绑定可用。驻留在文件源树中的python绑定可作为Python-魔术(或python 3-魔法)Debian包。它可以通过执行以下操作来确定文件的编码:import magic blob = open('unknown-file').read()m = magic.open(magic.MAGIC_MIME_ENCODING)m.load()encoding = m.buffer(blob) # "utf-8" "us-ascii" etc有一个同名但不相容的,Python-魔术pypi上的PIP包,该包还使用libmagic..它还可以通过执行以下操作获得编码:import magic blob = open('unknown-file').read()m = magic.Magic(mime_encoding=True)encoding = m.from_buffer(blob)
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
Python
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续