如何检测文件的编码?

我正在尝试找出使用Go在Windows上文件的编码。经过一些研究,我发现了许多关于Mozilla的字符集检测器(chardet)的建议,但是它们很难编译,而且我没有运气。

我还发现了libguess,它似乎已在Linux中广泛使用,但我无法使其在Windows中工作。

最好的方法是什么?在Windows上是否可以使用事实上的标准库?


潇潇雨雨
浏览 213回答 2
2回答

函数式编程

您可以使用pythonpackage:chardet。

jeck猫

您可能对Enca(极端幼稚的字符集分析器)感兴趣。我猜您可以尝试使用所有候选编码读取文件,并计算每种尝试与该语言的“标准”字符频率分布之间的距离。Enca需要一些语言信息,但是我不确定它是否使用这种方法。(这只是一个主意,可能会被误导。)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Go