我有一个包含不同字体和不同语言的 Word 文档。一个例子是英文文本和古希腊文的相应翻译。对于古希腊部分,使用了 TrueType 字体(https://fonts2u.com/greek-regular.font)。现在这种方法非常不适合共享这些文件,我想将古希腊部分转换为相应的 unicode 字符。
我尝试了 python 包 python-docx 来导入文件。虽然成功导入和查看文件内容,但我找不到只选择古希腊字符并将它们转换为相应的 unicode 字符的方法。
我正在考虑使用 TrueType Font 字符映射并找到并用相应的 unicode 字符替换这些字符。但是查看内容我无法只选择古希腊字符。
问:有没有办法使用 VBA、python 或导出不同编码的文件将古希腊字符“翻译”为相应的 unicode 字符?
浮云间
相关分类