' '.join() 解析 txt 以进行 NLP google API 中的命名实体识别时出错

我在尝试通过 Google input_helper_v2.py提供的脚本在 Google NLP API 中构建用于命名实体识别的数据集时遇到了困难

问题出在函数_DownloadGcsFile上,因为它抛出以下错误:

gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file, local_filename])
TypeError: sequence item 2: expected str instance, bytes found

我尝试过 put b' '.join(['gsutil', 'cp', gcs_file, local_filename]),但它会产生类似的问题。

在搜索信息时,我注意到这可能是在 python 2.7 中开发的脚本造成的。

我将不胜感激任何帮助,因为我是一个完全的初学者。太感谢了。


Cats萌萌
浏览 96回答 1
1回答

婷婷同学_

这意味着 gcs_file 的类型为bytes。所以你需要将其设为字符串(str)类型。例如:gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file.decode('utf-8'), local_filename])
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python