' '.join() 解析 txt 以进行 NLP google API 中的命名实体识别时出错

我在尝试通过 Google input_helper_v2.py提供的脚本在 Google NLP API 中构建用于命名实体识别的数据集时遇到了困难

问题出在函数_DownloadGcsFile上，因为它抛出以下错误：

gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file, local_filename])
TypeError: sequence item 2: expected str instance, bytes found

我尝试过 put b' '.join(['gsutil', 'cp', gcs_file, local_filename])，但它会产生类似的问题。

在搜索信息时，我注意到这可能是在 python 2.7 中开发的脚本造成的。

我将不胜感激任何帮助，因为我是一个完全的初学者。太感谢了。

Cats萌萌

浏览 213回答 1

婷婷同学_

这意味着 gcs_file 的类型为bytes。所以你需要将其设为字符串（str）类型。例如：gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file.decode('utf-8'), local_filename])

0 0

随时随地看视频慕课网APP