我对编码很陌生,现在我正在尝试处理来自 kaggle 的 TMDB_5000 数据集。
我在尝试处理这样的 json 格式数据时遇到了问题。
[{"cast_id": 242, "character": "Jake Sully", "credit_id": "5602a8a7c3a3685532001c9a", "gender": 2, "id": 65731, "name": "Sam Worthington", "order": 0}, {"cast_id": 3, "character": "Neytiri", "credit_i...}]
我试图用来json.loads()
处理数据,代码是credits['cast'] = json.loads(credits['cast'])
. 但它给了我这样的错误
---------------------------------------------------------------------------
TypeError Traceback (最近一次调用最后一次) in () ----> 1 credits['cast'] = json.loads(credits['cast'])
/anaconda3/lib/python3.6/json/__init__.py in loads(s, encoding, cls, object_hook, parse_float, parse_int, parse_constant,object_pairs_hook, **kw) 346 if not isinstance(s, (bytes, bytearray)): 347 raise TypeError('the JSON object must be str, bytes or bytearray, ' --> 348 'not {!r}'.format (第类。名))349个S = s.decode(detect_encoding(一个或多个), 'surrogatepass')350
TypeError: the JSON object must be str, bytes or bytearray, not 'Series'
但是,该代码credits['cast'] = credits['cast'].apply(json.loads)
有效。所以我很困惑,因为我认为这两行代码没有区别。
谁能给我解释一下?
千巷猫影
白衣非少年
相关分类