将 jsonl 文件解析为有用的结构

我正在从我的硬盘导入一个 jsonl 文件并试图将其转换为可用格式。这是我导入数据的方式。


train_data=[]

with open("Documents/data/train.jsonl",'r',encoding='utf-8') as j:

   for line in j:

           train_data.append(json.loads(line))

产生这样结构的数据。


train_data[1]

Out[59]: 

{'id': 46971,

 'img': 'img/46971.png',

 'label': 1,

 'text': 'text'}

基本上我想将此数据转换为字典格式,其中字典值为“id”,其余数据与该字典标签相关联。我相信类似下面的内容,但我对 Python 还很陌生,所以我可能会错误地显示它。


print(dict_ex)

{46971: ['img/46971.png', 1, 'text']}


守着星空守着你
浏览 146回答 3
3回答

交互式爱情

您可以创建字典并从train_data列表中逐一添加新元素:di = dict()for o in train_data:    di[o['id']] = [o['img'], o['label'], o['text']]print(di)>>> {46971: ['img/46971.png', 1, 'text']}

繁华开满天机

# dict[key] = value dict_ex[data['id']] = [data['img'], data['label'], data['text']]

莫回无

尝试这个,result = {}for d in train_data:    for k, v in d.items():        if k == "id":            result[v] = []        else:            result[v].append(v)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python