我可以展平一个深度嵌套的 Python 字典，其中包含带有更多嵌套字典列表的值吗？

我正在处理一个大型 xml 文件，我一直在尝试提取键和值。此文件中的信息非常敏感，因此我无法分享。我从使用xml图书馆开始。然而，经过几个小时的挫折，我发现了xmltodict图书馆。我使用这个库将我的 xml 转换为字典（相对于 xml，我更熟悉的东西）。

import xmltodict

# convert xml to dictionary

dict_nested = xmltodict.parse(str_xml)

既然 xml 是一个字典，我想将它展平，因为它有大量的级别（我不知道有多少级别），同时创建帮助我跟踪其对应值的路径的键名。因此，我尝试了：

from flatten_dict import flatten

# flatten dict_nested

dict_flat = flatten(dict_nested)

结果可能看起来像这样，但有更多层：

{'ID': '123',

'info': [{'breed':'collie'},

{'fur': [{'short':'no'},

{'color':[{'black':'no'},

{'brown':'yes'}]}]}]}

这很好用，因为我的键是显示层路径的元组。我的值要么是字符串（即我正在寻找的最终结果），要么是OrderedDict类型的列表。

由于每个列表中的每个字典都需要展平，而且我不知道这有多深，我试图找出一种以编程方式展平所有字典的方法，直到所有键对应于单个值（即，不是列表或字典） .

理想情况下，输出应如下所示：

{'ID':'123',

'info_breed':'collie',

'info_fur_short':'no',

'info_fur_color_black':'no',

'info_fur_color_brown':'yes'}

抱歉，由于敏感信息，我无法分享更多我的输出。

RISEBY

浏览 251回答 2

2回答

杨__羊羊

您可以通过考虑到您的 dicts 值是字符串或具有其他 dicts 的列表来使用递归方法：dict_flat = {'ID': '123', 'info': [{'breed':'collie'},           {'fur': [{'short':'no'},                    {'color':[{'black':'no'},                             {'brown':'yes'}]}]}]}def my_flatten(dict_flat, key_prefix=None):    result = {}    for k, v in dict_flat.items():        key = f'{key_prefix}_{k}' if key_prefix is not None else k        if isinstance(v, list):            for d in v:                result.update(my_flatten(d, key))        else:            result[key] = v    return resultmy_flatten(dict_flat)输出：{'ID': '123', 'info_breed': 'collie', 'info_fur_short': 'no', 'info_fur_color_black': 'no', 'info_fur_color_brown': 'yes'}

0 0

扬帆大鱼

另一种方法是创建一个生成键/值元组的生成器。您可以简单地将其传递给字典构造函数：d = {'ID': '123',     'info': [{'breed':'collie'},           {'fur': [{'short':'no'},                {'color':[{'black':'no'},                         {'brown':'yes'}]}]}]}def flatten(obj, prefix=[]):    if isinstance(obj, str):        yield ('_'.join(prefix), obj)    elif isinstance(obj, list):        for o in obj:            yield from flatten(o, prefix)     else:        for k, v in obj.items():            yield from flatten(v, prefix + [k])dict(flatten(d))结果：{'ID': '123', 'info_breed': 'collie', 'info_fur_short': 'no', 'info_fur_color_black': 'no', 'info_fur_color_brown': 'yes'}这避免了在函数中管理字典，这取决于您对事物的喜好，可能更容易推理。

0 0

随时随地看视频慕课网APP