猿问

Python只反序列化顶层json数据

我有大量的大型 json 文件可供使用。不幸的是,并非所有的 json 数据都是结构良好的。


简而言之,数据的形状类似于


[

      { A1:va1,

          B:[

              {B1:vb1, ...},

              {B2...},

              {...}

          ]

      },

      { A2 ....},

      {....}

  ]


一个A对象数组,其中包含一个由非对多B对象组成的内部数组。


不幸的是,在随机情况下,给定的B对象会出现结构违规。


我想要做的是遍历A级别但强制B对象被视为单独的字符串,而不是由 json.loads() 解析 - 或 - 导致 json.loads() 将 a 的每个实例B视为字符串,所以我可以记录B字符串以进行第一手检查。


正如我所说,上面的数据形状只是简而言之。在真实数据中,顶层还有很多模棱两可的事情A~因此我认为我无法成功地定义模式并将其有效地应用于这些数据。至少在顶层A没有任何结构性违规。


蝴蝶刀刀
浏览 175回答 1
1回答

慕尼黑的夜晚无繁华

问题是我可以确定地检查数据。在 15 分钟内,我得到了使用这种方法的答案;不是我想要的答案,但至少我现在知道我必须处理什么。我使用 JSON Formatter 插件将一个文件加载到 Notepad++ 中。将其格式化并将其放入 Excel 工作表中。添加了几列带有方程式的列以指出感兴趣的行、几个 Ctrl-F 查找全部和排序。现在我最糟糕的情况就在我面前。但至少我现在知道了。
随时随地看视频慕课网APP

相关分类

Python
我要回答