我使用 pyarrow 创建和分析带有生物信息的 Parquet 表,我需要存储一些元数据,例如数据来自哪个样本,它是如何获取和处理的。
Parquet 似乎支持file-wide metadata,但我找不到如何通过 pyarrow 写入它。我能找到的最接近的事情是如何编写 row-group metadata,但这似乎有点矫枉过正,因为我的元数据对于文件中的所有行组都是相同的。
有没有办法用 pyarrow 编写文件范围的 Parquet 元数据?
jeck猫
相关分类