表中只有几列,大约有 100 多个基于列的数据,只需存储这些数据,以便以后导出到其他源。
此数据(除了提到的前几列之外)不需要索引/过滤或以某种方式操作。没有查询,可以以任何方式检查此数据。
唯一的问题是,该应用层可以检索具有其他未使用工作负载的整行,并将其反序列化以进一步转换为外部格式。
有一个想法是将整个类序列化到这个字段中,但后来我们意识到,这对数据大小来说是一个巨大的开销(因为额外的java类元数据)。因此,它是一个简单的键值数据(如关系模型所示,键集是静态的)。
在数据库性能(50+ TB存储)方面,在PostgreSQL中存储这些额外的未使用数据的正确方法和数据类型是什么?也许值得省略密钥数据并仅将值存储为数组(因为键是静态的),并在应用程序层按索引反序列化后获取值(因为首先是数据库性能)?
慕田峪7331174
相关分类