在 Dataflow 中从 BigQuery 写入 Cloud Storage 时如何设置文件大小而

根据设计，这是不可能的。如果您深入研究 Beam 的核心，您可以通过编程方式定义一个执行图，然后运行它。ParDo该过程在同一节点或多个节点/VM 上是大规模并行的（意味着“并行执行”）。这里的分片数量只是并行工作以写入文件的“写入器”的数量。然后PCollection将被拆分给所有worker写入。大小变化很大（例如消息的大小、文本编码、压缩与否以及压缩因子……），Beam 不能依赖它来构建其图形。

在 Dataflow 中从 BigQuery 写入 Cloud Storage 时如何设置文件大小而

1回答