基于窗口和元素计数从数据流写入 GCS

我正在尝试实现一个解决方案,我需要使用数据流将数据 (json) 消息从 pubsub 写入 GCS。我的问题正是与此类似一个


我需要根据窗口或元素计数来编写。以下是上述问题的写入代码示例:


windowedValues.apply(FileIO.<String, String>writeDynamic()

        .by(Event::getKey)

        .via(TextIO.sink())

        .to("gs://data_pipeline_events_test/events/")

        .withDestinationCoder(StringUtf8Coder.of())

        .withNumShards(1)

        .withNaming(key -> FileIO.Write.defaultNaming(key, ".json")));

解决方案建议使用 FileIO.WriteDynamic 函数。但我无法理解 .by(Event::getKey) 做什么以及它来自哪里。非常感谢您对此的任何帮助。


长风秋雁
浏览 140回答 1
1回答

缥缈止盈

它根据事件的键将元素分组。根据我的理解,事件来自使用 KV 类的 PCollection,因为它具有 getKey 方法。请注意 :: 是 Java 8 中包含的一个新运算符,用于引用类的方法。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java