我在这里。在遵循代码的同时。我想出了两个问题
密钥和偏移量是否相同?
根据Google的说法,
偏移量:一个Kafka主题会在存储它们的一组分布式分区中接收消息。每个分区都按顺序维护已收到的消息,其中它们由偏移量(也称为位置)标识。
似乎两者对我来说都非常相似。由于偏移量在分区中保持唯一的消息:生产者根据记录的键将记录发送到分区
为生产者选择键/偏移的最佳方法是什么?
对于我上面提供的示例,他们选择了时间戳作为Key和offset。这始终是最好的建议吗?
class IRCMessageListener extends IRCEventAdapter {
@Override
public void onPrivmsg(String channel, IRCUser u, String msg) {
IRCMessage event = new IRCMessage(channel, u, msg);
//FIXME kafka round robin default partitioner seems to always publish to partition 0 only (?)
long ts = event.getInt64("timestamp");
Map<String, ?> srcOffset = Collections.singletonMap(TIMESTAMP_FIELD, ts);
Map<String, ?> srcPartition = Collections.singletonMap(CHANNEL_FIELD, channel);
SourceRecord record = new SourceRecord(srcPartition, srcOffset, topic, KEY_SCHEMA, ts, IRCMessage.SCHEMA, event);
queue.offer(record);
}
因为我实际上是在尝试创建自定义的Kafka连接器,以从3rd Party WebSocket API获取数据。API发送给定键值的实时数据流消息。所以我想到了将那个Key用作我的PartitionKey以及Offset。但是需要确保我对自己的想法是正确的。
慕的地8271018
相关分类