假设我有n机器,我需要在这些机器上尽可能均匀地分配数据。让我们使用5这个例子。我们拥有的数据将如下所示:
id state name date
1 'DE' 'Aaron' 2014-01-01
要对 id 进行分片,我可以执行以下功能:
machine_num = id % n
要对字符串进行分片,我想最基本的方法是字符串到二进制到数字:
name_as_num = int(''.join(format(ord(i), 'b') for i in name), 2)
machine_num = name_as_num % n
或者更简单:
machine_num = ord(name[0]) % n
什么是如何对日期或时间戳进行分片的示例?与我在上面使用的那些相比,对字符串(甚至数字)字段进行分片的更好功能是什么?
慕神8447489
人到中年有点甜
相关分类