如何在python代码内部将获取的数据分流？

比如我使用kafka或rabbitmq从消息队列中获取数据，来源只有一条队列，不能从数据源分流数据。而计算难度较高，所以要在内部进行分流。比如我的消息处理类为：

class Worker(threading.Thread):
    def __init__(self):
        self.raw = []
    
    def run(self):
        while True:
            if self.raw:
                d = self.raw.pop()
                处理d数据
                将结果保存到批量插入的类中

然后在程序运行时，我创建若干个Worker，然后将消息源传入的数据，分流保存到这若干个Worker的raw属性中。问题就在于，如何能开销比较低的分流这些数据？
还有这样多线程处理的思路是否正确？我之前测试过，感觉python自带的Queue的效率并不是特别高。
另外，假如我要设计弹性创建Worker，应该如何用python代码完成，就是当数据流较大时，我就追加创建一些Worker，当数据流降低时，就销毁一些Worker。

斯蒂芬大帝

浏览 560回答 3

3回答

德玛西亚99

最后通过阅读一些文档发现，如果涉及很密集的运算，那么选择python本来就不明智。Queue的设计也没有考虑大量的流量处理。如果问的问题一直没有答案，那最有可能的就是问题本身就不对。

随时随地看视频慕课网APP