猿问

如何在具有 60 个功能的 1000 万行数据库上加速 Django 查询聚合?

我在 psql 中有一个数据库表,其中包含 10,000,000 行和 60 列(功能)。我定义了一个 Django 查询集,如下所示:

MyQ=MyDataBase.objects.filter(Name='Mike', date=date(2018, 2, 11), Class='03')

只有 5 行满足上述过滤条件。但是当我尝试类似的东西时

MyQ.count() #which equals 5

或者

MyQ.aggregate(Sum('Score'))['Score__sum'] #which equals 61

每个大约需要 3 分钟给我结果。这不是很奇怪吗?查询集不应该只关注我们告诉他们关注的行,从而使生活更轻松吗?计数 5 行或对其中一个字段求和不能花费那么长时间。我究竟做错了什么?

我也应该这样说。我第一次在这张桌子上尝试这段代码时,一切都很好,可能需要 1 秒才能捕捉到结果,但现在 3 分钟真的很烦人。从那时起,我没有更改数据库或代码中的任何内容。


慕码人8056858
浏览 180回答 1
1回答

米脂

通常,如果您根据特定字段或字段数量过滤表,则应在这些字段上创建索引。它允许数据库查询规划器在搜索/排序时采用更优化的路径。看起来您在问题中使用了 Postgres,因此您可以SELECT * FROM pg_indexes WHERE tablename = 'yourtable';在 psql 中运行以查看任何现有索引。Django 可以在您的模型定义中为您创建这些索引。例如,您的模型MyDatabase可能如下所示:class MyDatabase(models.Model):     name = models.TextField(index=True)     date = models.DateField(index=True)        class = models.TextField(index=True)这里有更多关于在 Django 模型上创建索引的阅读:gun.io/blog/learn-indexing-dammit
随时随地看视频慕课网APP

相关分类

Python
我要回答