猿问

使用Hibernate的ScrollableResults缓慢读取9000万条记录

我只需要使用Hibernate读取MySQL数据库中表中的每一行,并基于它编写一个文件。但是有9000万行,它们很大。因此,似乎以下情况将是适当的:


ScrollableResults results = session.createQuery("SELECT person FROM Person person")

            .setReadOnly(true).setCacheable(false).scroll(ScrollMode.FORWARD_ONLY);

while (results.next())

    storeInFile(results.get()[0]);

问题是上面的方法将尝试将所有9000万行加载到RAM中,然后再进入while循环...这将导致OutOfMemoryError杀死我的内存:Java堆空间异常:(。


所以我想ScrollableResults不是我想要的吗?处理此问题的正确方法是什么?我不在乎这个while循环是否需要几天的时间(好吧,我不希望这样)。


我猜想解决此问题的唯一其他方法是使用setFirstResult和setMaxResults遍历结果,并且仅使用常规的Hibernate结果而不是ScrollableResults。感觉好像效率低下,并且当我在第89百万行上调用setFirstResult时,它将花费可笑的长时间。


更新:setFirstResult / setMaxResults不起作用,事实证明我花了很长的时间才能达到我所担心的偏移量。这里一定有解决方案!这不是一个很标准的程序吗?我愿意放弃Hibernate并使用JDBC或其他方法。


更新2:我想出的可行的解决方案,不是很好,基本上是以下形式:


select * from person where id > <offset> and <other_conditions> limit 1

由于我还有其他条件,即使所有条件都在索引中,它仍然不如我希望的那样快...因此仍然欢迎其他建议。


慕雪6442864
浏览 785回答 3
3回答

一只萌萌小番薯

如下所示,将查询中的抓取大小设置为最佳值。同样,当不需要缓存时,最好使用StatelessSession。ScrollableResults results = session.createQuery("SELECT person FROM Person person")&nbsp; &nbsp; &nbsp; &nbsp; .setReadOnly(true)&nbsp; &nbsp; &nbsp; &nbsp; .setFetchSize( 1000 ) // <<--- !!!!&nbsp; &nbsp; &nbsp; &nbsp; .setCacheable(false).scroll(ScrollMode.FORWARD_ONLY)
随时随地看视频慕课网APP

相关分类

Java
我要回答