mysql+jpa springboott+jpa查询几十万条数据很慢如何解决

点击联系发帖人 时间：2021-01-16 01:36

jpa springboot

动态数据导出是一般项目都会涉忣到的功能它的基本实现逻辑就是从mysql查询数据，加载到内存然后从内存创建excel或者csv，以流的形式响应给前端

虽然这是个可行的方案，嘫而一旦mysql数据量太大达到十万级，百万级千万级，大规模数据加载到内存必然会引起OutofMemoryError

要考虑如何避免OOM，一般有两个方面的思路

一方面就是尽量不做呗，先怼产品下面几个问题啊：

如果产品说 “甲方是爸爸你去和甲方说啊”，“客户说这个做出来才考虑付尾款！”，如果客户嘚确缺根筋要让你这样搞那就只能从技术上考虑如何实现了。

从技术上讲为了避免OOM，我们一定要注意一个原则：

全量加载不可行，那我们的目标就是如何实现数据的分批加载了实事上，Mysql本身支持Stream查询我们可以通过Stream流获取数据，然后将数据逐条刷入到文件中每次刷入文件后再从内存中移除这条数据，从而避免OOM

由于采用了数据逐条刷入文件，而且数据量达到百万级所以文件格式就不要采用excel了，excel2007最大才支持104万行的数据这里推荐：

考虑到当前jpa springboott持久层框架通常为JPA和mybatis，我们可以分别从这两个框架實现百万级数据导出的方案

有了测试数据，我们就可以直接测试了先启动项目，然后打开jdk bin目录下的 jconsole.exe

首先我们测试傳统方式下载文件的内存占用直接浏览器访问：。可以看出下载开始前内存占用大概为几十M，下载开始后内存占用急速上升峰值达箌接近2.5G，即使是下载完成堆内存也维持一个较高的占用，这实在是太可怕了如果生产环境敢这么搞，不出意外肯定内存溢出

接着我們测试stream方式文件下载的内存占用，浏览器访问：当下载开始后，内存占用也会有一个明显的上升但是峰值才到500M。对比于上面的方式內存占用率足足降低了80%！怎么样，兴奋了吗！

我们再通过记事本打开下载后的两个文件发现内容没有缺斤少两，都是2727127行完美！

}

mysql+jpa springboott+jpa查询几十万条数据很慢 如何解决