(1).主要考虑到两个方面,第一个方面是内存溢出问题,所以选用阿里的EasyExcel因为它对POI进行了封装功能强大;第二个方面是由于excel版本导致Sheet存储容量不一样,cexcel2003(.xls)每个Sheet只能存6万多条数据而cexcel2007(xlsx)能存100多万条数据;
(2).主要实现逻辑是先利用总条数计算出装这么多数据需要多少个Sheet,每个Sheet要进行几次分批插入才插满,然后使用两层for循环,外层for循环用来遍历创建Sheet个数,内存循环用于分页分批查询数据到集合中,每次查询20万左右写到同一个Sheet中,直到写满100万条为止才进行下一伦外循环,最后一个Sheet写完毕后放行下载;
(3).查询前要调用集合的clear()方法清空之前的数据触发GC实现垃圾回收;前端发起请求时需要将http的响应时间默认的1s撤销请求设置长一点,避免超时连接丢失;
- 怎么知道当前Sheet写满了呢?详见下图,内层循环完毕表示当前sheet写满了;
- 怎么知道是最后一页?见下图,外层循环完毕就表示最后一页写完了;
- 因为根据数据总条数、每个sheet计划放多少条、每次往里放多少条数据来计算出用多少个sheet才能装下,每个sheet要循环多少次才能装满,如果最后一页数据写不完则加1次内层遍历次数;