POI使用HSSF,XSSF,SXSSF三种方式
用 JavaPOI 导出 Excel 时,我们需要考虑到 Excel 版本及数据量的问题。针对不同的 Excel 版本,要采用不同的工具类,如果使用错了,会出现错误信息。JavaPOI 导出 Excel 有三种形式,他们分别是 1.HSSFWorkbook 2.XSSFWorkbook 3.SXSSFWorkbook。
- HSSFWorkbook:是操作 Excel2003 以前(包括 2003)的版本,扩展名是.xls;
- XSSFWorkbook:是操作 Excel2007 后的版本,扩展名是.xlsx;
- SXSSFWorkbook:是操作 Excel2007 后的版本,扩展名是.xlsx;
Excel版本兼容性是向下兼容。
三种类的接口及方法:
HSSF:HSSFWorkbook、HSSFSheet、HSSFRow、HSSFCell……
XSSF:XSSFWorkbook、XSSFSheet、XSSFRow、XSSFCell……
SXSSF:SXSSFWorkbook、Sheet、Row、Cell……
第一种:HSSFWorkbook
poi 导出 excel 最常用的方式;但是此种方式的局限就是导出的行数至多为 65535 行,超出 65536 条后系统就会报错。此方式因为行数不足七万行所以一般不会发生内存不足的情况(OOM)。
第二种:XSSFWorkbook
这种形式的出现是为了突破 HSSFWorkbook 的 65535 行局限。其对应的是 excel2007(1048576 行,16384 列)扩展名为“.xlsx”,最多可以导出 104 万行,不过这样就伴随着一个问题---OOM 内存溢出,原因是你所创建的 book sheet row cell 等此时是存在内存的并没有持久化。
第三种:SXSSFWorkbook
从 POI 3.8 版本开始,提供了一种基于 XSSF 的低内存占用的 SXSSF 方式。对于大型 excel 文件的创建,一个关键问题就是,要确保不会内存溢出。其实,就算生成很小的 excel(比如几 Mb),它用掉的内存是远大于 excel 文件实际的 size 的。如果单元格还有各种格式(比如,加粗,背景标红之类的),那它占用的内存就更多了。对于大型 excel 的创建且不会内存溢出的,就只有 SXSSFWorkbook 了。它的原理很简单,用硬盘空间换内存(就像 hash map 用空间换时间一样)。
SXSSFWorkbook 是 streaming 版本的 XSSFWorkbook,它只会保存最新的 excel rows 在内存里供查看,在此之前的 excel rows 都会被写入到硬盘里(Windows 电脑的话,是写入到 C 盘根目录下的 temp 文件夹)。被写入到硬盘里的 rows 是不可见的/不可访问的。只有还保存在内存里的才可以被访问到。
SXSSF 与 XSSF 的对比:
- a. 在一个时间点上,只可以访问一定数量的数据
- b. 不再支持 Sheet.clone()
- c. 不再支持公式的求值
- d. 在使用 Excel 模板下载数据时将不能动态改变表头,因为这种方式已经提前把 excel 写到硬盘的了就不能再改了
当数据量超出 65536 条后,在使用 HSSFWorkbook 或 XSSFWorkbook,程序会报 OutOfMemoryError:Javaheap space;内存溢出错误。这时应该用 SXSSFworkbook。
很显然,SXSSF比较特殊,除了workBook带前缀外,其余均无前缀。而HSSF和XSSF都带了各自的前缀。所以设置格式等在相互之间切换还是很简单的。
很重要的一点,SXSSF之所以是一种低内存操作方式,是因为他的构造方法:
SXSSFWorkbook w3= new SXSSFWorkbook(100);
这个100,你可以理解为POI操作时,内存中最多只有100行数据,当超过这个数据时,就将内存之前的数据删除,并且会在硬盘中生成临时文件。从而保证了低内存消耗。当然,你也可以将这个数字调大一点。
评论区