当前位置: 首页 > news >正文

Apache POI 解析和处理Excel

摘要:由于开发需要批量导入Excel中的数据,使用了Apache POI库,记录下使用过程

 1. 背景  

        Java 中操作 Excel 文件的库常用的有Apache POI 和阿里巴巴的 EasyExcel 。Apache POI 是一个功能比较全面的 Java 库,适合处理复杂的 Office 文件操作需求;而 EasyExcel 则是一个专注于 Excel 文件读写的简单、高效工具,更适合处理 Excel 文件的批量读写需求,并且易于上手。当Excel的数据量很大时推荐使用EasyExcel更合适。

        Apache的POI 用于处理 Microsoft Office 格式文件(如Excel、Word、PowerPoint)。它支持读取、写入和操作 Excel 文件,可以处理各种 Excel 格式(如 .xls 和 .xlsx)。
Apache POI - the Java API for Microsoft Documentsicon-default.png?t=N7T8https://poi.apache.org/

        阿里的EasyExcel
关于Easyexcel | Easy ExcelEasyExcel是一个基于Java的简单、省内存的读写Excel的开源项目,在尽可能节约内存的情况下支持读写百M的Excel。icon-default.png?t=N7T8https://easyexcel.opensource.alibaba.com/docs/current/

2. Apache POI的使用

2.1 引入依赖poi和poi-ooxml

        首先,在pom.xml中配置相关依赖,并使用Maven引入

<!--引入处理Excel的POI类poi:这是Apache POI的核心模块,用于处理Excel 97-2003格式的.xls 文件。poi-ooxml:这个模块则用于处理Office Open XML格式的.xlsx 文件,它是基于XML的Office文件格式,对应于较新版本的Excel。
-->
<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>3.16</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>3.16</version>
</dependency>
2.2 使用POI读取Excel中数据填充对象

        使用Apache POI解析Excel大体过程:通过输入流FileInputStream读取Excel中的数据,使用XSSFWorkbook类加载输入流,创建了一个新版本的Excel工作簿(下例子为workbook),从创建的工作簿中获取第一个工作表 firstsheet,再通过迭代器逐行逐个单元格遍历工作表,将单元格中的数据填充到对象中,并将对象添加到列表。此时,对得到的列表遍历,执行相应的数据库操作,实现批量导入的功能。

public void addProductByExcel(File destFile) throws IOException {// 从Excel文件中读取商品信息,并转换为商品列表List<Product> products = readProductsFromExcel(destFile);for (int i = 0; i < products.size(); i++) {Product product =  products.get(i);Product productOld = productMapper.selectByName(product.getName()); // 通过商品名称来查询数据库中是否已存在同名商品if (productOld != null) {  // 查询到同名商品,则抛出自定义异常throw  new ImoocMallException(ImoocMallExceptionEnum.NAME_EXISTED);}int count = productMapper.insertSelective(product); // 不存在同名商品,则向数据库中插入当前商品信息,存储受影响的行数if (count == 0) {throw new ImoocMallException(ImoocMallExceptionEnum.CREATE_FAILED);}}
}private List<Product> readProductsFromExcel(File excelFile) throws IOException {ArrayList<Product> listProducts = new ArrayList<>();  // 用于存储读取到的商品信息FileInputStream inputStream = new FileInputStream(excelFile);  // 文件输入流 inputStream,用于读取Excel文件中的数据XSSFWorkbook workbook = new XSSFWorkbook(inputStream); // 使用XSSFWorkbook类加载输入流,创建了一个新版本的Excel工作簿workbookXSSFSheet firstsheet =  workbook.getSheetAt(0); // 获取第一个工作表,index从0还是1开始需要根据实际情况确认Iterator<Row> iterator = firstsheet.iterator();  // 通过工作表的迭代器创建一个行迭代器iterator,用于逐行遍历工作表中的数据while(iterator.hasNext()) {Row nextRow = iterator.next(); // 逐行遍历Iterator<Cell> cellIterator = nextRow.cellIterator();  // 逐个单元格遍历Product aProduct = new Product();  // 创建Product对象aProduct,用于存储当前行数据对应的商品信息// 读取单元格填充aProductwhile (cellIterator.hasNext()) {Cell nextCell = cellIterator.next();int columnIndex = nextCell.getColumnIndex(); //获取单元格的索引,即列号switch (columnIndex) {case 0:aProduct.setName((String) ExcelUtil.getCellValue(nextCell)); // 针对不同的列号执行相应的操作,将单元格数据填充到aProduct对象的相应属性中break;case 1:aProduct.setImage((String) ExcelUtil.getCellValue(nextCell));break;case 2:aProduct.setDetail((String) ExcelUtil.getCellValue(nextCell));break;case 3:Double cellValue = (Double) ExcelUtil.getCellValue(nextCell); // excel中数字类型默认为DoubleaProduct.setCategoryId(cellValue.intValue());break;case 4:cellValue = (Double) ExcelUtil.getCellValue(nextCell); // excel中数字类型默认为DoubleaProduct.setPrice(cellValue.intValue());break;case 5:cellValue = (Double) ExcelUtil.getCellValue(nextCell); // excel中数字类型默认为DoubleaProduct.setStock(cellValue.intValue());break;case 6:cellValue = (Double) ExcelUtil.getCellValue(nextCell); // excel中数字类型默认为DoubleaProduct.setStatus(cellValue.intValue());break;default:break;}}listProducts.add(aProduct); // 将填充好数据的aProduct对象添加到商品列表listProducts中}workbook.close();  // 关闭Excel工作簿inputStream.close();  // 关闭文件输入流return listProducts;
}

        综上,实现了读取Excel中的数据,填充进入对象listProducts,最终添加到数据库的功能。

相关文章:

  • Mysql数据库-基本表操作
  • LVS----DR模式
  • 【C#图解教程】笔记
  • Text Field文本输入框
  • ABA关键词选品,大卖成功打造亚马逊爆款的秘密武器
  • 【RHCSA问答题】第八章 监控和管理Linux进程
  • 云上攻防-云产品篇堡垒机场景JumpServer绿盟SASTeleport麒麟齐治
  • 异步编程实战:使用C#实现FTP文件下载及超时控制
  • 代码详解:2024美团春招实习笔试第一场0309,是难还是简单?
  • 微信小程序如何实现下拉刷新
  • 利用SQL Server 进行报表统计的关键SQL语句与函数
  • Elasticsearch从入门到精通-03基本语法学习
  • FFmpeg--解封装流程
  • 【Linux-磁盘管理】
  • DataGrip 连接 Centos MySql失败
  • 【347天】每日项目总结系列085(2018.01.18)
  • 08.Android之View事件问题
  • 5分钟即可掌握的前端高效利器:JavaScript 策略模式
  • Android Volley源码解析
  • Angularjs之国际化
  • CSS相对定位
  • download使用浅析
  • IDEA 插件开发入门教程
  • Java知识点总结(JDBC-连接步骤及CRUD)
  • Linux Process Manage
  • PHP面试之三:MySQL数据库
  • 翻译:Hystrix - How To Use
  • 官方新出的 Kotlin 扩展库 KTX,到底帮你干了什么?
  • 马上搞懂 GeoJSON
  • 如何选择开源的机器学习框架?
  • 用jQuery怎么做到前后端分离
  • 主流的CSS水平和垂直居中技术大全
  • TPG领衔财团投资轻奢珠宝品牌APM Monaco
  • 我们雇佣了一只大猴子...
  • ​无人机石油管道巡检方案新亮点:灵活准确又高效
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (06)Hive——正则表达式
  • (6)STL算法之转换
  • (C语言版)链表(三)——实现双向链表创建、删除、插入、释放内存等简单操作...
  • (Matalb回归预测)PSO-BP粒子群算法优化BP神经网络的多维回归预测
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (附源码)ssm户外用品商城 毕业设计 112346
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (附源码)ssm码农论坛 毕业设计 231126
  • (论文阅读30/100)Convolutional Pose Machines
  • (十六)串口UART
  • (四)搭建容器云管理平台笔记—安装ETCD(不使用证书)
  • (原创)boost.property_tree解析xml的帮助类以及中文解析问题的解决
  • (最简单,详细,直接上手)uniapp/vue中英文多语言切换
  • ./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’: ./incl
  • .NET Framework 服务实现监控可观测性最佳实践
  • .Net IOC框架入门之一 Unity
  • .NET 常见的偏门问题
  • .net 写了一个支持重试、熔断和超时策略的 HttpClient 实例池
  • .NET/C# 如何获取当前进程的 CPU 和内存占用?如何获取全局 CPU 和内存占用?