当前位置: 首页 > news >正文

【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.ss.util.CellRangeAddress;
import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory;
import org.springframework.web.multipart.MultipartFile;import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;/*** 读取Excel并解析合并单元格,将结果转为Map集合*/
public class ReadMergeCellExcelUtil {/*** 读取Excel数据** @param file 上传的Excel文件* @return 解析后的数据列表*/public static List<Map<String, String>> readExcelToObj(MultipartFile file) {List<Map<String, String>> result = new ArrayList<>();try (InputStream inputStream = file.getInputStream()) {Workbook workbook = XSSFWorkbookFactory.create(inputStream);result = readExcel(workbook, 0, 0, 0);} catch (IOException e) {e.printStackTrace();}return result;}/*** 读取Excel文件** @param workbook      工作簿* @param sheetIndex    sheet页下标:从0开始* @param startReadLine 开始读取的行:从0开始* @param tailLine      去除最后读取的行* @return 解析后的数据列表*/private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {Sheet sheet = workbook.getSheetAt(sheetIndex);FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();List<Map<String, String>> result = new ArrayList<>();for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {Row row = sheet.getRow(i);Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);result.add(rowData);}return result;}/*** 解析一行数据** @param sheet           工作表* @param row             行对象* @param formulaEvaluator 公式评估器* @return 解析后的行数据*/private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {Map<String, String> rowData = new HashMap<>();if (row != null) {int cellIndex = 0;for (Cell cell : row) {String cellValue = getCellValue(sheet, cell, formulaEvaluator);rowData.put("field" + cellIndex, cellValue);cellIndex++;}}return rowData;}/*** 获取单元格的值** @param sheet           工作表* @param cell            单元格* @param formulaEvaluator 公式评估器* @return 单元格值*/private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {if (cell == null) return "";return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator): getCellStringValue(cell, formulaEvaluator);}/*** 获取合并单元格的值** @param sheet           工作表* @param row             行号* @param column          列号* @param formulaEvaluator 公式评估器* @return 合并单元格值*/private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {for (CellRangeAddress range : sheet.getMergedRegions()) {if (range.isInRange(row, column)) {Row firstRow = sheet.getRow(range.getFirstRow());Cell firstCell = firstRow.getCell(range.getFirstColumn());return getCellStringValue(firstCell, formulaEvaluator);}}return "";}/*** 判断单元格是否是合并单元格** @param sheet  工作表* @param row    行下标* @param column 列下标* @return 是否是合并单元格*/private static boolean isMergedRegion(Sheet sheet, int row, int column) {for (CellRangeAddress range : sheet.getMergedRegions()) {if (range.isInRange(row, column)) {return true;}}return false;}/*** 获取单元格的字符串值** @param cell            单元格* @param formulaEvaluator 公式评估器* @return 单元格字符串值*/private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {switch (cell.getCellType()) {case STRING:return cell.getStringCellValue();case BOOLEAN:return String.valueOf(cell.getBooleanCellValue());case FORMULA:return formulaEvaluator.evaluate(cell).formatAsString();case NUMERIC:return String.valueOf(cell.getNumericCellValue());default:return "";}}}

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.0.0</version>
</dependency>

工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {List<Map<String, String>> result = new ArrayList<>();try (InputStream inputStream = file.getInputStream()) {Workbook workbook = XSSFWorkbookFactory.create(inputStream);result = readExcel(workbook, 0, 0, 0);} catch (IOException e) {e.printStackTrace();}return result;
}

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {Sheet sheet = workbook.getSheetAt(sheetIndex);FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();List<Map<String, String>> result = new ArrayList<>();for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {Row row = sheet.getRow(i);Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);result.add(rowData);}return result;
}
3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {Map<String, String> rowData = new HashMap<>();if (row != null) {int cellIndex = 0;for (Cell cell : row) {String cellValue = getCellValue(sheet, cell, formulaEvaluator);rowData.put("field" + cellIndex, cellValue);cellIndex++;}}return rowData;
}
4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {if (cell == null) return "";return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator): getCellStringValue(cell, formulaEvaluator);
}
5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {for (CellRangeAddress range : sheet.getMergedRegions()) {if (range.isInRange(row, column)) {Row firstRow = sheet.getRow(range.getFirstRow());Cell firstCell = firstRow.getCell(range.getFirstColumn());return getCellStringValue(firstCell, formulaEvaluator);}}return "";
}
6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {for (CellRangeAddress range : sheet.getMergedRegions()) {if (range.isInRange(row, column)) {return true;}}return false;
}
7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {switch (cell.getCellType()) {case STRING:return cell.getStringCellValue();case BOOLEAN:return String.valueOf(cell.getBooleanCellValue());case FORMULA:return formulaEvaluator.evaluate(cell).formatAsString();case NUMERIC:return String.valueOf(cell.getNumericCellValue());default:return "";}
}

示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile;
import java.util.List;
import java.util.Map;public class ExcelParserExample {public static void main(String[] args) {// 假设有一个MultipartFile类型的Excel文件对象fileMultipartFile file = ...;// 使用工具类解析Excel文件List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);// 打印解析结果for (Map<String, String> rowData : parsedData) {System.out.println(rowData);}}
}

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案
  1. 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
  2. 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。

结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!

相关文章:

  • Java 在PDF中替换文字(详解)
  • Google资深工程师深度讲解Go语言-课程笔记
  • 一个简单的springboot应用搭建过程
  • 第2部分:物联网模式在行动
  • Vue进阶之Vue无代码可视化项目(七)
  • 口袋奇兵游戏攻略:云手机辅助战锤入侵策略指南!
  • 防御综合实验作业2
  • Web开发:<br>标签的作用
  • 裸金属服务器
  • Java:Bean实体对象和Map互相转换
  • 内容长度不同的div如何自动对齐展示
  • C/C++蓝屏整人代码
  • npm install时报错 reason: certificate has expired
  • PCB(印制电路板)制造涉及的常规设备
  • 阿里云DSW实例中安装并运行Neo4J
  • classpath对获取配置文件的影响
  • input实现文字超出省略号功能
  • JavaScript/HTML5图表开发工具JavaScript Charts v3.19.6发布【附下载】
  • js数组之filter
  • laravel5.5 视图共享数据
  • Laravel深入学习6 - 应用体系结构:解耦事件处理器
  • LeetCode18.四数之和 JavaScript
  • Linux gpio口使用方法
  • miaov-React 最佳入门
  • ReactNative开发常用的三方模块
  • session共享问题解决方案
  • Webpack 4 学习01(基础配置)
  • Windows Containers 大冒险: 容器网络
  • 包装类对象
  • 创建一个Struts2项目maven 方式
  • 如何编写一个可升级的智能合约
  • 腾讯大梁:DevOps最后一棒,有效构建海量运营的持续反馈能力
  • 一些关于Rust在2019年的思考
  • 如何正确理解,内页权重高于首页?
  • 选择阿里云数据库HBase版十大理由
  • ​2021半年盘点,不想你错过的重磅新书
  • # Pytorch 中可以直接调用的Loss Functions总结:
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • #控制台大学课堂点名问题_课堂随机点名
  • (2022 CVPR) Unbiased Teacher v2
  • (35)远程识别(又称无人机识别)(二)
  • (Oracle)SQL优化基础(三):看懂执行计划顺序
  • (PADS学习)第二章:原理图绘制 第一部分
  • (python)数据结构---字典
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (紀錄)[ASP.NET MVC][jQuery]-2 純手工打造屬於自己的 jQuery GridView (含完整程式碼下載)...
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (三分钟)速览传统边缘检测算子
  • (算法)前K大的和
  • (转)ABI是什么
  • (转)GCC在C语言中内嵌汇编 asm __volatile__
  • (转)memcache、redis缓存
  • .Family_物联网
  • .NET 简介:跨平台、开源、高性能的开发平台