当前位置: 首页 > news >正文

Java读取Excel并解析文本(并格式化输出)

摘要:
说明 最近在做一个比较小型的Java网站,需要批量导入注册用户.用户的信息写在一张excel表格里面. 所以就需要读取excel.所以就记录下遇到的问题,以及以后查看.

说明

最近在做一个比较小型的Java网站,需要批量导入注册用户.用户的信息写在一张excel表格里面.
所以就需要读取excel.所以就记录下遇到的问题,以及以后查看.

相关技术

使用的POI解析Excel需要使用的jar包

注(使用的maven.我就添加了右边的两个依赖就可以了)

分析

解析Excel首先就要解析Excel的结构.然后用面向对象的思想分析一下

这是一个excel文件.下面我们就来分析一下如果让你写这个poi框架,那么你会怎么设计.
1. 首先要有一个对象表示这整个Excel文件.
2. 可是这个excel文件中有好多页.Sheet1, Sheet2等等,所以我们还需要一个对象表示页.
3. 在页中,有行,所以还需要一个对象表示行.
4. 在行中,最后细分到格cell.
5. 格cell中数据还有好多类型.有字符串,数字,时间等等.

POI中的对象与excel对象的对应

excel文件就有多种类型了.后缀有 xls 与 xlsx

所以对于不同类型的文件,就需要使用不同的poi中的对象了.
1. 如果你要解析的是xls文件

从代码不难发现,这里的处理逻辑是
1>. 先用inputstream获取excel文件的io流
2>. 然后创建一个内存中的excel文件HSSFWorkbook类型对象.这个对象表示了整个excel文件.
3>. 对这个excel文件的每页做循环处理
4>. 对每页中的每行做循环处理.
5>. 对每行中的每个单元格做做处理,获取这个单元格的值.
6>. 把这行的结果添加到一个List数组中.
7>. 把每行的结果添加到最后的总结果中.
8>. 解析完以后就获取了一个List< List < String > > 类型的对象了.
2. 如果你要处理xlsx类型的文件则

和上面一样,我就不说了.

存在的问题

其实有时候我们希望得到的数据就是excel中的数据,可是最后发现结果不理想
如果你的excel中的数据是数字,你会发现java中对应的变成了科学计数法的.
所以在获取值的时候就要做一些特殊处理.
这样就能保证获取的值是我想要的值.
网上的做法是对于数值类型的数据格式化,获取自己想要的结果.
其实也没有那么麻烦.我在做的时候突然想到了一种处理解决方案.供参考
我们看一下poi中对于的toString()方法

该方法是poi的方法,从源码中我们可以发现,该处理流程是
1. 获取单元格的类型
2. 根据类型格式化数据并输出.这不一下子就造成了很多不是我们想要的.
所以我们就要改造一下这个方法例如这样

我的做法是这样的
1. 对于不熟悉的类型,或者为空则返回”” 控制串.
2.如果是数字,则修改单元格类型为String,然后返回String.这样就保证数字不被格式化了.
3. 虽然不知道这么做有什么后果,可是成功了.


一个Java学习平台分享给你们,让你在实践中积累经验掌握原理。如果你想拿高薪,想突破瓶颈,想跟别人竞争能取得优势的,想进BAT但是有担心面试不过的,可以加我的Java学习交流群:642830685

注:加群要求

1、大学学习的是Java相关专业,毕业后面试受挫,找不到对口工作

2、在公司待久了,现在过得很安逸,但跳槽时面试碰壁。需要在短时间内进修、跳槽拿高薪的

3、参加过线下培训后,知识点掌握不够深刻,就业困难,想继续深造

4、已经在Java相关部门上班的在职人员,对自身职业规划不清晰,混日子的

5、有一定的C语言基础,接触过java开发,想转行的


相关文章:

  • mysql五:索引原理与慢查询优化
  • Cookie和Seesion
  • 【347天】每日项目总结系列085(2018.01.18)
  • mui---调用图像裁剪android
  • POI导出excel文件样式
  • Kong 发布 Kong Brain 和 Kong Immunity,可进行智能自动化和适应性监控
  • 开源项目支持CocoaPods
  • mongodb 添加用户报错TypeError:db.addUser is not a function (mongodb3.4.1)
  • now code——小a和黄金街道(欧拉函数和快速幂模板)
  • 手动配置IP网络
  • 移动商城第十三篇【用户拦截器】
  • HOWTO fix Windows Update error 0x80244019
  • 事件的捕获、冒泡、委托
  • 编写第一个HTML5文件
  • Spring学习笔记下载
  • 0x05 Python数据分析,Anaconda八斩刀
  • 4. 路由到控制器 - Laravel从零开始教程
  • Bootstrap JS插件Alert源码分析
  • CentOS 7 修改主机名
  • js
  • Laravel 中的一个后期静态绑定
  • nodejs实现webservice问题总结
  • OSS Web直传 (文件图片)
  • Web标准制定过程
  • 对超线程几个不同角度的解释
  • FaaS 的简单实践
  • Hibernate主键生成策略及选择
  • Linux权限管理(week1_day5)--技术流ken
  • 选择阿里云数据库HBase版十大理由
  • ​ArcGIS Pro 如何批量删除字段
  • ​你们这样子,耽误我的工作进度怎么办?
  • !!Dom4j 学习笔记
  • %3cscript放入php,跟bWAPP学WEB安全(PHP代码)--XSS跨站脚本攻击
  • (+4)2.2UML建模图
  • (04)Hive的相关概念——order by 、sort by、distribute by 、cluster by
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (3)llvm ir转换过程
  • (4)logging(日志模块)
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (Matalb分类预测)GA-BP遗传算法优化BP神经网络的多维分类预测
  • (附源码)springboot学生选课系统 毕业设计 612555
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)
  • (学习日记)2024.02.29:UCOSIII第二节
  • (正则)提取页面里的img标签
  • (状压dp)uva 10817 Headmaster's Headache
  • .bat批处理(七):PC端从手机内复制文件到本地
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .Family_物联网
  • .NET 4.0中使用内存映射文件实现进程通讯
  • .NET CF命令行调试器MDbg入门(一)
  • .Net 应用中使用dot trace进行性能诊断
  • .netcore如何运行环境安装到Linux服务器
  • .NET成年了,然后呢?
  • .sh 的运行
  • @RunWith注解作用