.describe() python_Python-Win32com-Excel
工作中要经常使用Excel,文件少的时候,使用Excel进行数据分析还是很方便的。
但是如果动辄几百M的文件,再用Excel就显得力不从心了,于是就想到了Python。
环境:Windows10 + Python(python-3.7.5-embed-amd64)
python-3.7.5-embed-amd64 是一个最简单的Python环境,在哪儿都可以使用,免安装,缺点就是太简陋了,只有一些最最基本的库,简单到连pip都没有。
为什么用python-3.7.5-embed-amd64,因为办公环境不允许外网下载。
绞尽脑汁、千辛万苦终于安装了pip,再通过pip安装了numpy、pandas、win32com。
为什么使用win32com,而不使用xlwt等库,因为能力有限、实在是没安装成功。(哭脸)
本文的目的是:使用win32com调用excel API,实现对Excel文件的打开、数据读取、数据简单分析、将分析结果写入Excel、最后保存文件、关闭文件。
导入必要的库
from
前期准备工作
xlapp
简单操作
# 新建一个名为Aanlysis的worksheet
获取数据并创建DataFrame
# 获取所有数据
使用Pandas进行分析
这里就简单使用describe()方法得到数据的大致描述。
# 简单分析
为什么使用了两次reset_index和一次转置,这个是为了把describe分析结果的行和列索引都写入到DataFrame的内容中。
获取DataFrame的值并进行简单处理
# 获取值
上面代码是非常重要的,特别是这句英文描述,完美解决了一个困扰我很长时间的Error,“MemoryError: CreatingSafeArray”,这个error不解决,数据是不能写入Excel的。
一个数据集里面的numpy Data 数据类型必须要一致。
写入Excel
analysis