当前位置：首页 > news >正文

Pandas 操作数据（三）

news 来源：原创 2024/5/6 4:24:30

一、汇总和计算统计

1、mean(）平均值，默认skipna=True 是不计算空值NaN;

2、sum() 求和，idxmax() 求最大值索引值,依此类推idxmin()类似

3、describe() 针对 Series 或 DF 的列计算汇总统计

4、其他统计方法，min(),max(),mean(),median(),std(),var(),kurt()等等

5、cumsum()累计和

二、数据处理

1.1、使用s1=pd.Series()，过滤空值s1.dropna();不是空值s1.notnull();获取不是空值的值;

1.2、使用df=pd.DataFrame()。在默认情况下，按照 axis=0 来按行处理过滤空值df.dropna();

2、fillna() 常数填充空值

fillna() 插值填充空值

fillna() 均值填充空值

向上->参数值method='ffill'

向下->参数值method='bfill'

向上->参数值method='ffill' ,限制次数limit=1

3、去重复duplicated()

删除重复的drop_duplicated()

三、字符串 str

四、分组聚合

对分组数据进行聚合、转换，或者过滤

拆分（Spliting）：表示对数据进行分组；
应用（Applying）：对分组数据应用聚合函数，进行相应计算；
合并（Combining）：最后汇总计算结果。

groupby语法：

参数说明：

group by 与聚合函数一起使用

1、2、创建groupby分组对象

使用 groupby() 可以沿着任意轴分组。您可以把分组时指定的键（key）作为每组的组名，

方法如下所示：

df.groupby("key")
df.groupby("key",axis=1)
df.groupby(["key1","key2"])

2、查看分组结果

应用聚合函数

通过 agg() 函数可以对分组对象应用多个聚合函数：

组的数据过滤操作

通过 filter() 函数可以实现数据的筛选，该函数根据定义的条件过滤数据并返回一个新的数据集。

五、透视表

1、透视表是一种可以对数据动态排布并且分类汇总的表格格式

2、为何使用pivot_table

灵活性高，可以随意定制你的分析计算要求
清晰易于理解数据
操作性强，报表神器

3、使用透视图：

相关文章：

查题系统API无限搜题接口搭建

python之爬虫基础（1）

CVE-2022-22978 Spring-security 认证绕过漏洞分析和漏洞挖掘思考

小孩取名：瑭字的寓意和含义

7、IOC 之Bean定义继承 parent

J9数字论：模块化公链能否成为公链新趋势？

UVM环境中reset复位的处理

示波器探头的选择和作用及原理

新学期，我的FLAG不能倒~

好心情精神心理科医生：精神病人为何会出现幻觉？

java计算机毕业设计ssm电子元件仓库管理系统

数据结构与算法--数组

jvm oom内存溢出，导出dump，使用mat进行问题分析

百钱百鸡问题（C++枚举法）

基于SSM实现智慧幼儿园信息管理系统

#Java异常处理

【Under-the-hood-ReactJS-Part0】React源码解读

Apache的80端口被占用以及访问时报错403

co模块的前端实现

iBatis和MyBatis在使用ResultMap对应关系时的区别

Idea+maven+scala构建包并在spark on yarn 运行

iOS 系统授权开发

Java-详解HashMap

JS实现简单的MVC模式开发小游戏

orm2 中文文档 3.1 模型属性

quasar-framework cnodejs社区

Rancher如何对接Ceph-RBD块存储

uni-app项目数字滚动

Vue UI框架库开发介绍

不发不行！Netty集成文字图片聊天室外加TCP/IP软硬件通信

浮动相关

复习Javascript专题（四）：js中的深浅拷贝

构造函数（constructor）与原型链（prototype）关系

基于阿里云移动推送的移动应用推送模式最佳实践

将 Measurements 和 Units 应用到物理学

前端路由实现-history

小程序开发中的那些坑

写代码的正确姿势

在electron中实现跨域请求，无需更改服务器端设置

LIGO、Virgo第三轮探测告捷，同时探测到一对黑洞合并产生的引力波事件 ...

继 XDL 之后，阿里妈妈开源大规模分布式图表征学习框架 Euler ...

京东物流联手山西图灵打造智能供应链，让阅读更有趣 ...

创新驱动，边缘计算领袖：亚马逊云科技海外服务器服务再进化

用户画像从0到100的构建思路

#NOIP 2014# day.1 T3 飞扬的小鸟 bird

#每天一道面试题# 什么是MySQL的回表查询

$.type 怎么精确判断对象类型的 --（源码学习2）

%@ page import=%的用法

（1）(1.8) MSP(MultiWii 串行协议)(4.1 版)

（二十一）devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布

（每日持续更新）jdk api之FileReader基础、应用、实战

(四)docker：为mysql和java jar运行环境创建同一网络，容器互联

（学习日记）2024.01.19

（转）EOS中账户、钱包和密钥的关系

(自适应手机端)响应式新闻博客知识类pbootcms网站模板自媒体运营博客网站源码下载