当前位置: 首页 > news >正文

Pandas 操作数据(三)

一、汇总和计算统计

1、mean()平均值 ,默认skipna=True 是不计算空值NaN; 

 2、sum() 求和,idxmax() 求最大值索引值,依此类推idxmin()类似

3、describe() 针对 Series 或 DF 的列计算汇总统计

4、其他统计方法,min(),max(),mean(),median(),std(),var(),kurt()等等

 5、cumsum()累计和

 二、数据处理

 1.1、使用s1=pd.Series(), 过滤空值s1.dropna();不是空值s1.notnull();获取不是空值的值;

 1.2、使用df=pd.DataFrame()在默认情况下,按照 axis=0 来按行处理过滤空值df.dropna();

2、fillna() 常数填充空值

 fillna() 插值填充空值

fillna() 均值填充空值 

 向上->参数值method='ffill' 

  向下->参数值method='bfill' 

  向上->参数值method='ffill' ,限制次数limit=1

 3、去重复duplicated()

 

  删除重复的drop_duplicated()

三、字符串 str

 

 四、分组聚合

   对分组数据进行聚合、转换,或者过滤

  • 拆分(Spliting):表示对数据进行分组;
  • 应用(Applying):对分组数据应用聚合函数,进行相应计算;
  • 合并(Combining):最后汇总计算结果。

 groupby语法:

 参数说明:

 group by 与聚合函数一起使用

1、2、 创建groupby分组对象

使用 groupby() 可以沿着任意轴分组。您可以把分组时指定的键(key)作为每组的组名,

方法如下所示:

  • df.groupby("key")
  • df.groupby("key",axis=1)
  • df.groupby(["key1","key2"])

2、 查看分组结果

 应用聚合函数

    通过 agg() 函数可以对分组对象应用多个聚合函数:

 组的数据过滤操作

  通过 filter() 函数可以实现数据的筛选,该函数根据定义的条件过滤数据并返回一个新的数据集。

五、透视表

1、透视表是一种可以对数据动态排布并且分类汇总的表格格式  

2、为何使用pivot_table

  1. 灵活性高,可以随意定制你的分析计算要求
  2. 清晰易于理解数据
  3. 操作性强,报表神器

3、使用透视图:

 

 

相关文章:

  • 查题系统API无限搜题接口搭建
  • python之爬虫基础(1)
  • CVE-2022-22978 Spring-security 认证绕过漏洞分析和漏洞挖掘思考
  • 小孩取名:瑭字的寓意和含义
  • 7、IOC 之Bean定义继承 parent
  • J9数字论:模块化公链能否成为公链新趋势?
  • UVM环境中reset复位的处理
  • 示波器探头的选择和作用及原理
  • 新学期,我的FLAG不能倒~
  • 好心情精神心理科医生:精神病人为何会出现幻觉?
  • java计算机毕业设计ssm电子元件仓库管理系统
  • 数据结构与算法--数组
  • jvm oom内存溢出,导出dump,使用mat进行问题分析
  • 百钱百鸡问题(C++枚举法)
  • 基于SSM实现智慧幼儿园信息管理系统
  • #Java异常处理
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • Apache的80端口被占用以及访问时报错403
  • co模块的前端实现
  • iBatis和MyBatis在使用ResultMap对应关系时的区别
  • Idea+maven+scala构建包并在spark on yarn 运行
  • iOS 系统授权开发
  • Java-详解HashMap
  • JS实现简单的MVC模式开发小游戏
  • orm2 中文文档 3.1 模型属性
  • quasar-framework cnodejs社区
  • Rancher如何对接Ceph-RBD块存储
  • uni-app项目数字滚动
  • Vue UI框架库开发介绍
  • 不发不行!Netty集成文字图片聊天室外加TCP/IP软硬件通信
  • 浮动相关
  • 复习Javascript专题(四):js中的深浅拷贝
  • 构造函数(constructor)与原型链(prototype)关系
  • 基于阿里云移动推送的移动应用推送模式最佳实践
  • 将 Measurements 和 Units 应用到物理学
  • 前端路由实现-history
  • 小程序开发中的那些坑
  • 写代码的正确姿势
  • 在electron中实现跨域请求,无需更改服务器端设置
  • LIGO、Virgo第三轮探测告捷,同时探测到一对黑洞合并产生的引力波事件 ...
  • 继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler ...
  • 京东物流联手山西图灵打造智能供应链,让阅读更有趣 ...
  • ​创新驱动,边缘计算领袖:亚马逊云科技海外服务器服务再进化
  • ​用户画像从0到100的构建思路
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #每天一道面试题# 什么是MySQL的回表查询
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • %@ page import=%的用法
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (二十一)devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (四)docker:为mysql和java jar运行环境创建同一网络,容器互联
  • (学习日记)2024.01.19
  • (转)EOS中账户、钱包和密钥的关系
  • (自适应手机端)响应式新闻博客知识类pbootcms网站模板 自媒体运营博客网站源码下载