当前位置: 首页 > news >正文

对某列进行操作_使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用

使用Excel进行数据分析,有些数据总要经过很多步操作实现,而在操作过程中,如果对Excel理解不深,又很难掌控。这种时候,我们唯一要做的,就是用最简单的方式解决它。

以下介绍会包括:数据替换(使用replace函数及条件判别)、数据切割(loc及iloc函数)

01

数据替换

1.1 简单替换

比如,把空值替换成0,把字符a替换成字符b等诸如此类操作

pandas有replace函数,可直接使用。

import numpy as np #导入numpyprint(data.replace(np.nan,'0'))
21d1e587b5eaaa477ad2ee0011dae219.png

可以看到,col_c列中的空值被替换成了0。不过,如果此处先进行处理,再进行输出,并不会得到想要的结果,因为原来的对象data并未发生改变,而是生成了一个新的对象。

46287600cc73a5f9e6c8dac38c59dd5c.png

而如果必须这么操作,并实现替换的话,可以用replace中的参数inplace=True来完成。

data.replace(np.nan,'0',inplace=True)print(data)

结果如下:

93930b8da3a9a900a2bf3b17a5a1021b.png

1.2 条件替换

1.2.1 将a列中小于5的数值,用B列替换

data.loc[data.col_a<5,'col_a']=data.col_b
2c35bc1de1fedadcb9170d719091e362.png

可以看到,col_a列中的第1~3行小于5的都被col_b列数据替换。

1.2.2 将a列中小于b列的数值,用c列替换

data.loc[data.col_a
d733357e788fa8f328f0808ae2617811.png

1.2.3 当a列小于b列时,对当前行的部分列进行替换

若col_a列数值小于col_b列,则col_a和col_c列的数值都要被替换成col_b列数值。

data.loc[data.col_c
236f42cb3f61669414070d5823d107d7.png

02

数据查找

我们经常会因为需要拿到想要的数据,而需要多次筛选数据,并保留筛选结果,那如何一次性输出想要的数据集呢?

2.1 标签索引

通过loc函数行标签选择,逗号左侧是行选择,右侧是列选择。

2.1.1 获取某行某列对应的值

获取第一列和第一行对应的值

print(data.loc['row_1','col_a'])

结果:3

2.1.2 获取连续行、列对应的值

获取第1~3行和第1~2列对应的值

print(data.loc['row_1:row_3','col_a:col_b'])

结果:

e7d659d05a6cd1f51e63ea1028c7b945.png

2.1.3 获取不连续行、列对应的值

获取第1,3行和第1,3,5列对应的值

print(data.loc[['row_1','row_3'],['col_a','col_c','col_e']])

结果:

082e76be99a79b7f2310d8db252a980e.png

2.2 位置索引

通过iloc函数行位置选择,位置为整数索引。同样,逗号左侧是行选择,右侧是列选择。用法基本同标签索引,只不过比标签较少了输入,只需要输入整数即可。(左闭右开)

2.1.1 获取某行某列对应的值

获取第二列和第二行对应的值

print(data.loc[1,1])

结果:5

2.1.2 获取连续行或列的值

获取前三行数据(索引0,1,2)

print(data.iloc[:3])
d422735f9c8387a7ac374ec4d52e0a87.png

获取第三行之后的数据,也就是第四行和第五行。(索引3及以上)

print(data.iloc[3:])
689187a7402acf7b8744e253a16009c5.png

2.3 多条件查找

获取a列大于5但是b列小于20的数据(注意条件加括号:因为比较运算符优先级低于按位与&,加上括号后,提高了优先级)。

print(data[(data.col_a>5)&(data.col_b<20)])
458157b6b6ec05cf6f4d5da910e439d2.png

相关文章:

  • 中object转为list集合_快速带你梳理Java单列集合之Collection
  • 代码回到之前版本_代码版本控制及托管:我的最佳实践
  • springboot处理参数再转发请求_springBoot PUT请求接收不了参数的解决办法
  • 如何在EDUIS中导出ETL字幕模板_教大家Edius如何设置导出mp4格式视频
  • r语言和metawin_【R语言】关于ggcor包消息的更新
  • git maven 一键部署_Docker+Jenkins+Git+Maven实现Springboot项目自动化部署
  • 添加删除元素_蔡司:CALYPSO高级应用 | 指数交换与添加删除循环
  • 初中物理凸透镜成像动态图_只要看一眼,就能立刻知道凸透镜成像特点,中考物理必考送分题...
  • html5窗口最顶层_快速开发基于 HTML5 网络拓扑图应用——入门篇(一)
  • mime插件 node_【Node.js基础篇】(五)使用mime模块来响应css、js文件的请求
  • react前端封装接口弹出错误_在react项目中用es6封装ajax请求,组件中调用总是报错,求解?...
  • mysql5.7不能存储中文_解决Mysql5.7中文乱码的问题
  • mysql取字段中间字符串_sql 如何截取一个字段里某一字符串中间的字符?
  • mysql分区技术_高性能的MySQL(7)分区技术
  • mysql7.6.8安装教程_Centos7安装mysql8教程
  • 【面试系列】之二:关于js原型
  • css系列之关于字体的事
  • JavaScript类型识别
  • java取消线程实例
  • Java新版本的开发已正式进入轨道,版本号18.3
  • Markdown 语法简单说明
  • MobX
  • MySQL Access denied for user 'root'@'localhost' 解决方法
  • Python语法速览与机器学习开发环境搭建
  • React中的“虫洞”——Context
  • SQLServer之创建显式事务
  • vue脚手架vue-cli
  • vue数据传递--我有特殊的实现技巧
  • 初识MongoDB分片
  • 工作手记之html2canvas使用概述
  • 关于extract.autodesk.io的一些说明
  • 好的网址,关于.net 4.0 ,vs 2010
  • 将回调地狱按在地上摩擦的Promise
  • 力扣(LeetCode)357
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 数据科学 第 3 章 11 字符串处理
  • 用quicker-worker.js轻松跑一个大数据遍历
  • 在weex里面使用chart图表
  • HanLP分词命名实体提取详解
  • Unity3D - 异步加载游戏场景与异步加载游戏资源进度条 ...
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • 策略 : 一文教你成为人工智能(AI)领域专家
  • ​​​​​​​ubuntu16.04 fastreid训练过程
  • ​sqlite3 --- SQLite 数据库 DB-API 2.0 接口模块​
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • #Z2294. 打印树的直径
  • #常见电池型号介绍 常见电池尺寸是多少【详解】
  • (4)Elastix图像配准:3D图像
  • (二)windows配置JDK环境
  • (二)斐波那契Fabonacci函数
  • (附源码)计算机毕业设计SSM疫情社区管理系统
  • (南京观海微电子)——I3C协议介绍
  • (七)Java对象在Hibernate持久化层的状态
  • (译) 函数式 JS #1:简介
  • (转)Linux整合apache和tomcat构建Web服务器