当前位置: 首页 > news >正文

numpy之初探排序和集合运算

排序

排序

numpy与python列表内置的方法类似,也可通过sort方法进行排序。

用法如下:


In [1]: import numpy as np

In [2]: x = np.random.randn(9)

In [3]: x
Out[3]:
array([-0.4041504 , -0.42198556,  0.92807217, -2.66609196,  1.50915897,
        0.38080873,  1.05325796, -1.16488798,  0.04062064])

In [4]: x.sort()

In [5]: x
Out[5]:
array([-2.66609196, -1.16488798, -0.42198556, -0.4041504 ,  0.04062064,
        0.38080873,  0.92807217,  1.05325796,  1.50915897])

可以发现上述的sort方法是直接对x进行了排序而并没有创建一个副本。
但是np.sort()这个顶级的方法,会返回一个副本:

In [6]: x = np.random.randn(6)

In [7]: x
Out[7]:
array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,
        0.95574862])

In [8]: np.sort(x)
Out[8]:
array([ 0.00352338,  0.14240205,  0.22528632,  0.48903869,  0.95574862,
        1.31659382])

In [9]: x
Out[9]:
array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,
        0.95574862])

传入轴编号,可以实现在某一个轴向上进行排序。

In [34]: x = np.random.randn(5,4)

In [35]: x
Out[35]:
array([[-0.26646799, -0.40714749, -0.76788268, -0.25340467],
       [ 0.70099086, -0.88716684,  0.13461279,  2.14412835],
       [ 0.39718924, -0.14671297, -0.67821163,  1.85798273],
       [-0.29389289,  0.0346094 ,  0.25213133,  0.87105479],
       [-0.10797243,  1.60188878,  0.67829493,  0.43291808]])

In [36]: s = x

In [37]: s.sort(0)#按列进行排序

In [38]: s
Out[38]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],
       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],
       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],
       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])

In [39]: x
Out[39]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],
       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],
       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],
       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])


In [40]: x = np.random.randn(5,4)

In [41]: x
Out[41]:
array([[ 0.82309157, -0.56413805, -0.1766557 , -0.31924962],
       [-1.25606694,  2.63622922,  2.47481377,  0.27840961],
       [ 0.63659583,  1.52779004, -0.90582752,  0.82325241],
       [-1.52664294, -0.5285837 , -1.96380368, -0.44323125],
       [ 1.94859294,  2.55676806,  1.53614848, -0.43366557]])

In [42]: x.sort(1)#按行进行排序

In [43]: x
Out[43]:
array([[-0.56413805, -0.31924962, -0.1766557 ,  0.82309157],
       [-1.25606694,  0.27840961,  2.47481377,  2.63622922],
       [-0.90582752,  0.63659583,  0.82325241,  1.52779004],
       [-1.96380368, -1.52664294, -0.5285837 , -0.44323125],
       [-0.43366557,  1.53614848,  1.94859294,  2.55676806]])

在这儿,我试图将x赋值给s,结果发现对s排序后,x也变了,这说明,在内存中,实际上,s,x是指向同一组值得。

我也曾试图输入 s.sort(2),结果出现了ValueError: axis(=2) out of bounds,这也就和前面的统计函数的axis参数是一致的。

那么也就是说,他的用法和axis一致。

利用排序,我们还能得到分位数(
分位数(英语:Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。具体可自行搜索),从而得到特定位置的值。


In [44]: x = np.random.randn(500)

In [45]: x.sort()

In [46]: x[int(0.05 * len(x))] #5%分位数
Out[46]: -1.7657191623368329

还有很多没有深入了解,比如怎么降序排列,待续。

集合运算

unique(x)返回集合中的唯一值,并排序,其实也就是去除重复值。


In [1]: import numpy as np

In [2]: str = np.array(['s','f','r','s','d','f','w','r'])

In [3]: np.unique(str)
Out[3]:
array(['d', 'f', 'r', 's', 'w'],
      dtype='<U1')

In [4]: i = np.array([2,2,2,2,1,1,3,4,5,4,3,5])

In [5]: np.unique(i)
Out[5]: array([1, 2, 3, 4, 5])

intersect1d(x,y)返回集合A和B的交集,并排序

In [6]: k = np.arange(8)

In [7]: np.intersect1d(i, k)
Out[7]: array([1, 2, 3, 4, 5])

union1d(x,y)返回集合A和B的并集,并排序

In [8]: np.union1d(i,k)
Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7])

in1d(x,y)返回一个A包含于B的布尔型数组


In [10]: np.in1d(k,i)
Out[10]: array([False,  True,  True,  True,  True,  True, False, False], dtype=bool)

setdiff1d(x,y)集合的差,包含于A但不包含于B,相当于A-(A∩B)


In [12]: np.setdiff1d(k,i)
Out[12]: array([0, 6, 7])

setxor1d(x,y)存在于A中但不同时存在于B中,也就是对称差,说白了就是A和B交集之外的部分。

对称差

就是红色的部分。

In [13]: s = np.arange(4,12)

In [14]: s
Out[14]: array([ 4,  5,  6,  7,  8,  9, 10, 11])

In [15]: np.setxor1d(s,k)
Out[15]: array([ 0,  1,  2,  3,  8,  9, 10, 11])

转载于:https://www.cnblogs.com/sunshinewang/p/6905791.html

相关文章:

  • eclipse:刪除空行
  • HTTP权威指南-URL与资源
  • Android 自己定义RecyclerView 实现真正的Gallery效果
  • 数据传递-------@PathVariable
  • pragma once
  • 2017年5月27日
  • Mysql中key 、primary key 、unique key 与index区别
  • 空物体下很多子物体的体积判断并附加对应的碰撞器
  • http://www.onvif.org/onvif/ver20/util/operationIndex.html
  • Hadoop高速入门
  • 对象的初始化过程
  • C# goto
  • 《Java并发编程实战》第九章 图形用户界面应用程序界面 读书笔记
  • Spark RDD概念学习系列之Pair RDD的transformation操作
  • linux 不常用命令及命令组合
  • 【Leetcode】104. 二叉树的最大深度
  • 【笔记】你不知道的JS读书笔记——Promise
  • Android路由框架AnnoRouter:使用Java接口来定义路由跳转
  • Brief introduction of how to 'Call, Apply and Bind'
  • CoolViewPager:即刻刷新,自定义边缘效果颜色,双向自动循环,内置垂直切换效果,想要的都在这里...
  • exif信息对照
  • Git的一些常用操作
  • Java 9 被无情抛弃,Java 8 直接升级到 Java 10!!
  • JavaScript设计模式之工厂模式
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • Leetcode 27 Remove Element
  • MySQL QA
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • Vue.js 移动端适配之 vw 解决方案
  • VuePress 静态网站生成
  • vue学习系列(二)vue-cli
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • 程序员最讨厌的9句话,你可有补充?
  • 构造函数(constructor)与原型链(prototype)关系
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 微信小程序:实现悬浮返回和分享按钮
  • 小试R空间处理新库sf
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • ​520就是要宠粉,你的心头书我买单
  • ​比特币大跌的 2 个原因
  • ​如何防止网络攻击?
  • #传输# #传输数据判断#
  • #微信小程序(布局、渲染层基础知识)
  • $.ajax,axios,fetch三种ajax请求的区别
  • (备忘)Java Map 遍历
  • (多级缓存)多级缓存
  • (附源码)springboot家庭装修管理系统 毕业设计 613205
  • (六)库存超卖案例实战——使用mysql分布式锁解决“超卖”问题
  • (七)微服务分布式云架构spring cloud - common-service 项目构建过程
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)创业家杂志:UCWEB天使第一步
  • ./indexer: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object fil
  • .gitignore文件设置了忽略但不生效