当前位置: 首页 > news >正文

一种更优雅书写Python代码的方式

1 简介

一些比较熟悉pandas的读者朋友应该经常会使用query()eval()pipe()assign()pandas的常用方法,书写可读性很高的「链式」数据分析处理代码,从而更加丝滑流畅地组织代码逻辑。

但在原生Python中并没有提供类似shell中的管道操作符|R中的管道操作符%>%等语法,也没有针对列表等数组结构的可进行链式书写的快捷方法,譬如javascript中数组的map()filter()some()every()等。

正所谓“标准库不够,三方库来凑”,Python原生对链式写法支持不到位没关系,我们可以使用一些简单方便且轻量的第三方库来协助我们在Python代码中大面积实现链式写法,今天的文章中我就将带大家一起学习相关的知识技巧~

2 在Python中配合pipe灵活使用链式写法

我们将使用到pipe这个第三方库,它不仅内置了很多实用的「管道操作函数」,还提供了将常规函数快捷「转换」为管道操作函数的方法,使用pip install pipe对其进行安装即可。

pipe的用法非常方便,类似shell中的管道操作:以你的数组变量为起点,使用操作符|衔接pipe内置的各个常见管道操作函数,组装起自己所需的计算步骤即可,譬如,我们筛选输入数组中为偶数的,再求平方,就可以写作:

import pipe

list(
    range(10) | 
    pipe.filter(lambda x: x % 2 == 0) | 
    pipe.select(lambda x: x ** 2)
)

因为pipe搭建的管道默认都是惰性运算的,直接产生的结果是生成器类型,所以上面的例子中我们最外层套上了list()来取得实际计算结果,更优雅的方式是配合pipe.Pipe(),将list()也改造为管道操作函数:

from pipe import Pipe

(
    range(10) | 
    pipe.filter(lambda x: x % 2 == 0) | 
    pipe.select(lambda x: x ** 2) |
    Pipe(list)
)

在上面的简单例子中我们使用到的filter()select()等就是pipe中常见的管道操作函数,事实上pipe中的管道操作函数相当的丰富,下面我们来展示其中一些常用的:

2.1 pipe中常用的管道操作函数

2.1.1 使用traverse()展平嵌套数组

如果你想要将任意嵌套数组结构展平,可以使用traverse()

(
    [1, [2, 3, [4, 5]], 6, [7, 8, [9, [10, 11]]]] | 
    pipe.traverse | 
    Pipe(list)
)

2.1.2 使用dedup()进行顺序去重

如果我们需要对包含若干重复值的数组进行去重,且希望保留原始数据的顺序,则可以使用dedup(),其还支持key参数,类似sorted()中的同名参数,实现自定义去重规则:

(
    [-1, 0, 0, 0, 1, 2, 3] | 
    pipe.dedup |
    Pipe(list)
)

(
    [-1, 0, 0, 0, 1, 2, 3] | 
    # 基于每个元素的绝对值进行去重
    pipe.dedup(key=abs) |
    Pipe(list)
)

2.1.3 使用filter()进行值过滤

我们最开始的例子中使用过它,用法就是基于传入的lambda函数对每个元素进行条件判断,并保留结果为True的,与javascript中的filter()方法非常相似:

(
    [1, 4, 3, 2, 5, 6, 8] |
    # 保留大于5的元素
    pipe.filter(lambda x: x > 5) |
    Pipe(list)
)

2.1.4 使用groupby()进行分组运算

这个函数非常实用,其功能相当于管道操作版本的itertools.groupby(),可以帮助我们基于lambda函数运算结果对原始输入数组进行分组,通过groupby()操作后直接得到的结果是分组结果的二元组列表,每个元组的第一个元素是分组标签,第二个元素是分到该组内的各个元素:

基于此,我们可以衔接很多其他管道操作函数,譬如衔接select()对分组结果进行自定义运算:

2.1.5 使用select()对上一步结果进行自定义遍历运算

这个函数是pipe()中核心的管道操作函数,通过前面的若干例子也能弄明白,它的功能是基于我们自定义的函数,对上一步的运算结果进行遍历运算。

2.1.6 使用sort()进行排序

相当于内置函数sorted()的管道操作版本,同样支持keyreverse参数:

上述内容足以支撑大部分日常操作需求,你也可以在https://github.com/JulienPalard/Pipe中查看pipe的更多功能介绍。

相关文章:

  • 自定义类型(结构体、位段、联合体、枚举)
  • 如何基于 GORM 实现 CreateOrUpdate 方法
  • Spring Boot核心之基本配置、日志配置、自动配置、条件注解
  • ArcGIS校园3D展示图制作详细教程
  • 【算法 | 实验6-1】n*n的网格,从左上角开始到右下角结束遍历所有的方块仅一次,总共有多少种不同的遍历路径
  • c++数据结构:图(邻接表)
  • SCOUT MINI Pro松灵机器人j建图定点步骤
  • 10个Pandas的小技巧
  • 广度优先遍历解决迷宫问题
  • 掌握 Microsoft Excel 宏和 Excel VBA
  • springboot框架中如何整合mybatis框架?
  • 阿里巴巴面试题- - -JVM篇(十七)
  • 学生党用什么蓝牙耳机好?学生党性价比高的蓝牙耳机推荐
  • 基于Python-sqlparse的SQL表血缘追踪解析实现
  • 02-JVM内存模型深度剖析与优化
  • CSS中外联样式表代表的含义
  • ES6, React, Redux, Webpack写的一个爬 GitHub 的网页
  • es6--symbol
  • ES6语法详解(一)
  • java第三方包学习之lombok
  • js写一个简单的选项卡
  • js中forEach回调同异步问题
  • LintCode 31. partitionArray 数组划分
  • linux安装openssl、swoole等扩展的具体步骤
  • mysql 5.6 原生Online DDL解析
  • Object.assign方法不能实现深复制
  • Python打包系统简单入门
  • VirtualBox 安装过程中出现 Running VMs found 错误的解决过程
  • webgl (原生)基础入门指南【一】
  • 动态魔术使用DBMS_SQL
  • 买一台 iPhone X,还是创建一家未来的独角兽?
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 我这样减少了26.5M Java内存!
  • 译有关态射的一切
  • 正则学习笔记
  • 正则与JS中的正则
  • ionic入门之数据绑定显示-1
  • ![CDATA[ ]] 是什么东东
  • # 达梦数据库知识点
  • #我与虚拟机的故事#连载20:周志明虚拟机第 3 版:到底值不值得买?
  • (1)(1.9) MSP (version 4.2)
  • (C++17) std算法之执行策略 execution
  • (附源码)springboot助农电商系统 毕业设计 081919
  • (顺序)容器的好伴侣 --- 容器适配器
  • (转)平衡树
  • .NET Framework 的 bug?try-catch-when 中如果 when 语句抛出异常,程序将彻底崩溃
  • .net MVC中使用angularJs刷新页面数据列表
  • /etc/fstab 只读无法修改的解决办法
  • @Validated和@Valid校验参数区别
  • @我的前任是个极品 微博分析
  • [100天算法】-二叉树剪枝(day 48)
  • [C#]winform使用引导APSF和梯度自适应卷积增强夜间雾图像的可见性算法实现夜间雾霾图像的可见度增强
  • [EFI]Atermiter X99 Turbo D4 E5-2630v3电脑 Hackintosh 黑苹果efi引导文件
  • [HJ56 完全数计算]
  • [IE编程] 如何获得IE版本号