当前位置: 首页 > news >正文

Python学习之==生成器

一、列表生成式

如果要生成列表[1x1, 2x2, 3x3, ..., 10x10]怎么做?除了循环还可以用一行语句代替循环生成,如下:

1 s = [i*i for i in range(10)]
2 print(s)  #[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

这种写法就是Python的列表生成式,写列表生成式时,把要生成的元素 i * i 放到前面,后面跟 for 循环,就可以把list创建出来。

二、生成器

1、通过列表生成式实现

  通过列表生成式,我们可以直接创建一个列表。但受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,会占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

  所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

  要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

1 l = [i*i for i in range(10)]
2 print(l)  #[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
3 
4 g = (i for i in range(5))
5 print(g)  #<generator object <genexpr> at 0x000001F1DFCE01A8>

创建l和g的区别仅在于最外层的[]()l是一个list,而g是一个generator。

我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值,如下:

1 g = (i for i in range(5))
2 print(next(g))  # 0
3 print(next(g))  # 1
4 print(next(g))  # 2
5 print(next(g))  # 3
6 print(next(g))  # 4
7 print(next(g))  # StopIteration

generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next(g)的用法,实际上很少这么用,正确的方法是使用for循环,因为generator也是可迭代对象,如下:

1 g = (i for i in range(5))
2 for i in g:
3     print(i)
4 # 0
5 # 1
6 # 2
7 # 3
8 # 4

所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误

2、用函数实现

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。

比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:

0,1, 1, 2, 3, 5, 8, 13, 21, 34, ...

1 def fib(max):
2     n,before,after = 0,0,1
3     while n <= max:
4         print(before)
5         before,after = after,before+after
6         n = n + 1

上面的函数输出的结果入下:

 1 fib(8)
 2 # 0
 3 # 1
 4 # 1
 5 # 2
 6 # 3
 7 # 5
 8 # 8
 9 # 13
10 # 21

仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print(before)改为yield before就可以了,如下:

1 def fib(max):
2     n,before,after = 0,0,1
3     while n <= max:
4         yield before
5         before,after = after,before+after
6         n = n + 1

这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator,如下:

 1 g = fib(5)
 2 print(g)  # <generator object fib at 0x000001C0DAD201A8>

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行,如下:

1 g = fib(5)
2 print(g)  # <generator object fib at 0x000001C0DAD201A8>
3 
4 print(next(g))  # 1
5 print(next(g))  # 1
6 print('干点别的')# 干点别的
7 print(next(g))  # 2
8 print(next(g))  # 3
9 print(next(g))  # 5

在上面fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。

同样的,把函数改成generator后,我们基本上从来不会用next()来获取下一个返回值,而是直接使用for循环来迭代,如下:

 1 g = fib(5)
 2 print(g)  # <generator object fib at 0x000001C0DAD201A8>
 3 for i in g:
 4     print(i)
 5 # 1
 6 # 1
 7 # 2
 8 # 3
 9 # 5
10 # 8

使用send方法给变成了generator的函数传值,如下:

 1 def bar():
 2     print('ok1')
 3     count = yield 1
 4     print(count)
 5     print('ok2')
 6     yield 2
 7 
 8 b = bar()
 9 s = b.send(None) # 等同于next(b),第一次send前如果没有next,只能传一个None
10 print(s)  # 返回第一个yield后面的1
11 k = b.send('AAA') # 第二次send把参数的值赋给count
12 print(k)  # 返回第二个yield后面的2
13 # ok1
14 # 1
15 # AAA
16 # ok2
17 # 2

第一次执行b.send(None)后进入函数体,先打印ok1,碰到yield返回1,中断函数执行。第二次执行b.send('AAA')后再次进入函数,把AAA付给count打印出来,然后接着往下走,打印ok2,再往下走碰到yield返回2。

文件读取:

1 def read_file(fpath): 
2     BLOCK_SIZE = 1024 
3     with open(fpath, 'rb') as f: 
4         while True: 
5             block = f.read(BLOCK_SIZE) 
6             if block: 
7                 yield block 
8             else: 
9                 return

如果直接对文件对象调用 read() 方法,会导致不可预测的内存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。通过 yield,我们不再需要编写读文件的迭代类,就可以轻松实现文件读取。

转载于:https://www.cnblogs.com/L-Test/p/10165254.html

相关文章:

  • MQTT学习笔记——MQTT协议体验 Mosquitto安装和使用
  • 遇到的Cocos2dx问题
  • Hello world开始复习
  • [ffmpeg] 定制滤波器
  • IOS的处理touch事件处理(按照手指的移动移动一个圆,开发环境用的ios7,storyboard)...
  • DataTable转实体类
  • [Java][Android][Process] ProcessBuilder与Runtime差别
  • NET Core微服务之路:自己动手实现Rpc服务框架,基于DotEasy.Rpc服务框架的介绍和集成...
  • 服务器虚拟化的十大谎言
  • cacti找不到网卡的解决方法
  • Java并发3:线程
  • 技术部门怎么年终考核最合理?
  • python机器学习实战(二)
  • 生成验证码
  • 【Spring Boot】19.集成消息
  • 【翻译】Mashape是如何管理15000个API和微服务的(三)
  • 0x05 Python数据分析,Anaconda八斩刀
  • 2017 年终总结 —— 在路上
  • Angular Elements 及其运作原理
  • ESLint简单操作
  • HTML5新特性总结
  • Java 23种设计模式 之单例模式 7种实现方式
  • nginx 负载服务器优化
  • Python3爬取英雄联盟英雄皮肤大图
  • Spring-boot 启动时碰到的错误
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 构造函数(constructor)与原型链(prototype)关系
  • 官方新出的 Kotlin 扩展库 KTX,到底帮你干了什么?
  • 微信小程序设置上一页数据
  • 一份游戏开发学习路线
  • 【干货分享】dos命令大全
  • 机器人开始自主学习,是人类福祉,还是定时炸弹? ...
  • 直播平台建设千万不要忘记流媒体服务器的存在 ...
  • # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
  • ${ }的特别功能
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (论文阅读23/100)Hierarchical Convolutional Features for Visual Tracking
  • (排序详解之 堆排序)
  • (三)elasticsearch 源码之启动流程分析
  • (四)linux文件内容查看
  • (转)C语言家族扩展收藏 (转)C语言家族扩展
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • ... fatal error LINK1120:1个无法解析的外部命令 的解决办法
  • .net core 客户端缓存、服务器端响应缓存、服务器内存缓存
  • .NET 的静态构造函数是否线程安全?答案是肯定的!
  • .net 无限分类
  • .net连接oracle数据库
  • .NET学习全景图
  • .Net中间语言BeforeFieldInit
  • .pop ----remove 删除
  • /etc/motd and /etc/issue
  • []新浪博客如何插入代码(其他博客应该也可以)
  • [AIGC] Redis基础命令集详细介绍
  • [ArcPy百科]第三节: Geometry信息中的空间参考解析
  • [C++] cout、wcout无法正常输出中文字符问题的深入调查(1):各种编译器测试