yield相当于return。
函数遇到yield就暂停,保存当前信息,返回yield的值。
在下次执行next()时,从当前位置继续执行。
比较有意思的事情是,曾经有人建议生成器函数不应该使用def,而应该发明一个新的关键字比如gen,但是Python之父Guido并没有同意这样做。
# 定义一个生成器
>>> def gen_123():
... yield 1
... yield 2
... yield 3
...
# 生成器本身是个函数
>>> gen_123
<function gen_123 at 0x0000019F60710790>
# 返回值是生成器对象
>>> gen_123()
<generator object gen_123 at 0x0000019F606AC040>
# 生成器也是迭代器
>>> for i in gen_123():
... print(i)
...
1
2
3
# 验证生成器也是迭代器,定义迭代器g
>>> g = gen_123()
# 可以通过next()获取yield生成的下一个元素
>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
Traceback (most recent call last):
File "<input>", line 1, in <module>
StopIteration
生成器函数会创建一个生成器对象。
把生成器传给next()函数时,生成器函数会执行函数定义体中的下一个yield语句,返回产出的值,并在当前位置暂停。
函数的定义体返回时,外层的生成器对象会抛出StopIteration异常
re.findall()
函数,它会把所有匹配到的元素都一次性写入内存中,假如匹配到的数据很多,就会占用大量的内存。为了解决这个问题,Python3有一个re.finditer()
函数,返回的就是一个生成器,取值时才生成数据放入内存中,能节省大量内存。def chain(*iterables):
for it in iterables:
for i in it:
yield i
s = "ABC"
t = tuple(range(3))
print(list(chain(s, t))) # ["A", "B", "C", 0, 1, 2]
def chain(*iterables):
for it in iterables:
yield from i
参考资料: 《流畅的Python》第14章 可迭代的对象、迭代器和生成器 https://www.runoob.com/python3/python3-iterator-generator.html
联系客服