迭代器和生成器是函数中的一大重点,务必掌握,何为迭代?何为迭代器?
预习:
1、处理文件,用户指定要查找的文件和内容,将文件中包含要查找内容的每一行都输出到屏幕(使用生成器)
2、批量处理文件,用户指定要查找的目录和内容,将本层目录下所有文件中包含要查找内容的每一行都输出到屏幕
一、迭代器
for i in 50:
print(i)
#运行结果:
# Traceback (most recent call last):
# File "G:/python/python代码/八月/day2 迭代器生成器/3迭代器.py", line 8, in <module>
# for i in 50:
# TypeError: 'int' object is not iterable
报错:
TypeError: 'int' object is not iterable
类型报错:'int'对象是不可迭代的 何为迭代?
iterable:可迭代的;迭代的;
可迭代的:从上面代码可以简单分析出能被for循环取值的就是可迭代,那么我们就可以初步总结出可迭代的类型:str、list、tuple、set、dict
可迭代的 ——对应的标志 拥有__iter__方法
print('__iter__' in dir([1,2,3])) #判断一个变量是不是一个可迭代的
可迭代协议
可以被迭代要满足的要求就叫做可迭代协议。可迭代协议的定义非常简单,就是内部实现了__iter__方法。
二、迭代器
__iter__方法作用:
l = [1,2,3,4,5]
print(l.__iter__())
l_iterator = iter(l) #建议用iter(l)
print(set(dir(l_iterator))-set(dir(l)))
#结果:
#<list_iterator object at 0x000001FDD1B79048>
#{'__length_hint__', '__next__', '__setstate__'}
迭代器
iterator:迭代器;迭代程序
迭代器协议:必须拥有__iter__方法和__next__方法
通过iter(x)得到的结果就是一个迭代器,
x是一个可迭代的对象
在for循环中,就是在内部调用了__next__方法才能取到一个一个的值。
__next__的精髓:
l = [1,2,3,4,5]
l_iterator = iter(l)
print(l_iterator.__next__())
print(l_iterator.__next__())
print(l_iterator.__next__())
print(l_iterator.__next__())
print(l_iterator.__next__())
next(l_iterator) #==l_iterator.__next__()
while True:
try:
print(next(l_iterator))
except StopIteration:
break
__next__方法的使用精髓
如果我们一直取next取到迭代器里已经没有元素了,就会报错(抛出一个异常StopIteration),告诉我们,列表中已经没有有效的元素了。这个时候,我们就要使用异常处理机制来把这个异常处理掉。try_except异常处理机制只做了解,不是本章重点,会面会详细讲解。
判断是否可迭代和迭代器的简洁方法:
from collections import Iterable
from collections import Iterator
s = 'abc'
print(isinstance(s,Iterable))
print(isinstance(s,Iterator))
print(isinstance(iter(s),Iterator))
判断可迭代和迭代器
不管是一个迭代器还是一个可迭代对象,都可以使用for循环遍历
迭代器出现的原因 帮你节省内存
三、生成器
迭代器大部分都是在python的内部去使用的,我们直接拿来用就行了
我们自己写的能实现迭代器功能的东西就叫生成器。
1.生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行
2.生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表
生成器Generator:
本质:迭代器(所以自带了__iter__方法和__next__方法,不需要我们去实现)
特点:惰性运算,开发者自定义
#生成器函数
def func():
print('aaaa')
a = 1
yield a #返回第一个值
print('bbbb')
yield 12 #返回第二个值
ret = func() #拿到一个生成器
# print(ret) #<generator object func at 0x0000028AE2DA2EB8>
print(next(ret)) #取第一个值
print(next(ret)) #取第二个值
print(next(ret)) #取第三个值 会报错 因为没有第三个值
def make_cloth():
for i in range(2000000):
yield "第%s件衣服"%i
szq = make_cloth()
print(next(szq))
print(next(szq))
print(next(szq))
for i in range(50):
print(next(szq))
生成器函数
生成器的好处:不会一下子在内存中生成太多数据
其它应用:
import time
def tail(filename):
f = open(filename)
f.seek(0, 2) #从文件末尾算起
while True:
line = f.readline() # 读取文件中新的文本行
if not line:
time.sleep(0.1)
continue
yield line
tail_g = tail('tmp')
for line in tail_g:
print(line)
生成器监听文件输入的例子
def averager():
total = 0.0
count = 0
average = None
while True:
term = yield average
total += term
count += 1
average = total/count
g_avg = averager()
next(g_avg)
print(g_avg.send(10))
print(g_avg.send(30))
print(g_avg.send(5))
计算移动平均值简单
def init(func): #在调用被装饰生成器函数的时候首先用next激活生成器
def inner(*args,**kwargs):
g = func(*args,**kwargs)
next(g)