Python中Iterator迭代器的使用杂谈
2016-06-20 00:00
956 查看
迭代器是一种支持next()操作的对象。它包含一组元素,当执行next()操作时,返回其中一个元素;当所有元素都被返回后,生成一个StopIteration异常。
ite()可以接受多种Python对象为参数,比如list,tuple, dict, set等,并将其转化为迭代器。迭代器可以用于for语句或in语句中。很多常用操作也是支持迭代器的,比如sum(), max()等。
毋庸置疑,迭代器有很多好处:
1.“流式”数据处理方式减少内存消耗:
比如处理文件,一下猛地把全部数据全部取出来放到内存里面进行处理会导致程序消耗大量内存,有时甚至没法做到,一般我们会一部分一部分的对文件内容进行处理:
2.或者对xml文件进行处理的时候:
内置函数open返回的file对象和etree.iterparse序列化的xml tree都是可迭代对象,能够让我们渐进式地对文件的内容进行处理。
3.支持方便用for语句对数据进行消费:
python内置的一些常见的像类型像数组、列表甚至字符串等都是可迭代类型,这样我们就能方便for语句这个语法糖方便对数据进行消费,不需要自己记录索引位置,人肉循环:
简单了解了一下迭代器的好处后,我们正正经经的聊聊python的迭代器模式。
在这里我们引入两个比较绕口的名词:可迭代对象和迭代器对象,个人觉得从这两个概念下手会对迭代器有比较好的理解。在放例子前先对这两个概念给一个不入流的解释:
可迭代对象:对象里面包含__iter()__方法的实现,对象的iter函数经调用之后会返回一个迭代器,里面包含具体数据获取的实现。
迭代器:包含有next方法的实现,在正确范围内返回期待的数据以及超出范围后能够抛出StopIteration的错误停止迭代。
放个例子边看边说:
例子中的iterable_range是一个可迭代对象,所以我们也能够对它用for语句来进行迭代:
输出:
大家可以仔细地看一下输出的日志:
数据确实是“流式”处理的
iterator是真正在背后做事的人
for语句能够非常方便的迭代对象的数据。
可迭代对象其实更像是整个迭代器模式模式的上层,像一种约束一种契约一种规范,它能够保证自己能够返回一个在实际工作中干活的迭代器对象。for、sum等接受一个可迭代对象的方法都是遵循这样的规范:调用对象的__iter__函数,返回迭代器,对迭代器对象返回的每个值进行处理抑或需要一些汇总的操作。拿for举个例子:
for这个语法糖背后的逻辑差不多就是上面例子中代码所示的那样:首先获取可迭代对象返回的迭代器对象,然后调用迭代器对象的next方法获取每个值,在获取值的过程中随时检测边界-也就是检查是否抛出了StopIteration这样的错误,如果迭代器对象抛出错误则迭代停止(note:从这个例子可以看出,对于那些接受可迭代对象的方法,如果我们传一个单纯的迭代器对象其实也是无法工作的,可能会报出类似于TypeError: iteration over non-sequence的错误)。
当然了,一般在应用过程中我们不会将他们特意的分开,我们能够稍微对迭代器对象进行修改一下,添加__iter__方法的实现,这样对象本身就既是可迭代对象也是一个迭代器对象了:
输出:
python中迭代器(iterator)用法实例分析
深入讲解Python中的迭代器和生成器
python迭代器的使用方法实例
python迭代器实例简析
Python中的迭代器漫谈
Python迭代器和生成器介绍
详解Python的迭代器、生成器以及相关的itertools包
Python的迭代器和生成器使用实例
Python函数式编程指南(三):迭代器详解
python迭代器与生成器详解
举例讲解Python中的迭代器、生成器与列表解析用法
详解Python迭代和迭代器
>>>a=[1,2,3] >>>ia=iter(a) >>>next(ia) 1 >>>next(ia) 2 >>>next(ia) 3 >>>next(ia) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
ite()可以接受多种Python对象为参数,比如list,tuple, dict, set等,并将其转化为迭代器。迭代器可以用于for语句或in语句中。很多常用操作也是支持迭代器的,比如sum(), max()等。
>>> b=[4,5,6] >>> ib=iter(b) >>> for x in ib: ... print(x) ... 4 5 6 >>> ic=iter(b) >>> sum(ic) 15 >>> id=iter(b) >>> max(ic) 6
毋庸置疑,迭代器有很多好处:
1.“流式”数据处理方式减少内存消耗:
比如处理文件,一下猛地把全部数据全部取出来放到内存里面进行处理会导致程序消耗大量内存,有时甚至没法做到,一般我们会一部分一部分的对文件内容进行处理:
for text_line in open("xx.txt"): print text_line
2.或者对xml文件进行处理的时候:
tree = etree.iterparse(xml, ['start', 'end']) for event, elem in tree: if event == "end" result = etree.tostring(elem) elem.clear() print result
内置函数open返回的file对象和etree.iterparse序列化的xml tree都是可迭代对象,能够让我们渐进式地对文件的内容进行处理。
3.支持方便用for语句对数据进行消费:
python内置的一些常见的像类型像数组、列表甚至字符串等都是可迭代类型,这样我们就能方便for语句这个语法糖方便对数据进行消费,不需要自己记录索引位置,人肉循环:
for i in [1, 2, 3, 4] print i,
简单了解了一下迭代器的好处后,我们正正经经的聊聊python的迭代器模式。
在这里我们引入两个比较绕口的名词:可迭代对象和迭代器对象,个人觉得从这两个概念下手会对迭代器有比较好的理解。在放例子前先对这两个概念给一个不入流的解释:
可迭代对象:对象里面包含__iter()__方法的实现,对象的iter函数经调用之后会返回一个迭代器,里面包含具体数据获取的实现。
迭代器:包含有next方法的实现,在正确范围内返回期待的数据以及超出范围后能够抛出StopIteration的错误停止迭代。
放个例子边看边说:
class iterable_range: def __init__(self, n): self.n = n def __iter__(self): return my_range_iterator(self.n) class my_range_iterator: def __init__(self, n): self.i = 0 self.n = n def next(self): if self.i < self.n: i = self.i self.i += 1 print 'iterator get number:', i return i else: raise StopIteration()
例子中的iterable_range是一个可迭代对象,所以我们也能够对它用for语句来进行迭代:
temp = my_range(10) for item in temp: print item,
输出:
my iterator get number: 0 0 my iterator get number: 1 1 my iterator get number: 2 2 my iterator get number: 3 3 my iterator get number: 4 4 my iterator get number: 5 5 my iterator get number: 6 6 my iterator get number: 7 7 my iterator get number: 8 8 my iterator get number: 9 9
大家可以仔细地看一下输出的日志:
数据确实是“流式”处理的
iterator是真正在背后做事的人
for语句能够非常方便的迭代对象的数据。
可迭代对象其实更像是整个迭代器模式模式的上层,像一种约束一种契约一种规范,它能够保证自己能够返回一个在实际工作中干活的迭代器对象。for、sum等接受一个可迭代对象的方法都是遵循这样的规范:调用对象的__iter__函数,返回迭代器,对迭代器对象返回的每个值进行处理抑或需要一些汇总的操作。拿for举个例子:
iterator_object = iterable_object.__iter__() while True: try: value = iterator_object.next() except StopIteration: # StopIteration exception is raised after last element break # loop code print value
for这个语法糖背后的逻辑差不多就是上面例子中代码所示的那样:首先获取可迭代对象返回的迭代器对象,然后调用迭代器对象的next方法获取每个值,在获取值的过程中随时检测边界-也就是检查是否抛出了StopIteration这样的错误,如果迭代器对象抛出错误则迭代停止(note:从这个例子可以看出,对于那些接受可迭代对象的方法,如果我们传一个单纯的迭代器对象其实也是无法工作的,可能会报出类似于TypeError: iteration over non-sequence的错误)。
当然了,一般在应用过程中我们不会将他们特意的分开,我们能够稍微对迭代器对象进行修改一下,添加__iter__方法的实现,这样对象本身就既是可迭代对象也是一个迭代器对象了:
class my_range_iterator: def __init__(self, n): self.i = 0 self.n = n def __iter__(self): return self def next(self): if self.i < self.n: i = self.i self.i += 1 print 'my iterator get number:', i return i else: raise StopIteration() for item in my_range_iterator(10): print item
输出:
my iterator get number: 0 0 my iterator get number: 1 1 my iterator get number: 2 2 my iterator get number: 3 3 my iterator get number: 4 4 my iterator get number: 5 5 my iterator get number: 6 6 my iterator get number: 7 7 my iterator get number: 8 8 my iterator get number: 9 9
您可能感兴趣的文章:
python的迭代器与生成器实例详解python中迭代器(iterator)用法实例分析
深入讲解Python中的迭代器和生成器
python迭代器的使用方法实例
python迭代器实例简析
Python中的迭代器漫谈
Python迭代器和生成器介绍
详解Python的迭代器、生成器以及相关的itertools包
Python的迭代器和生成器使用实例
Python函数式编程指南(三):迭代器详解
python迭代器与生成器详解
举例讲解Python中的迭代器、生成器与列表解析用法
详解Python迭代和迭代器
相关文章推荐
- Python动态类型的学习---引用的理解
- Python3写爬虫(四)多线程实现数据爬取
- 垃圾邮件过滤器 python简单实现
- 下载并遍历 names.txt 文件,输出长度最长的回文人名。
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- Python中zip()函数用法举例
- Python中map()函数浅析
- 设计模式之行为型模式 - 调用行为的传递问题
- Python将excel导入到mysql中
- Python在CAM软件Genesis2000中的应用
- 使用Shiboken为C++和Qt库创建Python绑定
- FREEBASIC 编译可被python调用的dll函数示例