Python中的迭代器漫谈

 更新时间:2015年02月03日 11:14:41   作者:Hito''s Blog  
这篇文章主要介绍了Python中的迭代器漫谈,本文主要讲解range函数和xrange函数性能区别,需要的朋友可以参考下

问题是在Python中进行循环的时候产生的,熟悉Python的都知道,它没有类似其它语言中的for循环, 只能通过for in的方式进行循环遍历。最典型的应用就是通过range函数产生一个列表,然后用for in进行操作,如下:

复制代码 代码如下:

#!/usr/bin/env python
for i in range(10):
    print i

代码的意义很好理解,range会产生一个列表,用for in最这个列表进行遍历,就有和类似for(i = 0;i<n;i++)同样的效果,range函数的详解可以看这里。问题又来了,range这个对象会产生一个列表,那么这个列表的内容铁定是存放在内存当中的,当需要的循环数量太大时,是相当占用内存的, 为了统计使用range占用内存的情况,我做了6次使用,分别用range产生100,10000,100000,1000000,10000000,100000000长度的列表,然后统计内存的占用:

复制代码 代码如下:

测试代码 占用内存
range(100) 2.0MB
range(10000) 2.2MB
range(100000) 3.8MB
range(1000000) 19.5MB
range(10000000) 168.5MB
range(100000000) 1465.8MB

可以看到,随着基数的加大,占用内存呈几何倍数增加,显然在进行大循环操作的时候,要避免使用range。

为了解决上述问题,python提供了另外一个函数xrange,这个函数和range非常相似,但是占用内存比range会小很多,相关的说明可以查看这里,经过测试,用xrange产生的对象,不管参数是多少,占用内存几乎都没有变化。问题又来了,xrange内部是如何实现的,为什么和range性能相差这么大?为了验证我的猜想,先尝试用python实现类似xrange的函数zrange:

复制代码 代码如下:

#!/usr/bin/env python
class zrange(object):
    def __init__(self,stop):
        self.__pointer=0
        self.stop=stop
    def __iter__(self): 
        return self 
    def next(self): #python3.0中,改用__next__
        if self.__pointer  >= self.stop:
            raise StopIteration
        else:
            self.__pointer = self.__pointer + 1
            return self.__pointer-1
test = zrange(10000000)
for i in test:
    print i

运行的结果和xrange一样, 对zrange进行内存占用测试,发现和xrange一样,参数的大小对内存占用几乎没有影响。那么它和range的区别在哪里呢?

前面说到,range产生的是一个列表,而无论是自定义的zrange还是系统内置的xrange产生的都是一个对象,像xrange或者zrange产生的对象,就叫做可迭代对象, 它给外部提供了一种遍历其内部元素,而不用关心其内部实现的方法。上面zrange的实现中, 最关键的实现是建立了一个内部指针__pointer, 它记录当前的访问的位置, 下次的访问就可以通过指针的状态进行相应的操作。

Python或者其它语言中,还有很多类似通过迭代的方式访问对象内容的,如读取一个文件中的内容:

复制代码 代码如下:

#!/usr/bin/env python
f = open('zrange.py','r')
while True:
    line = f.readline()
    if not line:
        break
    print line.strip()
f.close()

大家都知道用readline要比reandlines节省资源,其实readline和readlines就类似于xrange和range,一个是通过指针记录当前位置,下次访问把指针往前移动一个单位,另外一个是直接把所有内容存放到内存当中。文件操作函数中,还可以通过seek手动的调整指针的位置,从而达到跳过或者重复读取某些内容的目的。

可以说,迭代器的实现中,其内部指针是节省资源,让迭代正常运行的关键。

相关文章

  • Python预测分词的实现

    Python预测分词的实现

    本文将结合实例代码,介绍Python预测分词的实现,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-06-06
  • 深入理解python中实例方法的第一个参数self

    深入理解python中实例方法的第一个参数self

    在Python中,self 是类的实例方法的一个参数,代表类的实例对象本身,在本篇文章中,我们将深入探讨 self 的工作原理以及它在Python编程中的重要性,需要的可以参考下
    2023-09-09
  • 简单介绍Python中的decode()方法的使用

    简单介绍Python中的decode()方法的使用

    这篇文章主要介绍了简单介绍Python中的decode()方法的使用,是Python入门学习当中必须掌握的基础知识,需要的朋友可以参考下
    2015-05-05
  • Python进度条tqdm的用法详解

    Python进度条tqdm的用法详解

    这篇文章主要介绍了Python进度条tqdm的用法,这对于第三方库非常丰富的Python来说,想要实现这一功能并不是什么难事,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧
    2021-08-08
  • Python编程之gui程序实现简单文件浏览器代码

    Python编程之gui程序实现简单文件浏览器代码

    这篇文章主要介绍了Python编程之gui程序实现简单文件浏览器代码,具有一定借鉴价值,需要的朋友可以了解下。
    2017-12-12
  • Linux环境下GPU版本的pytorch安装

    Linux环境下GPU版本的pytorch安装

    使用默认的源地址下载速度很慢,所以一般都是使用国内源,今天花了点时间配置安装,所以记录一下,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • Python 私有函数的实例详解

    Python 私有函数的实例详解

    这篇文章主要介绍了Python 私有函数的实例详解的相关资料,希望通过本文大家能掌握Python 私有函数的使用方法,需要的朋友可以参考下
    2017-09-09
  • python flask安装和命令详解

    python flask安装和命令详解

    Flask是使用Python编写的Web微框架,这篇文章主要介绍了python flask安装和命令,需要的朋友可以参考下
    2019-04-04
  • 最炫Python烟花代码全解析

    最炫Python烟花代码全解析

    2022虎年新年即将来临,小编为大家带来了一个利用Python编写的虎年烟花特效,堪称全网最绚烂,文中的示例代码简洁易懂,感兴趣的同学可以动手试一试
    2022-02-02
  • 详解Django 中是否使用时区的区别

    详解Django 中是否使用时区的区别

    本篇文章主要介绍了详解Django 中是否使用时区的区别,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06

最新评论