python中的迭代器有什么用

迭代器的核心作用是按需逐个访问数据,节省内存、提升效率,尤其适合处理大文件、数据库结果或无限序列;它通过惰性计算、统一接口和简化逻辑实现高效、安全、清晰的数据遍历。

迭代器的核心作用是按需逐个访问数据,节省内存、提升效率,尤其适合处理大文件、数据库结果或无限序列这类无法一次性加载到内存的数据。

节省内存,避免一次性加载全部数据

比如读取一个几GB的日志文件,如果用 readlines() 会把所有行塞进内存,容易崩溃;而用迭代器(如直接对文件对象 for line in f:)每次只读一行,内存占用几乎恒定。

  • 列表推导式 [x*2 for x in range(1000000)] 立刻生成百万个数,占内存
  • 生成器表达式 (x*2 for x in range(1000000)) 返回迭代器,只在需要时算一个值

统一遍历接口,适配多种数据源

Python 中 for 循环、sum()list() 等内置函数都依赖迭代器协议(__iter____next__)。只要对象实现了这个协议,就能被统一处理——不管它是列表、文件、自定义类,还是网络流。

  • dict 迭代的是键,values() 迭代的是值,都是迭代器
  • 你可以写一个类,只实现 __iter__,它就能放进 for 循环里

支持惰性计算和无限序列

迭代器不预先计算全部结果,只在调用 next() 时产出下一个值。这使得定义“理论上无限”的对象成为可能,比如斐波那契数列、时间戳流、随机数生成器。

  • itertools.count() 生成无限递增整数,但不会卡死
  • 配合 itertools.islice() 可以安全地取前 N 个,无需担心停不下来

简化代码逻辑,让意图更清晰

比起手动维护下标、判断边界、处理异常,用迭代器写循环更简洁可靠。Python 自动捕获 StopIteration 并退出循环,不用你操心越界问题。

  • 不用写 i = 0; while i
  • 直接 for item in iterator:,语义明确,不易出错

基本上就这些。迭代器不是炫技,而是 Python “按需计算”哲学的体现——不提前做没必要的事,也不多占一点内存。