如何用迭代器设计模式提升Python性能

发布时间：2021-10-20 16:48:40 来源：亿速云阅读：158 作者：iii 栏目：编程语言

本篇内容介绍了“如何用迭代器设计模式提升Python性能”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

简单案例

在开始介绍设计模式之前，我们先来看一个简单的需求。假设现在我们需要根据传入的变量获取每周的前几天，比如说我们传入3返回的就是[Mon, Tue, Wed]，我们传入5返回[Mon, Tue, Wed, Thu, Fri]。这个需求大家应该都能理解，非常非常简单。

如果用一个函数来实现的话，就是这样：

def return_days(n):     week = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']     return week[:n]

你看三行代码就实现了，在这个问题场景当中这样写当然是没有问题。但假如我们把题目稍微变一变，这里的week不是一个固定的数据，而是从上游或者是某个文件当中读取的。这里的n也是一个很大的数，我们把这个函数改写成这样：

def get_data(n):     data = []     for i in range(n):         data.append(get_from_upstream())     return data

我们假设get_from_upstream这个函数当中实现了获取数据的具体逻辑，那么上面这一段函数有一个什么问题？

有些同学会说这没有问题啊，因为像是其他语言实现数据获取的时候也都是这么干的。的确，像是Java等语言可能都是这么干的。但是其他语言这么干没错，不代表Python这么干也没错。因为我们 没有把Python的能力发挥到最大 。

这里有两个问题，第一个问题是延迟，因为前面说了，n是一个很大的数。我们从上游获取数据，无论是通过网络还是文件读取，本质上都是IO操作，IO操作的延迟是非常大的。那么我们把这n条数据全部搜集完可能需要很长的时间，导致下游的漫长等待。第二个问题就是内存，因为我们存储了这n条数据一起返回的，如果n很大，对于内存的开销压力也很大，如果机器内存不够很有可能导致崩溃。

那怎么解决呢？

其实解决的方法很简单，如果对迭代器熟悉的话，会发现迭代器针对的恰恰是这两个问题。我们把上面的逻辑改写成迭代器实现即可，这也就是iterator模式。

iterator模式

iterator模式严格说起来其实只是迭代器的一种应用，它非常巧妙地 将迭代器与匿名函数结合在一起 ，里面也没有太多的门道可以说，我们把刚才的代码改写一下，细节都在代码当中。

def get_data(n):     for i in range(n):   yield get_from_upstream()   data_10 = lambda: get_data(10) data_100 = lambda: get_data(100)  # use for d in data_10:     print(d)

很简单吧，但可能你要问了，我们既然写出了get_data这个迭代器，那么我们使用的时候直接for d in get_data(10)这样用不就好了，为什么中间要用匿名函数包一层呢？

道理也很简单，如果这个数据是我们自己使用，当然是没必要中间包一层的。但如果我们是传给下游使用的话，对于下游来说它肯定是不希望考虑上游太多的细节的，越简单越好。所以我们直接丢一个包装好的迭代器过去，下游直接call即可。否则的话，下游还需要感知get_data这个函数传入的参数，显然是不够合理的。

“如何用迭代器设计模式提升Python性能”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

向AI问一下细节

如何用迭代器设计模式提升Python性能

简单案例

iterator模式

猜你喜欢

最新资讯

相关推荐

相关标签