加载中...

1.3 保留最后N个元素


问题

在迭代操作或者其他操作的时候,怎样只保留最后有限几个元素的历史记录?

解决方案

保留有限历史记录正是 collections.deque 大显身手的时候。比如,下面的代码在多行上面做简单的文本匹配,并只返回在前N行中匹配成功的行:

  1. from collections import deque
  2. def search(lines, pattern, history=5):
  3. previous_lines = deque(maxlen=history)
  4. for li in lines:
  5. if pattern in li:
  6. yield li, previous_lines
  7. previous_lines.append(li)
  8. # Example use on a file
  9. if __name__ == '__main__':
  10. with open(r'../../cookbook/somefile.txt') as f:
  11. for line, prevlines in search(f, 'python', 5):
  12. for pline in prevlines:
  13. print(pline, end='')
  14. print(line, end='')
  15. print('-' * 20)

讨论

我们在写查询元素的代码时,通常会使用包含yield表达式的生成器函数,也就是我们上面示例代码中的那样。这样可以将搜索过程代码和使用搜索结果代码解耦。如果你还不清楚什么是生成器,请参看4.3节。

使用deque(maxlen=N)构造函数会新建一个固定大小的队列。当新的元素加入并且这个队列已满的时候,最老的元素会自动被移除掉。

代码示例:

  1. >>> q = deque(maxlen=3)
  2. >>> q.append(1)
  3. >>> q.append(2)
  4. >>> q.append(3)
  5. >>> q
  6. deque([1, 2, 3], maxlen=3)
  7. >>> q.append(4)
  8. >>> q
  9. deque([2, 3, 4], maxlen=3)
  10. >>> q.append(5)
  11. >>> q
  12. deque([3, 4, 5], maxlen=3)

尽管你也可以手动在一个列表上实现这一的操作(比如增加、删除等等)。但是这里的队列方案会更加优雅并且运行得更快些。

更一般的,deque类可以被用在任何你只需要一个简单队列数据结构的场合。如果你不设置最大队列大小,那么就会得到一个无限大小队列,你可以在队列的两端执行添加和弹出元素的操作。

代码示例:

  1. >>> q = deque()
  2. >>> q.append(1)
  3. >>> q.append(2)
  4. >>> q.append(3)
  5. >>> q
  6. deque([1, 2, 3])
  7. >>> q.appendleft(4)
  8. >>> q
  9. deque([4, 1, 2, 3])
  10. >>> q.pop()
  11. 3
  12. >>> q
  13. deque([4, 1, 2])
  14. >>> q.popleft()
  15. 4

在队列两端插入或删除元素时间复杂度都是O(1),而在列表的开头插入或删除元素的时间复杂度为O(N)。


还没有评论.