手记

迭代器应用——itertools

itertools提供的各类迭代器扩展

1. 引用

import itertools
或者
from itertools import *

2. 迭代器

迭代器 实参 结果 示例
repeat() elem [, n] elem, elem, elem, … 重复无限次或n次 repeat(10, 3) --> 10 10 10
chain p, q, ... p0, p1, ... plast, q0, q1, ... chain('ABC', 'DEF') --> A B C D E F
chain.from_iterable() iterable p0, p1, ... plast, q0, q1, ... chain.from_iterable(['ABC', 'DEF']) --> A B C D E F
compress() data, selectors (d[0] if s[0]), (d[1] if s[1]), ... compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F
groupby() iterable[, key] 根据key(v)值分组的迭代器
filter pred, seq seqpred(x)为真值的元素,xseq中的元素。 filter(lambda x: x%2, range(10)) --> 1 3 5 7 9
filterfalse pred, seq seqpred(x)为假值的元素,xseq中的元素。 filterfalse(lambda x: x%2, range(10)) --> 0 2 4 6 8
islice seq, [start,] stop [, step] seq[start:stop:step]中的元素 islice('ABCDEFG', 2, None) --> C D E F G
permutations() p[, r] 长度r元组,所有可能的排列,无重复元素 permutations('ABCD', 2)
combinations() p, r 长度r元组,有序,无重复元素 combinations('ABCD', 2)
combinations_with_replacement() p, r 长度r元组,有序,元素可重复 combinations_with_replacement('ABCD', 2)

3. 具体说明

I. itertools.repeat(object[, times])

    创建一个迭代器,重复生成object,times(如果已提供)指定重复计数,如果未提供times,将无止尽返回该对象。

from itertools import *

for i in repeat('test', 5):
    print(i)

-----------------------------
test
test
test
test
test

II. itertools.chain(*iterables)

    将多个迭代器作为参数, 但只返回单个迭代器, 返回他们中的每个单一元素

from itertools import *

for i in chain([1, 2, 3], ['a', 'b', 'c']):
    print i
----------------------------------
1
2
3
a
b
c

III. chain.from_iterable(*iterables)

    构建类似 chain() 迭代器的另一个选择。不同的是这里可以以整体形式传入参数(列表或其他可迭代对象)

print([data for data in chain.from_iterable(['ABC', 'DEF'])])
------------------------
['A', 'B', 'C', 'D', 'E', 'F']

IV. itertools.compress(data, selectors)

    提供一个选择列表,对原始数据进行筛选,根据后面的0或者1判断TrueFalse

print([data for data in compress('ABCDEF', [1, 0, 1, 0, 1, 1])])
-------------------------------
['A', 'C', 'E', 'F']

V. itertools.groupby(iterable[, key])

返回一个产生按照key进行分组后的值集合的迭代器.

  • 按照keyfunc函数对序列每个元素执行后的结果分组(每个分组是一个迭代器), 返回这些分组的迭代器

from itertools import groupby
qs = [{'date' : 1},{'date' : 2}]
[(name, list(group)) for name, group in itertools.groupby(qs, lambda p:p['date'])]

Out[77]: [(1, [{'date': 1}]), (2, [{'date': 2}])]


>>> from itertools import *
>>> a = ['aa', 'ab', 'abc', 'bcd', 'abcde']
>>> for i, k in groupby(a, len):
...     print i, list(k)
...
2 ['aa', 'ab']
3 ['abc', 'bcd']
5 ['abcde']

VI. itertools.filter(predicate, iterable)

    返回只包括当测试函数返回true时的项.创建一个迭代器,仅生成iterablepredicate(item)True的项,如果predicateNone,将返回iterable中所有计算为True的项

对函数func执行返回真的元素的迭代器

from itertools import *

    for i in filter(lambda x: x < 1, [-1, 0, 1, 2, 3, 4, 1, -2]):
        print('Yielding:', i)
--------------------------------
Yielding: -1
Yielding: 0
Yielding: -2

VII. itertools.filterfalse(predicate, iterable)

    和ifilter(函数相反 , 返回一个包含那些测试函数返回false的项的迭代器)
,创建一个迭代器,仅生成iterablepredicate(item)False的项,如果predicate为None,则返回iterable中所有计算为False的项 对函数func执行返回假的元素的迭代器

from itertools import *

    for i in filterfalse(lambda x: x < 1, [-1, 0, 1, 2, 3, 4, 1, -2]):
        print('Yielding:', i)
-----------------------------------------
    for i in filterfalse(lambda x: x < 1, [-1, 0, 1, 2, 3, 4, 1, -2]):
        print('Yielding:', i)

VIII. itertools.islice(iterable, start, stop[, step])

    根据索引对迭代器切片,terable[start : stop : step],将跳过前start个项,迭代在stop所指定的位置停止,step指定用于跳过项的步幅。 与切片不同,负值不会用于任何startstopstep, 如果省略了start,迭代将从0开始,如果省略了step,步幅将采用1.

  • 返回序列seq的从start开始到stop结束的步长为step的元素的迭代器
from itertools import *

print 'Stop at 5:'
for i in islice(count(), 5):
    print i

print 'Start at 5, Stop at 10:'
for i in islice(count(), 5, 10):
    print i

print 'By tens to 100:'
for i in islice(count(), 0, 100, 10):
    print i

Stop at 5:
0
1
2
3
4
Start at 5, Stop at 10:
5
6
7
8
9
By tens to 100:
0
10
20
30
40
50
60
70
80
90

IX. itertools.permutations(iterable[, r])

    创建一个迭代器,返回iterable中所有长度为r的项目序列,如果省略了r,那么序列的长度与iterable中的项目数量相同

  • 返回以r为长度的所有随机组合的排列
 print([data for data in permutations('ABCD', 2)])
---------------------------------------------------
[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'A'), ('B', 'C'), ('B', 'D'), ('C', 'A'), ('C', 'B'), ('C', 'D'), ('D', 'A'), ('D', 'B'), ('D', 'C')]

X. itertools.combinations(iterable, r)

    创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序 (不带重复)

print([data for data in combinations('ABCD', 2)])
------------------------------------------------
[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]

XI. itertools.combinations_with_replacement(iterable, r)

    创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序 (带重复)

print([data for data in combinations_with_replacement('ABCD', 2)])
---------------------------------------------
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'B'), ('B', 'C'), ('B', 'D'), ('C', 'C'), ('C', 'D'), ('D', 'D')]

  • itertools中实现了很多有用的迭代器,像这里所展示的都是比较实用的,避免自己重新实现复杂的代码
  • 更多内容参考文档
1人推荐
随时随地看视频
慕课网APP