手记

Python代码阅读(第4篇):过滤掉列表中的唯一值

本篇阅读的代码实现了过滤掉列表中的唯一值的功能。

本篇阅读的代码片段来自于30-seconds-of-python

filter_unique

from collections import Counter

def filter_unique(lst):
  return [item for item, count in Counter(lst).items() if count > 1]

# EXAMPLES
filter_unique([1, 2, 2, 3, 4, 4, 5]) # [2, 4]

函数使用collections.Counter函数对列表进行计数,在通过列表推导式,将非唯一值过滤出去(过滤掉计数大于1的值)。

collections.Counter

class collections.Counter([iterable-or-mapping])

Counter是一个dict的子类,用于计数可哈希对象。它是一个集合,元素像字典键(key)一样存储,它们的计数存储为值。计数可以是任何整数值,包括0和负数。它可以接收一个可迭代对象,并对其元素进行计数。

其成员函数items()将返回一个字典的键值对的新视图。再结合collections.Counter,上述代码中Counter(lst).items()将一个列表转化成了(元素,计数)对。

列表推导式

列表推导式提供了一个更简单的创建列表的方法。常见的用法是把某种操作应用于序列或可迭代对象的每个元素上,然后使用其结果来创建列表,或者通过满足某些特定条件元素来创建子序列。

列表推导式的结构是由一对方括号所包含的以下内容:一个表达式,后面跟一个for子句,然后是零个或多个forif子句。 其结果将是一个新列表,由对表达式依据后面的forif子句的内容进行求值计算而得出。

上面filter_unique可以等价的写成:

from collections import Counter

def filter_unique(lst):
  temp_list = []
  for item, count in Counter(lst).items():
    if count > 1:
      temp_list.append(item)
  return temp_list

# EXAMPLES
filter_unique([1, 2, 2, 3, 4, 4, 5]) # [2, 4]

filter_non_unique

from collections import Counter

def filter_non_unique(lst):
  return [item for item, count in Counter(lst).items() if count == 1]

# EXAMPLES
filter_non_unique([1, 2, 2, 3, 4, 4, 5]) # [1, 3, 5]

filter_non_unique和上面的代码相似,功能是过滤掉列表中的非唯一值。

1人推荐
随时随地看视频
慕课网APP