继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

Python中的序列操作

蝴蝶不菲
关注TA
已关注
手记 372
粉丝 81
获赞 381

官方手册:https://docs.python.org/3.7/library/stdtypes.html#sequence-types-list-tuple-range

序列简介

序列是指按照位置顺序来存储数据的数据结构,也就是说能通过数值索引进行操作。实际上,python对序列的解释是:只要类型对象中重载了__len__()__getitem__(),且它们的整数参数从0开始,就表示这个类型满足序列协议,是一个序列类型。

python有三种基本的序列类型:列表、元组和range对象。当然,还有特别定制的序列类型:str和binary data。

序列类型又分为可变序列和不可变序列。可变序列表示可以原处修改的序列,不可变序列意味着不允许原处修改。例如,列表是可变序列,字符串是不可变序列。

可变对象和不可变对象的含义,参见python可变对象和不可变对象的解释

序列的通用操作

下面这些操作是序列通用的,无论是可变、不可变序列。但通用并不意味着所有序列都支持这些操作,有些特殊的序列因为某些原因不支持某些操作也是合理的。

1.测试元素是否存在

x in Sx not in S,返回True或False。例如:

>>> 'a' in "abcd"True>>> 'aa' in "abcd"False>>> 'ab' in "abcd"True>>> 3 in [1,2,3,4]True

2.加法和乘法符号

S1 + S2S * NN * S,其中S1和S2是同一种序列类型,N表示序列的重复次数。

例如:

>>> [1,2] + [3,4][1, 2, 3, 4]>>> [1,2] * 3[1, 2, 1, 2, 1, 2]>>> 3 * [1, 2][1, 2, 1, 2, 1, 2]

注意,序列中保存的是元素的引用地址,所以对于序列中的可变元素,+ *时需要注意修改的影响范围:

>>> L = [1,2,3,4]>>> L1 = [['a'],['b']]>>> L0 = L + L1>>> L0[1, 2, 3, 4, ['a'], ['b']]>>> L1[0][0] = "aa">>> L0[1, 2, 3, 4, ['aa'], ['b']]

上面修改"a"为"aa"也会影响到+的结果L0,因为['a']是一个可变对象。同样对于*的重复操作,也是拷贝引用:

>>> L = []
>>> L1 = [L] * 3>>> L1[[], [], []]>>> L.append(3)
>>> L1[[3], [3], [3]]

3.len()、max()和min()函数

len()返回序列的元素个数,也就是序列的长度。min()和max()分别返回序列中最小、最大的元素。

>>> len(L), min(L), max(L)
(4, 'a', 'd')

4.找出元素在序列中出现的次数count()

>>> s="hello world">>> s.count("h"),s.count("o")
(1, 2)

5.索引取元素

S[i],i为从0开始的数值,可以取负数表示从尾部开始取。

例如:

>>> L
['a', 'b', 'c', 'd']>>> L[0]'a'>>> L[1]'b'>>> L[-1]'d'

负数的i等价于len(S)+i作为索引。例如,len(S) = 3, i = -1,表示取最后一个元素,也就是index=2的元素。

6.分片

分片操作用于从序列中取出子序列,它会创建新的内存块来保存取出来的序列对象

  • S[i:j]:从索引位i取到索引位j,不包括j

  • S[i:]:从索引位i开始取到最结尾

  • S[:j]:从最开头取到索引位j,不包括j

  • S[:]:从头取到尾,相当于拷贝了序列,但得到的是新序列

  • S[i:j:k]:k表示取元素时的步进间隔,默认为1,表示每个元素都取,如果为2,则表示取一个跳过一个

分片的区间是左闭右开的,所以不会包括j的索引位。i和j可以是负数,负数表示从尾部开始计算索引位。例如,-1表示最后一个元素,-2表示倒数第二个元素。

特别地,如果i = j,则表示找到序列中的这个位置,但因为切片长度位0,所以返回空。

例如:

>>> s = "hello world">>> len(s)11>>> s[0:6]'hello '>>> s[:6]'hello '>>> s[6:10]   # 不包括index=10'worl'>>> s[6:11]   # 所以用大于10的结束位'world'>>> s[6:]'world'>>> s[6:-1]'worl'>>> s[:]      # 拷贝序列得到副本'hello world'>>> s[::1]     # 步进为1,默认的'hello world'>>> s[::2]     # 每次跳过一个元素'hlowrd'>>> s[1:1]    # 找到index=1的位置''

7.找出第一个元素的位置index()

index(x,i,j)表示从序列中搜索元素x并返回第一次出现的x的位置,如果给定了i,则表示从索引位i开始搜索,给定了j则表示最多搜索到索引位为j的位置。

如果找不到元素,将报错。i和j可以是负数,但无论它们是正数还是负数,都是搜索的开始和结束位。

>>> s="hello world">>> s.index("o")4>>> s.index("o",1,-1)4>>> s.index("o",-5)    # 从倒数第5个元素开始搜索7>>> s.index("a")       # 搜索不到时报错Traceback (most recent call last):
  File "<stdin>", line 1, in <module>ValueError: substring not found

不可变序列的操作

相比可变序列,不可变序列的唯一操作是可以支持内置的hash()操作。可变序列无法hahs()。

1
2
3
4
5
6
7
8
9
10>>> hash("asd")
-2014632507>>> hash((1,23))1320437575>>> hash([1,23])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>TypeError: unhashable type: 'list'

能够hash的不可变序列,意味着能作为dict的key,能保存到set或frozenset中。

可变序列的操作

  1. s[i] = xs[i:j] = t将序列中的元素替换成x或可迭代对象t

  2. s[i:j:K] = t将序列中的元素替换成可迭代对象t,t的长度必须和s[i:j:k]的长度一样

  3. del s[i]del s[i:j]删除序列中的元素,等价于s[i] = []s[i:j] = []

  4. del s[i:j:k]删除序列中的某些元素,k为步进值

  5. s.remove(x):移除第一次出现的元素x

  6. s.clear()表示清空序列中的所有元素,等价于del s[:]

  7. s.pop([i])表示移除序列s中的第i个元素并返回这个元素,中括号表示可选,如果没有参数,默认移除最后一个元素

  8. s.append(x)向序列的尾部追加元素x,等价于s[len(s):len(s)] = [x]

  9. s.extend(t)s += t表示将t扩展到序列s的尾部,等价于s[len(s):len(s)] = t

  10. s.insert(i,x)表示将x插入到序列中的i索引位置处,等价于s[i:i] = [x]

  11. s *= n表示将序列n的元素重复n次追加到s的尾部

  12. s.copy()表示拷贝序列得到一个新的序列副本,等价于s[:]

  13. s.reverse()原地反转序列s,为了节约内存空间,所以是原地反转,不会返回反转后的序列

对于序列,还有一个内置函数reversed(SEQ)。与之对应的,还有一个内置函数sorted(),但它操作的对象是可迭代对象,并不一定总是序列。

示例1:序列元素赋值

>>> L = ['aa','bb','cc','dd','ee','ff']>>> L1 = [1,2,3,4]>>> L[0] = "a">>> L
['a', 'bb', 'cc', 'dd', 'ee', 'ff']>>> L[1:2] = L1>>> L
['a', 1, 2, 3, 4, 'cc', 'dd', 'ee', 'ff']>>> L[::2] = [1,2,3,4,5]>>> L
[1, 1, 2, 3, 3, 'cc', 4, 'ee', 5]

示例2:删除元素

删除相关操作有del、remove()、pop()、clear()。

例如:

>>> L = ['aa','bb','cc','dd','ee','ff']>>> del L[1]>>> L
['aa', 'cc', 'dd', 'ee', 'ff']>>> del L[1:2]>>> L
['aa', 'dd', 'ee', 'ff']>>> del L[::2]>>> L
['dd', 'ff']>>> L = ['aa','bb','cc','dd','ee','ff']>>> L.remove('aa')>>> L
['bb', 'cc', 'dd', 'ee', 'ff']>>> L.pop()'ff'>>> L
['bb', 'cc', 'dd', 'ee']>>> L.pop(2)'dd'>>> L
['bb', 'cc', 'ee']>>> L.clear()>>> L
[]

示例3:添加元素

相关操作有append()、extend()、insert()、s *= n

例如:

>>> L = ['aa', 'bb', 'cc', 'dd', 'ee']>>> L1 = [1,2,3,4]>>> L.append("ff")>>> L
['aa', 'bb', 'cc', 'dd', 'ee', 'ff']>>> L.insert(1,"a")>>> L
['aa', 'a', 'bb', 'cc', 'dd', 'ee', 'ff']>>> L.extend(L1)>>> L
['aa', 'a', 'bb', 'cc', 'dd', 'ee', 'ff', 1, 2, 3, 4]>>> L1 * 2[1, 2, 3, 4, 1, 2, 3, 4]

示例4:其它操作

拷贝序列copy()、反转序列reverse()。

>>> L = ['aa', 'bb', 'cc', 'dd', 'ee']>>> L1 = L.copy()>>> L1
['aa', 'bb', 'cc', 'dd', 'ee']>>> L.reverse()>>> L
['ee', 'dd', 'cc', 'bb', 'aa']

还有一个可用于序列的内置函数reversed(),它反转序列,并返回可迭代对象。所以,如果要将它展现出来,需要构建容器。例如:

>>> L = ['aa', 'bb', 'cc', 'dd', 'ee']>>> list(reversed(L))
['ee', 'dd', 'cc', 'bb', 'aa']>>> set(reversed(L))
{'aa', 'bb', 'ee', 'cc', 'dd'}

 

转载请注明出处:https://www.cnblogs.com/f-ck-need-u/p/10144798.html

 作者:骏马金龙




打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP