一、Python变量和数据类型
1.1、数据类型
1.1.1 整数
Python可以处理任意大小的整数,当然包括负整数,在Python程序中,整数的表示方法和数学上的写法一模一样,例如:1,100,-8080,0,等等。
计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制用0x前缀和0-9,a-f表示,例如:0xff00,0xa5b4c3d2,等等。
1.1.2 浮点数
浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,比如,1.23x10^9和12.3x10^8是相等的。浮点数可以用数学写法,如1.23,3.14,-9.01,等等。但是对于很大或很小的浮点数,就必须用科学计数法表示,把10用e替代,1.23x10^9就是1.23e9,或者12.3e8,0.000012可以写成1.2e-5,等等。
整数和浮点数在计算机内部存储的方式是不同的,整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差。
1.1.3 字符串
字符串是以 '' 或 "" 括起来的任意文本,比如'abc',"xyz"等等。请注意,”或”“本身只是一种表示方式,不是字符串的一部分,因此,字符串’abc’只有a,b,c这3个字符。
1.1.4 布尔值
布尔值和布尔代数的表示完全一致,一个布尔值只有True、False两种值,要么是True,要么是False,在Python中,可以直接用True、False表示布尔值(请注意大小写),也可以通过布尔运算计算出来。
布尔值可以用and、or和not运算。
and 运算是与运算,只有所有都为 True,and运算结果才是 True。
or 运算是或运算,只要其中有一个为 True,or 运算结果就是 True。
not 运算是非运算,它是一个单目运算符,把 True 变成 False,False 变成 True。
1.1.5 空值
空值是Python里一个特殊的值,用None表示。None不能理解为0,因为0是有意义的,而None是一个特殊的空值。
此外,Python还提供了列表、字典等多种数据类型,还允许创建自定义数据类型
1.2、print语句
字符串与字符串:
- 加号 + :依次打印每个字符串
- 逗号 , :依次打印每个字符串,遇到逗号“,”会输出一个空格
字符串和整数、浮点数:
- 逗号 , :依次打印每个字符串,遇到逗号“,”会输出一个空格
注:字符串和整数、浮点数连接不能直接用加号 +,转换为str后才行
1.3、注释
Python的注释以 # 开头,后面的文字直到行尾都算注释
1.4、变量
Python是动态语言,其变量本身类型不固定
a = 123 # a是整数
print a
a = 'imooc' # a变为字符串
print a
1
2
3
4
1.5、字符串
1.5.1 特殊字符转义
字符串本身包含 ' 可以用" "括起来表示
同理,字符串包含 ",我们就可以用' '括起来表示:
对字符串的某些特殊字符进行“转义”,Python字符串用 \ 进行转义。
常用的转义字符:
\' 表示单引号'
\" 表示双引号"
\n 表示换行
\t 表示一个制表符
\\ 表示 \ 字符本身
1
2
3
4
5
1.5.2 raw字符串与多行字符串
在字符串前面加个前缀 r ,表示这是一个 raw 字符串,里面的字符就不需要转义了
但是r'...'表示法不能表示多行字符串,也不能表示包含 ' 和 " 的字符串
表示多行字符串,可以用'''...'''或"""..."""表示:
'''Line 1
Line 2
Line 3'''
1
2
3
多行的换行会被输出,以上等价于:
'Line 1\nLine 2\nLine 3'
1
还可以在多行字符串前面添加 r ,把这个多行字符串也变成一个raw字符串:
r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''
1
2
3
1.5.3 Unicode字符串
Python在后来添加了对Unicode的支持,以Unicode表示的字符串用 u'...' 表示,比如:
print u'基础' #输出内容为:基础
1
注意: 不加 u ,中文就不能正常显示。
如果中文字符串在Python环境下遇到 UnicodeDecodeError,这是因为.py文件保存的格式有问题。可以在第一行添加注释
# -*- coding: utf-8 -*-
1
1.6、布尔类型
因为Python把0、空字符串”和None看成* False*,其他数值和非空字符串都看成 True,所以:
print True and 'a=T' #计算结果是 'a=T'
print 'a=T' or 'a=F' #计算结果还是 'a=T'
1
2
and 和 or 运算的一条重要法则:短路计算。
二、List和Tuple
列表:list:有序的集合,可以随时添加和删除其中的元素。
l = ['Michael', 'Bob', 'Tracy']
1
元组:tuple:有序的列表,一旦创建完毕,就不能修改了。
t = ('Adam', 'Lisa', 'Bart')
1
2.1、list
2.1.1 创建list
l = ['Michael', 'Bob', 'Tracy',100,True]
1
在list中可以包含各种数据
2.1.2 访问list
按照索引访问list
L = ['Adam', 'Lisa', 'Bart']
print L[0] #索引从 0 开始
1
2
倒序访问list
L = ['Adam', 'Lisa', 'Bart']
print L[-1] # -1 这个索引来表示最后一个元素
1
2
2.1.3 添加list元素
append() 把新的元素添加到 list 的尾部
L = ['Adam', 'Lisa', 'Bart']
L.append('Paul')
print L
# 结果:['Adam', 'Lisa', 'Bart', 'Paul']
1
2
3
4
insert()方法,它接受两个参数,第一个参数是索引号,第二个参数是待添加的新元素
L = ['Adam', 'Lisa', 'Bart']
L.insert(0, 'Paul') #索引从0开始
print L
# 结果:['Paul', 'Adam', 'Lisa', 'Bart']
1
2
3
4
2.1.4 删除list元素
使用 pop() 方法(有一个可选参数)
- pop()不带参数,默认删掉list的最后一个元素,并返回这个元素
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> L.pop()
'Paul'
>>> print L
['Adam', 'Lisa', 'Bart']
1
2
3
4
5
pop(n)带参数索引n,删掉list索引为n的元素,并返回这个元素
>>> L = ['Adam', 'Lisa', 'Paul', 'Bart']
>>> L.pop(2)
'Paul'
>>> print L
['Adam', 'Lisa', 'Bart']
1
2
3
4
5
2.1.5 替换list元素
L = ['Adam', 'Lisa', 'Bart']
>>> L[2] = 'Paul'
>>> print L
L = ['Adam', 'Lisa', 'Paul']
>>> L[-1] = 'Paul2'
>>> print L
L = ['Adam', 'Lisa', 'Paul2']
1
2
3
4
5
6
7
2.2、tuple
2.2.1 创建tuple
t = ('Adam', 'Lisa', 'Bart')
1
创建单元素tuple
包含 0 个元素的 tuple,也就是空tuple,直接用 ()表示:
>>> t = ()
>>> print t
()
1
2
3
创建包含 1 个元素的 tuple
>>> t = (1)
>>> print t
1 # t 不是 tuple ,而是整数1
1
2
3
用()定义单元素的tuple有歧义,所以 Python 规定,单元素 tuple 要多加一个逗号“,”,这样就避免了歧义:
>>> t = (1,)
>>> print t
(1,)
1
2
3
2.2.2 创建”可变”tuple
定义了tuple:
t = ('a', 'b', ['A', 'B'])
L = t[2]
>>> L[0] = 'X'
>>> L[1] = 'Y'
>> print t
('a', 'b', ['X', 'Y'])
1
2
3
4
5
6
由于 t 包含一个list元素,导致tuple的内容是可变的
三、条件判断与循环
3.1 if 语句
3.1.1 if
格式:注意条件后不能少了符号 :
if 条件:
语句
### 语句前有四个空格缩进
age = 20
if age >= 18:
print 'your age is', age
print 'adult'
print 'END'
1
2
3
4
5
6
7
8
3.1.1 if-else
注意 else 后不能少了符号 :
if age >= 18:
print 'adult'
else:
print 'teenager'
1
2
3
4
3.1.1 if-elif-else
if age >= 18:
print 'adult'
elif age >= 6:
print 'teenager'
elif age >= 3:
print 'kid'
else:
print 'baby'
1
2
3
4
5
6
7
8
特别注意: 这一系列条件判断会从上到下依次判断,如果某个判断为 True,执行完对应的代码块,后面的条件判断就直接忽略,不再执行了。故有很多区间的时候需要按照顺序从上往下划分。
3.2 for 语句
L = ['Adam', 'Lisa', 'Bart']
for name in L:
print name
1
2
3
3.3 while 语句
N = 10
x = 0
while x < N:
print x
x = x + 1
1
2
3
4
5
3.4 break 语句
用 for 循环或者 while 循环时,如果要在循环体内直接退出循环,可以使用 break 语句。
sum = 0
x = 1
while True:
sum = sum + x
x = x + 1
if x > 100:
break
print sum
1
2
3
4
5
6
7
8
3.5 continue 语句
在循环过程中,可以用continue跳过后续循环代码,继续下一次循环。
L = [75, 98, 59, 81, 66, 43, 69, 85]
sum = 0.0
n = 0
for x in L:
if x < 60:
continue
sum = sum + x
n = n + 1
print sum / n
1
2
3
4
5
6
7
8
9
3.6 多重循环
for x in ['A', 'B', 'C']:
for y in ['1', '2', '3']:
print x + y
1
2
3
输出结果:
A1
A2
A3
B1
B2
B3
C1
C2
C3
四、Dict和Set
4.1 Dict
4.1.1 什么是dict
dict通过 key 来查找 value
花括号 {} 表示这是一个dict,然后按照 key: value, 写出来即可。最后一个 key: value 的逗号可以省略。
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
1
2
3
4
5
由于dict也是集合,len() 函数可以计算任意集合的大小:len(d)
4.1.2 访问dict
使用 d[key] 的形式来查找对应的 value
key 存在,dict就返回对应的value。如果key不存在,会直接报错:KeyError。
要避免 KeyError 发生,有两个办法:
- 先判断一下 key 是否存在,用 in 操作符:
if 'Paul' in d:
print d['Paul']
1
2
二是使用dict本身提供的一个 get 方法,在Key不存在的时候,返回None:
>>> print d.get('Bart')
59
>>> print d.get('Paul')
None
1
2
3
4
4.1.3 dict的特点
dict的第一个特点是查找速度快,无论dict有10个元素还是10万个元素,查找速度都一样。dict的查找速度快不是没有代价的,dict的缺点是占用内存大,还会浪费很多内存
dict的第二个特点就是存储的key-value序对是没有顺序的!
dict的第三个特点是作为 key 的元素必须不可变
4.1.4 更新dict
添加新的 key-value。比如已有dict:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
d['Paul'] = 72
# 若key 已经存在,则赋值会用新的 value 替换掉原来的 value:
1
2
3
4
5
6
7
4.1.5 遍历dict
直接使用for循环可以遍历 dict 的 key:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> for key in d:
... print key
...
Lisa
Adam
Bart
1
2
3
4
5
6
7
4.2 Set
4.2.1 什么是set
set 持有一系列元素,这一点和 list 很像,但是set的元素没有重复,而且是无序的,这点和 dict 的 key很像。
创建 set 的方式是调用 set() 并传入一个 list,list的元素将作为set的元素:
>>> s = set(['A', 'B', 'C'])
# 可以查看 set 的内容:
>>> print s
set(['A', 'C', 'B'])
1
2
3
4
4.2.2 访问set
访问 set中的某个元素实际上就是判断一个元素是否在set中,使用in操作符
s = set(['Adam', 'Lisa', 'Bart', 'Paul'])
>>> 'Bart' in s
True
>>> 'Bill' in s
False
1
2
3
4
5
4.2.3 set的特点
set的内部结构和dict很像,唯一区别是不存储value,因此,判断一个元素是否在set中速度很快。
set存储的元素和dict的key类似,必须是不变对象,因此,任何可变对象是不能放入set中的。
最后,set存储的元素也是没有顺序的。
4.2.4 遍历set
直接使用 for 循环可以遍历 set 的元素:
>>> s = set(['Adam', 'Lisa', 'Bart'])
>>> for name in s:
... print name
...
Lisa
Adam
Bart
1
2
3
4
5
6
7
4.2.5 更新set
由于set存储的是一组不重复的无序元素,因此,更新set主要做两件事:
一是把新的元素添加到set中,二是把已有元素从set中删除。
- 添加元素时,用set的add()方法:
>>> s = set([1, 2, 3])
>>> s.add(4)
>>> print s
set([1, 2, 3, 4])
#如果添加的元素已经存在于set中,add()不会报错,但是不会加进去.
1
2
3
4
5
删除set中的元素时,用set的remove()方法
>>> s = set([1, 2, 3, 4])
>>> s.remove(4)
>>> print s
set([1, 2, 3])
#如果删除的元素不存在set中,remove()会报错,所以remove()前需要判断
>>> s = set([1, 2, 3])
>>> s.remove(4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 4
1
2
3
4
5
6
7
8
9
10
五、函数
5.1、什么是函数
函数就是最基本的一种代码抽象的方式。
5.2、调用函数
要调用一个函数,需要知道函数的名称和参数
5.3、编写函数
定义一个函数要使用 def 语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用 return 语句返回。
def my_abs(x):
if x >= 0:
return x
else:
return -x
1
2
3
4
5
5.4、返回多值
import math
def move(x, y, step, angle):
nx = x + step * math.cos(angle)
ny = y - step * math.sin(angle)
return nx, ny
>>> x, y = move(100, 100, 60, math.pi / 6)
>>> print x, y
151.961524227 70.0
# 其实这只是一种假象,Python函数返回的仍然是单一值:
>>> r = move(100, 100, 60, math.pi / 6)
>>> print r
(151.96152422706632, 70.0)
1
2
3
4
5
6
7
8
9
10
11
12
13
5.5、递归函数
在函数内部,可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。
举个例子,我们来计算阶乘 n! = 1 * 2 * 3 * … * n,用函数 fact(n)表示,
fact(n) = n! = 1 * 2 * 3 * ... * (n-1) * n = (n-1)! * n = fact(n-1) * n
1
于是,fact(n)用递归的方式写出来就是:
def fact(n):
if n==1:
return 1
return n * fact(n - 1)
>>> fact(1)
1
>>> fact(5)
120
1
2
3
4
5
6
7
8
9
如果我们计算fact(5),可以根据函数定义看到计算过程如下:
===> fact(5)
===> 5 * fact(4)
===> 5 * (4 * fact(3))
===> 5 * (4 * (3 * fact(2)))
===> 5 * (4 * (3 * (2 * fact(1))))
===> 5 * (4 * (3 * (2 * 1)))
===> 5 * (4 * (3 * 2))
===> 5 * (4 * 6)
===> 5 * 24
===> 120
1
2
3
4
5
6
7
8
9
10
汉诺塔 的移动也可以看做是递归函数。
我们对柱子编号为a, b, c,将所有圆盘从a移到c可以描述为:
- 如果a只有一个圆盘,可以直接移动到c;
- 如果a有N个圆盘,可以看成a有1个圆盘(底盘) + (N-1)个圆盘,首先需要把 (N-1) 个圆盘移动到 b,然后,将 a的最后一个圆盘移动到c,再将b的(N-1)个圆盘移动到c。
请编写一个函数,给定输入 n, a, b, c,打印出移动的步骤:
move(n, a, b, c)
例如,输入 move(2, ‘A’, ‘B’, ‘C’),打印出:
A –> B
A –> C
B –> C
def move(n, a, b, c):
if n ==1:
print a, '-->', c
return
move(n-1, a, c, b)
move(1, a, b, c) # 或 print a, '-->', c
move(n-1, b, a, c)
move(4, 'A', 'B', 'C')
1
2
3
4
5
6
7
8
5.6、定义默认参数
函数的默认参数的作用是简化调用
def power(x, n=2):
s = 1
while n > 0:
n = n - 1
s = s * x
return s
>>> power(5)
25
1
2
3
4
5
6
7
8
默认参数只能定义在必需参数的后面:
# OK:
def fn1(a, b=1, c=2):
pass
# Error:
def fn2(a=1, b):
pass
1
2
3
4
5
6
5.7、定义可变参数
如果想让一个函数能接受任意个参数,我们就可以定义一个可变参数:
def fn(*args):
print args
#在函数内部,直接把变量 args 看成一个 tuple 就好了
1
2
3
六、切片
6.1、对list进行切片
取一个list的部分元素是非常常见的操作:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
1
取前3个元素,用一行代码就可以完成切片:
>>> L[0:3]
['Adam', 'Lisa', 'Bart']
1
2
L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。即索引0,1,2,正好是3个元素。
如果第一个索引是0,还可以省略:
>>> L[:3]
['Adam', 'Lisa', 'Bart']
1
2
只用一个 : ,表示从头到尾:
>>> L[:]
['Adam', 'Lisa', 'Bart', 'Paul']
1
2
切片操作还可以指定第三个参数:
>>> L[::2]
['Adam', 'Bart']
1
2
第三个参数表示每N个取一个,上面的 L[::2] 会每两个元素取出一个来,也就是隔一个取一个。
把list换成tuple,切片操作完全相同,只是切片的结果也变成了tuple。
6.2、倒序切片
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> L[-2:]
['Bart', 'Paul']
>>> L[:-2]
['Adam', 'Lisa']
>>> L[-3:-1]
['Lisa', 'Bart']
>>> L[-4:-1:2]
['Adam', 'Bart']
1
2
3
4
5
6
7
8
9
10
11
12
13
记住倒数第一个元素的索引是-1。倒序切片包含起始索引,不包含结束索引。
6.3、对字符串切片
字符串 ‘xxx’和 Unicode字符串 u’xxx’也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:
>>> 'ABCDEFG'[:3]
'ABC'
>>> 'ABCDEFG'[-3:]
'EFG'
>>> 'ABCDEFG'[::2]
'ACEG'
1
2
3
4
5
6
七、迭代
7.1、什么是迭代
在Python中,如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们成为迭代(Iteration)。
Python 的 for循环不仅可以用在list或tuple上,还可以作用在其他任何可迭代对象上。
注意: 集合是指包含一组元素的数据结构,我们已经介绍的包括:
1. 有序集合:list,tuple,str和unicode;
2. 无序集合:set
3. 无序集合并且具有 key-value 对:dict
1
2
3
4
7.2、索引迭代
Python中,迭代永远是取出元素本身,而非元素的索引。
有的时候,我们确实想在 for 循环中拿到索引,怎么办?
方法是使用 enumerate() 函数:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> for index, name in enumerate(L):
... print index, '-', name
...
0 - Adam
1 - Lisa
2 - Bart
3 - Paul
1
2
3
4
5
6
7
8
7.3、迭代dict的value
dict 对象有一个 values() 方法,这个方法把dict转换成一个包含所有value的list,我们迭代的就是 dict的每一个 value:
d= { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.values()
# [85, 95, 59]
for v in d.values():
print v
# 85
# 95
# 59
1
2
3
4
5
6
7
8
dict除了values()方法外,还有一个 itervalues() 方法,用 itervalues() 方法替代 values() 方法,迭代效果完全一样:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.itervalues()
# <dictionary-valueiterator object at 0x106adbb50>
for v in d.itervalues():
print v
# 85
# 95
# 59
1
2
3
4
5
6
7
8
1. values() 方法实际上把一个 dict 转换成了包含 value 的list。
2. itervalues() 方法不会转换,它会在迭代过程中依次从 dict 中取出 value,所以 itervalues() 方法比 values() 方法节省了生成 list 所需的内存。
7.4、迭代dict的key和value
dict 对象的 items() 方法返回的值:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> print d.items()
[('Lisa', 85), ('Adam', 95), ('Bart', 59)]
1
2
3
items() 方法把dict对象转换成了包含tuple的list,我们对这个list进行迭代,可以同时获得key和value:
>>> for key, value in d.items():
... print key, ':', value
...
Lisa : 85
Adam : 95
Bart : 59
1
2
3
4
5
6
和 values() 有一个 itervalues() 类似, items() 也有一个对应的 iteritems(),iteritems() 不把dict转换成list,而是在迭代过程中不断给出 tuple,所以, iteritems() 不占用额外的内存。
八、列表生成式
8.1、生成列表
要生成list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],我们可以用range(1, 11):
>>> range(1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
1
2
但如果要生成[1x1, 2x2, 3x3, …, 10x10]怎么做?方法一是循环:
>>> L = []
>>> for x in range(1, 11):
... L.append(x * x)
...
>>> L
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
1
2
3
4
5
6
但是循环太繁琐,而列表生成式则可以用一行语句代替循环生成上面的list:
>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
1
2
8.2、复杂表达式
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
tds = ['<tr><td>%s</td><td>%s</td></tr>' % (name, score) for name, score in d.iteritems()]
print '<table>'
print '<tr><th>Name</th><th>Score</th><tr>'
print '\n'.join(tds)
print '</table>'
1
2
3
4
5
6
注:字符串可以通过 % 进行格式化,用指定的参数替代 %s。字符串的join()方法可以把一个 list 拼接成一个字符串。
8.3、条件过滤
列表生成式的 for 循环后面还可以加上 if 判断。例如:
>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
1
2
如果我们只想要偶数的平方,不改动 range()的情况下,可以加上 if 来筛选:
>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]
1
2
8.4、多层表达式
for循环可以嵌套,因此,在列表生成式中,也可以用多层 for 循环来生成列表。
对于字符串 ‘ABC’ 和 ‘123’,可以使用两层循环,生成全排列:
>>> [m + n for m in 'ABC' for n in '123']
['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3']
1
2
3
利用 3 层for循环的列表生成式,找出对称的 3 位数。例如,121 就是对称数,因为从右到左倒过来还是 121。
print [100 * n1 + 10 * n2 + n3 for n1 in range(1, 10) for n2 in range(10) for n3 in range(10) if n1==n3]