Python全栈开发-常用模块学习
模块介绍
- time &datetime模块
- random
- os
- sys
- shutil
- shelve
- xml处理
- pyyaml处理
- configparser
- hashlib
- re正则表达式
1、模块介绍
1定义
模块用来从逻辑上组织python代码变量、函数、类、逻辑实现一个功能本质就是.py结尾的python文件文件名test.py模块名就是test
包用来从逻辑上组织模块的本质就是一个目录必须带有一个__init__.py文件
2导入方法
import module_name
import module_name, module2_name
from module_gavin import * # *表示从module_gavin 导入所有方法。等同于把该模块下的所有代码复制到当前主程序。不推荐使用该方法是因为可能会和主程序中的某些函数重名而被覆盖。所以不推荐使用该方法。
from module_gavin import logger #是仅仅导入该模块下的logger方法。
from module_gavin import logger as logger_gavin # 把该模块下的logger方法起了一个别名logger_gavin主程序调用时直接调用别名。
3import 的本质路径搜索和搜索路径
导入模块的本质就是把python文件解释一遍然后把解释的结果封装起来赋值给一个叫做‘模块名’的变量所以在下面程序引用时前面需要加上封装后的模块名。
导入包的本质就是执行该包下的__init__.py文件
form XXX import XXX本质是等同于把该模块下的所有或对应的代码复制到当前主程序并解释一遍。被引用的变量或函数可以直接在主程序使用前面不需要加入模块名。
4导入优化
from module_gavin import logger #使用该方法直接复制logger函数并解释省略了import module_gavin 这种方法中寻找模块名的过程如果在一个程序中大范围的调用该模块下的logger方法则每次调用需要先寻找module_gavin这个模块然后才能调用下面的方法。用from XXX import XXX方法就可以省略去寻找模块的过程速度大大提高。
5模块的分类
a、标准库或内置模块
b、开源模块或第三方模块
c、自定义模块
2、time & datetime模块
在Python中通常有这几种方式来表示时间1时间戳 2格式化的时间字符串 3元组struct_time共九个元素。由于Python的time模块实现主要调用C库所以各个平台可能有所不同。
UTCCoordinated Universal Time世界协调时亦即格林威治天文时间世界标准时间。在中国为UTC+8。DSTDaylight Saving Time即夏令时。
时间戳timestamp的方式通常来说时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”返回的是float类型。返回时间戳方式的函数主要有time()clock()等。
元组struct_time方式struct_time元组共有9个元素返回struct_time的函数主要有gmtime()localtime()strptime()。下面列出这种方式元组中的几个元素
#_*_coding:utf-8_*_
import time
# print(time.clock()) #返回处理器时间,3.3开始已废弃 , 改成了time.process_time()测量处理器运算时间,不包括sleep时间,不稳定,mac上测不出来
# print(time.altzone) #返回与utc时间的时间差,以秒计算\
# print(time.asctime()) #返回时间格式"Fri Aug 19 11:14:16 2016",
# print(time.localtime()) #返回本地时间 的struct time对象格式
# print(time.gmtime(time.time()-800000)) #返回utc时间的struc时间对象格式
# print(time.asctime(time.localtime())) #返回时间格式"Fri Aug 19 11:14:16 2016",
#print(time.ctime()) #返回Fri Aug 19 12:38:29 2016 格式, 同上
# 日期字符串 转成 时间戳
# string_2_struct = time.strptime("2016/05/22","%Y/%m/%d") #将 日期字符串 转成 struct时间对象格式
# print(string_2_struct)
# #
# struct_2_stamp = time.mktime(string_2_struct) #将struct时间对象转成时间戳
# print(struct_2_stamp)
#将时间戳转为字符串格式
# print(time.gmtime(time.time()-86640)) #将utc时间戳转换成struct_time格式
# print(time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime()) ) #将utc struct_time格式转成指定的字符串格式
#时间加减
import datetime
# print(datetime.datetime.now()) #返回 2016-08-19 12:47:03.941925
#print(datetime.date.fromtimestamp(time.time()) ) # 时间戳直接转成日期格式 2016-08-19
# print(datetime.datetime.now() )
# print(datetime.datetime.now() + datetime.timedelta(3)) #当前时间+3天
# print(datetime.datetime.now() + datetime.timedelta(-3)) #当前时间-3天
# print(datetime.datetime.now() + datetime.timedelta(hours=3)) #当前时间+3小时
# print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分
#
# c_time = datetime.datetime.now()
# print(c_time.replace(minute=3,hour=2)) #时间替换
格式参照
%a 本地locale简化星期名称
%A 本地完整星期名称
%b 本地简化月份名称
%B 本地完整月份名称
%c 本地相应的日期和时间表示
%d 一个月中的第几天01 - 31
%H 一天中的第几个小时24小时制00 - 23
%I 第几个小时12小时制01 - 12
%j 一年中的第几天001 - 366
%m 月份01 - 12
%M 分钟数00 - 59
%p 本地am或者pm的相应符 一
%S 秒01 - 61 二
%U 一年中的星期数。00 - 53星期天是一个星期的开始。第一个星期天之前的所有天数都放在第0周。 三
%w 一个星期中的第几天0 - 60是星期天 三
%W 和%U基本相同不同的是%W以星期一为一个星期的开始。
%x 本地相应日期
%X 本地相应时间
%y 去掉世纪的年份00 - 99
%Y 完整的年份
%Z 时区的名字如果不存在为空字符
%% ‘%’字符
时间关系转换
3、random模块
#!/usr/bin/env python
#_*_encoding: utf-8_*_
import random
print (random.random()) #0.6445010863311293
#random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0
print (random.randint(1,7)) #4
#random.randint()的函数原型为random.randint(a, b)用于生成一个指定范围内的整数。
# 其中参数a是下限参数b是上限生成的随机数n: a <= n <= b
print (random.randrange(1,10)) #5
#random.randrange的函数原型为random.randrange([start], stop[, step])
# 从指定范围内按指定基数递增的集合中 获取一个随机数。如random.randrange(10, 100, 2)
# 结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数。
# random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效。
print(random.choice('liukuni')) #i
#random.choice从序列中获取一个随机元素。
# 其函数原型为random.choice(sequence)。参数sequence表示一个有序类型。
# 这里要说明一下sequence在python不是一种特定的类型而是泛指一系列的类型。
# list, tuple, 字符串都属于sequence。有关sequence可以查看python手册数据模型这一章。
# 下面是使用choice的一些例子
print(random.choice("学习Python"))#学
print(random.choice(["JGood","is","a","handsome","boy"])) #List
print(random.choice(("Tuple","List","Dict"))) #List
print(random.sample([1,2,3,4,5],3)) #[1, 2, 5]
#random.sample的函数原型为random.sample(sequence, k)从指定序列中随机获取指定长度的片断。sample函数不会修改原有序列。
实际应用
#!/usr/bin/env python
# encoding: utf-8
import random
import string
#随机整数
print( random.randint(0,99)) #70
#随机选取0到100间的偶数
print(random.randrange(0, 101, 2)) #4
#随机浮点数
print( random.random()) #0.2746445568079129
print(random.uniform(1, 10)) #9.887001463194844
#随机字符
print(random.choice('abcdefg&#%^*f')) #f
#多个字符中选取特定数量的字符
print(random.sample('abcdefghij',3)) #['f', 'h', 'd']
#随机选取字符串
print( random.choice ( ['apple', 'pear', 'peach', 'orange', 'lemon'] )) #apple
#洗牌#
items = [1,2,3,4,5,6,7]
print(items) #[1, 2, 3, 4, 5, 6, 7]
random.shuffle(items)
print(items) #[1, 4, 7, 2, 5, 3, 6]
生成随机验证码
import random
checkcode = ''
for i in range(4):
current = random.randrange(0,4)
if current != i:
temp = chr(random.randint(65,90))
else:
temp = random.randint(0,9)
checkcode += str(temp)
print (checkcode)
4、os模块
提供对操作系统进行调用的接口
os.getcwd() 获取当前工作目录即当前python脚本工作的目录路径
os.chdir("dirname") 改变当前脚本工作目录相当于shell下cd
os.curdir 返回当前目录: ('.')
os.pardir 获取当前目录的父目录字符串名('..')
os.makedirs('dirname1/dirname2') 可生成多层递归目录
os.removedirs('dirname1') 若目录为空则删除并递归到上一级目录如若也为空则删除依此类推
os.mkdir('dirname') 生成单级目录相当于shell中mkdir dirname
os.rmdir('dirname') 删除单级空目录若目录不为空则无法删除报错相当于shell中rmdir dirname
os.listdir('dirname') 列出指定目录下的所有文件和子目录包括隐藏文件并以列表方式打印
os.remove() 删除一个文件
os.rename("oldname","newname") 重命名文件/目录
os.stat('path/filename') 获取文件/目录信息
os.sep 输出操作系统特定的路径分隔符win下为"\\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符win下为"\t\n",Linux下为"\n"
os.pathsep 输出用于分割文件路径的字符串
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command") 运行shell命令直接显示
os.environ 获取系统环境变量
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path) 返回path最后的文件名。如何path以或\结尾那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在返回True如果path不存在返回False
os.path.isabs(path) 如果path是绝对路径返回True
os.path.isfile(path) 如果path是一个存在的文件返回True。否则返回False
os.path.isdir(path) 如果path是一个存在的目录则返回True。否则返回False
os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回第一个绝对路径之前的参数将被忽略
os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
5、sys模块
sys.argv 命令行参数List第一个元素是程序本身路径
sys.exit(n) 退出程序正常退出时exit(0)
sys.version 获取Python解释程序的版本信息
sys.maxint 最大的Int值
sys.path 返回模块的搜索路径初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
sys.stdout.write('please:')
val = sys.stdin.readline()[:-1]
6、shutil 模块
7、shelve 模块
shelve模块是一个简单的k,v将内存数据通过文件持久化的模块可以持久化任何pickle可支持的python数据格式
import shelve
d = shelve.open('shelve_test') #打开一个文件
class Test(object):
def __init__(self,n):
self.n = n
t = Test(123)
t2 = Test(123334)
name = ["alex","rain","test"]
d["test"] = name #持久化列表
d["t1"] = t #持久化类
d["t2"] = t2
d.close()
8、xml处理模块
xml是实现不同语言或程序之间进行数据交换的协议跟json差不多但json使用起来更简单不过古时候在json还没诞生的黑暗年代大家只能选择用xml呀至今很多传统公司如金融行业的很多系统的接口还主要是xml。
xml的格式如下就是通过<>节点来区别数据结构的:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
xml协议在各个语言里的都 是支持的在python中可以用以下模块操作xml
import xml.etree.ElementTree as ET
tree = ET.parse("xmltest.xml")
root = tree.getroot()
print(root.tag)
#遍历xml文档
for child in root:
print(child.tag, child.attrib)
for i in child:
print(i.tag,i.text)
#只遍历year 节点
for node in root.iter('year'):
print(node.tag,node.text)
修改和删除xml文档内容
import xml.etree.ElementTree as ET
tree = ET.parse("xmltest.xml")
root = tree.getroot()
#修改
for node in root.iter('year'):
new_year = int(node.text) + 1
node.text = str(new_year)
node.set("updated","yes")
tree.write("xmltest.xml")
#删除node
for country in root.findall('country'):
rank = int(country.find('rank').text)
if rank > 50:
root.remove(country)
tree.write('output.xml')
自己创建xml文档
import xml.etree.ElementTree as ET
new_xml = ET.Element("namelist")
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})
age = ET.SubElement(name,"age",attrib={"checked":"no"})
sex = ET.SubElement(name,"sex")
sex.text = '33'
name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"})
age = ET.SubElement(name2,"age")
age.text = '19'
et = ET.ElementTree(new_xml) #生成文档对象
et.write("test.xml", encoding="utf-8",xml_declaration=True)
ET.dump(new_xml) #打印生成的格式
9、PyYAML模块
Python也可以很容易的处理ymal文档格式只不过需要安装一个模块参考文档http://pyyaml.org/wiki/PyYAMLDocumentation
10、ConfigParser模块
用于生成和修改常见配置文档当前模块的名称在 python 3.x 版本中变更为 configparser。
来看一个好多软件的常见文档格式如下
[DEFAULT]
ServerAliveInterval = 45
Compression = yes
CompressionLevel = 9
ForwardX11 = yes
[bitbucket.org]
User = hg
[topsecret.server.com]
Port = 50022
ForwardX11 = no
如果想用python生成一个这样的文档怎么做呢
import configparser
config = configparser.ConfigParser()
config["DEFAULT"] = {'ServerAliveInterval': '45',
'Compression': 'yes',
'CompressionLevel': '9'}
config['bitbucket.org'] = {}
config['bitbucket.org']['User'] = 'hg'
config['topsecret.server.com'] = {}
topsecret = config['topsecret.server.com']
topsecret['Host Port'] = '50022' # mutates the parser
topsecret['ForwardX11'] = 'no' # same here
config['DEFAULT']['ForwardX11'] = 'yes'
with open('example.ini', 'w') as configfile:
config.write(configfile)
写完了还可以再读出来哈。
>>> import configparser
>>> config = configparser.ConfigParser()
>>> config.sections()
[]
>>> config.read('example.ini')
['example.ini']
>>> config.sections()
['bitbucket.org', 'topsecret.server.com']
>>> 'bitbucket.org' in config
True
>>> 'bytebong.com' in config
False
>>> config['bitbucket.org']['User']
'hg'
>>> config['DEFAULT']['Compression']
'yes'
>>> topsecret = config['topsecret.server.com']
>>> topsecret['ForwardX11']
'no'
>>> topsecret['Port']
'50022'
>>> for key in config['bitbucket.org']: print(key)
...
user
compressionlevel
serveraliveinterval
compression
forwardx11
>>> config['bitbucket.org']['ForwardX11']
'yes'
configparser增删改查语法
[section1]
k1 = v1
k2:v2
[section2]
k1 = v1
import ConfigParser
config = ConfigParser.ConfigParser()
config.read('i.cfg')
# ########## 读 ##########
#secs = config.sections()
#print secs
#options = config.options('group2')
#print options
#item_list = config.items('group2')
#print item_list
#val = config.get('group1','key')
#val = config.getint('group1','key')
# ########## 改写 ##########
#sec = config.remove_section('group1')
#config.write(open('i.cfg', "w"))
#sec = config.has_section('wupeiqi')
#sec = config.add_section('wupeiqi')
#config.write(open('i.cfg', "w"))
#config.set('group2','k1',11111)
#config.write(open('i.cfg', "w"))
#config.remove_option('group2','age')
#config.write(open('i.cfg', "w"))
11、hashlib模块
用于加密相关的操作3.x里代替了md5模块和sha模块主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 MD5 算法
import hashlib
m = hashlib.md5()
m.update(b"Hello")
m.update(b"It's me")
print(m.digest())
m.update(b"It's been a long time since last time we ...")
print(m.digest()) #2进制格式hash
print(len(m.hexdigest())) #16进制格式hash
'''
def digest(self, *args, **kwargs): # real signature unknown
""" Return the digest value as a string of binary data. """
pass
def hexdigest(self, *args, **kwargs): # real signature unknown
""" Return the digest value as a string of hexadecimal digits. """
pass
'''
import hashlib
# ######## md5 ########
hash = hashlib.md5()
hash.update('admin')
print(hash.hexdigest())
# ######## sha1 ########
hash = hashlib.sha1()
hash.update('admin')
print(hash.hexdigest())
# ######## sha256 ########
hash = hashlib.sha256()
hash.update('admin')
print(hash.hexdigest())
# ######## sha384 ########
hash = hashlib.sha384()
hash.update('admin')
print(hash.hexdigest())
# ######## sha512 ########
hash = hashlib.sha512()
hash.update('admin')
print(hash.hexdigest())
还不够吊python 还有一个 hmac 模块它内部对我们创建 key 和 内容 再进行处理然后再加密
散列消息鉴别码简称HMAC是一种基于消息鉴别码MACMessage Authentication Code的鉴别机制。使用HMAC时,消息通讯的双方通过验证消息中加入的鉴别密钥K来鉴别消息的真伪
一般用于网络通信中消息加密前提是双方先要约定好key,就像接头暗号一样然后消息发送把用key把消息加密接收方用key 消息明文再加密拿加密后的值 跟 发送者的相对比是否相等这样就能验证消息的真实性及发送者的合法性了。
import hmac
h = hmac.new(b'天王盖地虎', b'宝塔镇河妖')
print h.hexdigest()
更多关于md5,sha1,sha256等介绍的文章看这里https://www.tbs-certificates.co.uk/FAQ/en/sha256.html
12、re模块
常用正则表达式符号
'.' 默认匹配除\n之外的任意一个字符若指定flag DOTALL,则匹配任意字符包括换行
'^' 匹配字符开头若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
'$' 匹配字符结尾或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以
'*' 匹配*号前的字符0次或多次re.findall("ab*","cabb3abcbbac") 结果为['abb', 'ab', 'a']
'+' 匹配前一个字符1次或多次re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?' 匹配前一个字符1次或0次
'{m}' 匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|' 匹配|左或|右的字符re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
'\A' 只从字符开头匹配re.search("\Aabc","alexabc") 是匹配不到的
'\Z' 匹配字符结尾同$
'\d' 匹配数字0-9
'\D' 匹配非数字
'\w' 匹配[A-Za-z0-9]
'\W' 匹配非[A-Za-z0-9]
's' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
'(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
最常用的匹配语法
re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回
re.splitall 以匹配到的字符当做列表分隔符
re.sub 匹配字符并替换
反斜杠的困扰
与大多数编程语言相同正则表达式里使用"“作为转义字符这就可能造成反斜杠困扰。假如你需要匹配文本中的字符”"那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\"前两个和后两个分别用于在编程语言里转义成反斜杠转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题这个例子中的正则表达式可以使用r"\“表示。同样匹配一个数字的”\d"可以写成r"\d"。有了原生字符串你再也不用担心是不是漏写了反斜杠写出来的表达式也更直观。
仅需轻轻知道的几个匹配模式
re.I(re.IGNORECASE): 忽略大小写括号内是完整写法下同
M(MULTILINE): 多行模式改变'^'和'$'的行为参见上图
S(DOTALL): 点任意匹配模式改变'.'的行为