一,excel表格中的相关概念
工作簿:一个excel文件是一个工作簿
工作表:一个工作簿默认包含三个工作表:Sheet1、Sheet2、Sheet3,工作表可以新建、删除、重命名
行与列:一个工作表包含很多行,一般以1,2,3,4…命名。工作表的列一般以A,B,C,D…命名。
单元格:单元格即具体的一个位置,比如A1表示第一行第一列的单元格。单元格里面可以保存文字、数字等数据。
二,Python中openpyxl模块对excel表格的处理
openpyxl模块是Python语言中操作excel表格非常方便的一个模块,它对excel表格进行了充分的面向对象的操作封装。在openpyxl中,工作簿、工作表、行、列、单元格都是对应对象的。
例如,通过工作簿对象可以获取工作表对象,然后通过工作表对象可以获取标题、行、列、单元格等对象。
三,openpyxl模块的安装
如果import openpyxl
时提示ModuleNotFoundError: No module named 'openpyxl'
,说明还没有安装openpyxl模块,需要在命令行运行pip install openpyxl
。
四,openpyxl模块对.xls和.xlsx的支持
根据测试,openpyxl支持读取.xlsx文件,但是不支持.xls文件,也就是说不支持读取excel97-03版本生成的文件,只能支持更高版本的excel文件。
五,读取excel表格的信息
通过一个实例演示如何一步步获取excel表格的各种信息
首先新建一个excel文件:excel1.xlsx
,内容如下:
读取信息的代码如下:
#导入模块
import openpyxl
#打开工作簿对象
excel1=openpyxl.load_workbook("excel1.xlsx")
print(type(excel1))
#获取工作表对象,及工作表对象的标题
print(excel1.get_sheet_names())
sheetName1=excel1.get_sheet_names()[0]
#按标题获取工作表对象
sheet1=excel1.get_sheet_by_name(sheetName1)
print(sheet1.title)
print(sheet1)
#获取活动工作表对象(上次操作的工作表)
print(excel1.get_active_sheet())
#从工作表中获取单元格对象
cell_a1=sheet1["A1"]
#输出单元格对象的信息
print(cell_a1.value)#单元格的值
print(cell_a1.row)
print(cell_a1.column)
print(cell_a1.coordinate)
#直接指定数字获取单元格
cell22=sheet1.cell(row=2,column=2)
print(cell22.value)
#获取最大行列信息
print(sheet1.max_row)
print(sheet1.max_column)
#遍历
for i in range(1,sheet1.max_row+1):
for j in range(1,sheet1.max_column+1):
print(sheet1.cell(row=i,column=j).value,end=" ")
print("")