脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python数据处理-导入导出excel数据

Python数据处理-导入导出excel数据

2022-08-31 10:22python2021_ Python

这篇文章主要介绍了Python数据处理-导入导出excel数据,Python的一大应用就是数据分析了,而数据分析中,经常碰到需要处理Excel数据的情况。这里做一个Python处理Excel数据的总结,需要的小伙伴可以参考一下

前言:

Python的一大应用就是数据分析了,而数据分析中,经常碰到需要处理Excel数据的情况。这里做一个Python处理Excel数据的总结,基本受用大部分情况。相信以后用Python处理Excel数据不再是难事儿!

一.xlwt库将数据导入Excel

1.将数据写入一个Excel文件

?
1
2
3
4
5
6
7
8
9
10
11
12
13
wb = xlwt.Workbook()
# 添加一个表
ws = wb.add_sheet('test')
 
 
# 3个参数分别为行号,列号,和内容
# 需要注意的是行号和列号都是从0开始的
ws.write(0, 0, '第1列')
ws.write(0, 1, '第2列')
ws.write(0, 2, '第3列')
 
# 保存excel文件
wb.save('./test.xls')

可以看到,用xlwt库操作非常简单,基本就三步走:

  • 打开一个Workbook对象,并用add_sheet方法添加一个表
  • 然后就是用write方法写入数据
  • 最后用save方法保存

需要注意的是:xlwt库里面所定义的行和列都是从0开始计数的

2.定制Excel表格样式

表格样式一般主要有这么几块内容:字体、对齐方式、边框、背景色、宽度以及特殊内容,比如超链接、日期时间等。下面我们来分别看看用xlwt库怎么定制这些样式。

字体

xlwt库支持的字体属性也比较多,大概如下:

Python数据处理-导入导出excel数据

设置字体需要用到xlwt库的XFStyle类和Font类,代码模版如下:

?
1
2
3
4
5
6
7
8
9
10
11
style = xlwt.XFStyle()
 
# 设置字体
font = xlwt.Font()
# 比如设置字体加粗和下划线
font.bold = True
font.underline = True
style.font = font
 
# 然后应用
ws.write(2, 1, 'test', style)

后续几个属性的设置都是类似的,都是4步走:

  • 拿到XFStyle
  • 拿到对应需要的属性,比如这里的Font对象
  • 设置具体的属性值
  • 最后就是在write方法写入数据的时候应用就行

3.元格对齐

先来看单元格对齐怎么设置:

?
1
2
3
4
5
6
7
8
9
10
11
12
# 单元格对齐
alignment = xlwt.Alignment()
 
# 水平对齐方式和垂直对齐方式
alignment.horz = xlwt.Alignment.HORZ_CENTER
alignment.vert = xlwt.Alignment.VERT_CENTER
# 自动换行
alignment.wrap = 1
style.alignment = alignment
 
# 然后应用
ws.write(2, 1, 'test', style)

上面这个自动换行的属性还是蛮有用的,因为我们很多时候数据会比较长,最好再加上单元格的宽度属性一起使用,这样整体样式会好很多

单元格宽度设置:

?
1
2
# 设置单元格宽度,也就是某一列的宽度
ws.col(0).width = 6666

4.单元格的背景色

背景色对应的属性是 Pattern

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 背景色
pattern = xlwt.Pattern()
pattern.pattern = xlwt.Pattern.SOLID_PATTERN
 
# 背景色为黄色
# 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta,
# 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow ,
# almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray
# ...
pattern.pattern_fore_colour = 5
style.pattern = pattern
 
# 然后应用
ws.write(2, 1, 'test', style)

5.单元格边框

边框属性是Borders

单元格边框就2类:颜色和边框线样式

可以分别设置上下左右边框的颜色和样式:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
# 边框
borders = xlwt.Borders()
 
# 边框可以分别设置top、bottom、left、right
# 每个边框又可以分别设置颜色和线样式:实线、虚线、无
# 颜色设置,其他类似
borders.left_colour = 0x40
# 设置虚线,其他类似
borders.bottom = xlwt.Borders.DASHED
style.borders = borders
 
# 然后应用
ws.write(2, 1, 'test', style)

特殊内容,比如超链接和公式

特殊内容一般主要会碰到这几类:超链接、公式和时间日期

处理这些特殊内容需要用到Formula

?
1
2
3
4
5
6
7
8
9
10
11
# 超链接
link = 'HYPERLINK("http://www.baidu.com";"Baidu")'
formula = xlwt.Formula(link)
ws.write(2, 0, formula)
 
# 公式也是类似
ws.write(1, 1, xlwt.Formula('SUM(A1,B1)'))
 
# 时间
style.num_format_str = 'M/D/YY'
ws.write(2, 1, datetime.datetime.now(), style)

以上就是用Python将数据写入到Excel的全部内容了,下面我们再来看看怎么读取Excel中的数据做处理。

二、xlrd库读取Excel中的数据

1.读取Excel文件

同样的用xlrd库读取Excel的数据也是轻轻松松,先来看下实现代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 先打开一个文件
wb = xlrd.open_workbook(file_path)
# 获取第一个表
sheet1 = wb.sheet_by_index(0)
 
# 总行数
nrows = sheet1.nrows
# 总列数
ncols = sheet1.ncols
 
# 后面就通过循环即可遍历数据了
# 取数据
for i in range(nrows):
    for j in range(ncols):
        # cell_value方法取出第i行j列的数据
        value = sheet1.cell_value(i, j)
        print(value)

总结一下,分为一下几步:

首先通过xlrd库的open_workbook方法打开Excel文件
然后通过sheet_by_index方法获取表
然后分别获取表的行数和列数,便于后面循环遍历
根据列数和行数,循环遍历,通过cell_value方法获取每个单元格中的数据

2.工作表的相关操作

获取一个工作表,有多种方式:

?
1
2
3
4
5
6
7
8
9
# 通过索引
sheet1 = wb.sheets()[0]
sheet1 = wb.sheet_by_index(0)
 
# 通过名字
sheet1 = wb.sheet_by_name('test')
 
# 获取所有表名
# sheet_names = wb.sheet_names()

获取某一行或某一列的所有数据:

?
1
2
3
4
# 获取行中所有数据,返回结果是一个列表
tabs = sheet1.row_values(rowx=0, start_colx=0, end_colx=None)
# 返回一行一共有多少数据
len_value = sheet1.row_len(rowx=0)

row_values的三个参数分别是:行号、开始的列和结束的列,其中结束的列为None表示获取从开始列到最后的所有数据

类似的还有获取某一列的数据:

?
1
cols = sheet1.col_values(colx=0, start_rowx=0, end_rowx=None)

3.处理时间数据

时间数据比较特殊,没发直接通过上面的cell_value方法获取。需要先转换为时间戳,然后再格式化成我们想要的格式。

比如要获取Excel表格中,格式为2019/8/13 20:46:35的时间数据

?
1
2
3
4
5
6
7
8
9
10
# 获取时间
time_value = sheet1.cell_value(3, 0)
 
# 获取时间戳
time_stamp = int(xlrd.xldate.xldate_as_datetime(time_value, 0).timestamp())
print(time_stamp)
 
# 格式化日期
time_rel = time.strftime("%Y/%m/%d", time.localtime(time_stamp))
print(time_rel)

基本也是三步走:

  • 通过cell_value方法获取时间值
  • 然后通过xldate_as_datetime方法获取时间戳
  • 然后格式化一下

Excel文件是用Python处理数据时常会碰到的一类场景,有了xlwt 和 xlrd的帮助可以非常快速的导入和导出Excel数据。

到此这篇关于Python数据处理-导入导出excel数据的文章就介绍到这了,更多相关Python 导入导出excel数据内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/python2021_/article/details/122634643

延伸 · 阅读

精彩推荐
  • Pythonpython爬虫之xpath的基本使用详解

    python爬虫之xpath的基本使用详解

    本篇文章主要介绍了python爬虫之xpath的基本使用详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    Charles.L5502021-02-01
  • PythonPython实现快速计算词频功能示例

    Python实现快速计算词频功能示例

    这篇文章主要介绍了Python实现快速计算词频功能,结合实例形式总结分析了Python使用nltk库进行词频计算功能的相关操作技巧,需要的朋友可以参考下...

    chenKFKevin10312021-03-09
  • Pythonpython 制作手机归属地查询工具(附源码)

    python 制作手机归属地查询工具(附源码)

    这篇文章主要介绍了python 制作手机归属地查询工具,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下...

    懷淰メ10182021-09-29
  • Python使用Python实现下载网易云音乐的高清MV

    使用Python实现下载网易云音乐的高清MV

    本文给大家分享的是一则使用Python实现下载网易云音乐中高清MV的代码,本人新手,没有做特别的功能,仅仅是直接循环了MV的id,小伙伴们可以自己扩展下。...

    hebedich4022019-12-07
  • Pythonpython实现扫描局域网指定网段ip的方法

    python实现扫描局域网指定网段ip的方法

    这篇文章主要介绍了python实现扫描局域网指定网段ip的方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下...

    水似冰9712021-06-18
  • PythonPython使用 OpenCV 进行图像投影变换

    Python使用 OpenCV 进行图像投影变换

    这篇文章主要介绍了Python使用 OpenCV 进行图像投影变换,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下...

    woshicver6262022-08-24
  • Python浅谈keras2 predict和fit_generator的坑

    浅谈keras2 predict和fit_generator的坑

    这篇文章主要介绍了浅谈keras2 predict和fit_generator的坑,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 ...

    BYR_jiandong10892020-06-18
  • Pythonjupyter notebook指定启动目录的方法

    jupyter notebook指定启动目录的方法

    这篇文章主要介绍了jupyter notebook指定启动目录的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们...

    mighty1310392021-09-12