脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|shell|

服务器之家 - 脚本之家 - Python - Python实现自动合并Word并添加分页符

Python实现自动合并Word并添加分页符

2023-02-28 11:33疯狂学习GIS Python

这篇文章主要为大家详细介绍了如何基于Python实现对多个Word文档加以自动合并,并在每次合并时按要求增添一个分页符的功能,感兴趣的可以了解一下

本文介绍基于Python,实现对多个Word文档加以自动合并,并在每次合并时按要求增添一个分页符的方法。

现有多个Word文档文件,需将其按名称顺序合并为一个新的Word文件,且需保证每一次合并时,都另起一页(即新的Word文件一页中,不能出现两个及以上的原本单个Word文件的内容)。

一般的,实现多个Word文件的合并,在Word中可以通过“插入”→“文本”→“对象”的方式进行,较为方便。

Python实现自动合并Word并添加分页符

在弹出的窗口中选择需要合并的Word文件即可。

Python实现自动合并Word并添加分页符

但是,这种方法工作量较大,且无法满足合并时另起一页的要求。例如,如果原本有两个Word文件,每个文件中都仅有一页,一页中仅在第一行有内容(这里假设是一行数字),则合并后的新Word文件同样为一页,该页中包含两行数字,即无法另起一页合并。

因此,本文就结合Pythonpython-docxdocx)模块与docxcompose模块,实现本文开头提及的需求。

首先安装python-docx模块。由于我用的是Anaconda,因此就直接在Anaconda Prompt (Soft)中加以安装。

打开Anaconda Prompt (Soft)

Python实现自动合并Word并添加分页符

在弹出的界面中输入:

?
1
conda install -c conda-forge python-docx

Python实现自动合并Word并添加分页符

输入y,开始安装。

Python实现自动合并Word并添加分页符

随后即可安装完成。

Python实现自动合并Word并添加分页符

接下来安装docxcompose,还是一样的操作。输入:

?
1
pip install docxcompose

Python实现自动合并Word并添加分页符

安装完成后,即可开始代码的书写。整体代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import os
from docx import Document
from docxcompose.composer import Composer
 
original_docx_path='F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701_就业派遣材料/'
new_docx_path='F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701.docx'
 
all_word=os.listdir(original_docx_path)
all_file_path=[]
for file_name in all_word:
    all_file_path.append(original_docx_path+file_name)
master=Document(all_file_path[0])
middle_new_docx=Composer(master)
num=0
for word in all_file_path:
    word_document=Document(word)
    word_document.add_page_break()
    if num!=0:
        middle_new_docx.append(word_document)
    num=num+1
middle_new_docx.save(new_docx_path)

首先,对代码加以初步介绍。original_docx_path为存放需要合并的Word文件路径,new_docx_path为需要合并入其中的Word文件,这里大家直接在目标路径下新建一个Word文件并重命名为需要的文件名即可。

随后,通过os.listdir获取所有需要合并的Word文件文件名。在这里需要注意,如果需要按照文件名称作为合并顺序,大家直接在资源管理器中调整文件排序方法为名称即可。随后通过.append()逐一将文件名称与其路径合并。

接下来,设立一个Word文件模板master。其实这个模板就是限定了合并完成后的新Word文件的字体等格式,如果我们不设置模板,就会用docx模块中的默认模板,导致合并后的文件字体与合并前的文件字体不一致(内容是一致的,主要是字体等格式会出问题)。在这里,为了保证合并完成后的新Word文件的字体等格式与合并前文件一致,直接用all_file_path[0](也就是即将要被合并的第一个文件)作为模板即可。其次,将模板用Composer()激活(这里Composer函数个人认为就是激活的作用),从而将其作为模板格式,对多个待合并的文件加以约束。

最后,由于需要保证每一次合并都另起一页,便用.add_page_break()函数,在每一次合并前将这一待合并的文件末尾增添分页符。同时,由于我们用了第一个待合并文件作为模板,因此后期只需要从第二个文件开始进行合并即可(可以理解为,文件一旦选择为模板,其自动完成了自身的合并)。最后保存文件即可。

综上,便完成了“按名称顺序合并为一个新的Word文件,且需保证每一次合并时,都另起一页”的需求。但是需要注意,这一方法对于较为复杂的Word文件(例如含有文本框等形式内容的文件)不能实现合并,会报错;对于含有普通文字、图片等的Word文件而言,还是很方便的~

以上就是Python实现自动合并Word并添加分页符的详细内容,更多关于Python自动合并Word的资料请关注服务器之家其它相关文章!

原文链接:https://www.cnblogs.com/fkxxgis/p/17143805.html

延伸 · 阅读

精彩推荐
  • PythonPython 循环结构详解

    Python 循环结构详解

    这篇文章主要介绍了Python 循环结构,程序的循环结构逻辑,循环就是按照一定的条件重复的去做一件事情,当条件不成立时就结束循环的内容,需要的小伙...

    史迪崽儿7582022-10-05
  • PythonDjango中URLconf和include()的协同工作方法

    Django中URLconf和include()的协同工作方法

    这篇文章主要介绍了Django中URLconf和include()的协同工作方法,Django是Python众人气框架中最著名的一个,需要的朋友可以参考下 ...

    脚本之家3262020-07-25
  • PythonPython使用PyCrypto实现AES加密功能示例

    Python使用PyCrypto实现AES加密功能示例

    这篇文章主要介绍了Python使用PyCrypto实现AES加密功能,结合具体实例形式分析了PyCrypto实现AES加密的操作步骤与相关实现技巧,需要的朋友可以参考下...

    pythopen4102020-11-11
  • PythonPython3内置json模块编码解码方法详解

    Python3内置json模块编码解码方法详解

    Python3中我们利用内置模块json解码和编码JSON对象。json模块提供了四个功能:dumps、dump、loads、load本文详细讲解了Python3内置json模块的详细使用方法...

    脚本之家12042022-01-19
  • PythonOpenCV基础HSV颜色空间*args与**kwargs滑动条传参问题

    OpenCV基础HSV颜色空间*args与**kwargs滑动条传参问题

    这篇文章主要介绍了OpenCV基础中HSV颜色空间*args与**kwargs滑动条传参问题的详细解析,有需要的朋友可以借鉴参考下,希望能够有所帮助...

    _睿智_5062022-01-25
  • PythonPython及Django框架生成二维码的方法分析

    Python及Django框架生成二维码的方法分析

    这篇文章主要介绍了Python及Django框架生成二维码的方法,结合实例形式分析了Python及Django框架使用qrcode包实现二维码生成功能的相关操作技巧,需要的朋友可...

    刘元涛8032021-01-10
  • Python了解一下python内建模块collections

    了解一下python内建模块collections

    这篇文章主要介绍了Python内建模块——collections的相关资料,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下...

    把苹果v咬哭3532020-09-08
  • Python对Python中数组的几种使用方法总结

    对Python中数组的几种使用方法总结

    今天小编就为大家分享一篇对Python中数组的几种使用方法总结,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    yinglongnvba10772021-03-10