时间:2021-05-22
Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。
这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。
帮助文档:http://python-docx.readthedocs.org/en/latest/
1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档
#coding:utf-8import docx #新建文档doc_new = docx.Document() #读取文档doc = docx.Document(ur'C:\1.docx')2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。
doc.save(path_or_stream)3、对象集合。python-docx包含了word文档的相关对象集合。
doc.paragraphs #段落集合doc.tables #表格集合doc.sections #节 集合doc.styles #样式集合doc.inline_shapes #内置图形 等等...4、插入段落。段落是word最基本的对象之一。
doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式doc.add_paragraph(u'第二段',style='Heading 2') #这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式print [s.name for s in doc.styles if s.type==1]5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。
#coding:utf-8from docx import Documentfrom docx.shared import RGBColor #这个是docx的颜色类 #新建文档doc = Document() #新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)style = doc.styles.add_style('style name 1', 2) #设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。
#插入一个空白段落p = doc.add_paragraph('')p.add_run('123', style="Heading 1 Char")p.add_run('456')p.add_run('789', style="Heading 2 Char") #这样一个段落就应用了两个字符样式,中间“456”就没应用样式print p.text #输出结果是u'123456789' 也还是连续的7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。
p = doc.add_paragraph('')r = p.add_run('123')r.font.bold = True #加粗r.font.italic = True #倾斜 等等...8、表格操作。表格也是经常用到的一种对象类型。
#新建一个2x3的表格,style可以不写table=doc.add_table(rows=2,cols=3,style=None) #可以用table 的rows和columns得到这个表格的行数和列数print len(table.rows)print len(table.columns) #遍历表格for row in table.rows: row.cells[0].text = '1' #print row.cells[0].text #新增行或列table.add_row()table.add_column()Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。
以上这篇Python读写docx文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
使用python工具读写MSWord文件(docx与doc文件),主要利用了python-docx包。本文给出一些常用的操作,并完成一个样例,帮助大家快速入手。
最近有个奇葩要求要项目中的N行代码申请专利啥的然后作为程序员当然不能复制粘贴用代码解决。。使用python-docx读写docx文件环境使用python3.6.
本文实例讲述了python实现生成Word、docx文件的方法。分享给大家供大家参考,具体如下:http://python-docx.readthedocs.i
python-docx库可用于创建和编辑MicrosoftWord(.docx)文件。官方文档:链接地址备注:doc是微软的专有的文件格式,docx是Micro
docx2txt的Github地址docx2txt是基于python的从docx文件中提取文本和图片的库。代码是从python-docx中获取的。它也可以从页眉