时间:2021-05-22
处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
#使用PdfFileWriterimport PyPDF2 pdfFiles = []for filename in os.listdir('.'):if filename.endswith('.pdf'):pdfFiles.append(filename)print(pdfFiles)pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb')pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象first,end =map(int,input('从多少页到多少页(用空格隔开):').split())for pageNum in range(first-1,end):pageObj = pdfReader.getPage(pageNum)pdfWriter.addPage(pageObj)pdfOutput = open ('split_pdf.pdf','wb')pdfWriter.write(pdfOutput)pdfOutput.close()#使用PdfFileMerger()import PyPDF2merger = PyPDF2.PdfFileMerger()a = [str(i)+'webbook.pdf'for i in range(0,124)]for i in a:print(i)merger.append(open(i,'rb'))print("合并完成第"+str(i))with open('combintion.pdf','wb') as f:merger.write(f)总结
以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文实例讲述了Python实现简单拆分PDF文件的方法。分享给大家供大家参考。具体如下:依赖pyPdf处理PDF文件切分pdf文件使用方法:1)将要切分的文件放
本文实例演示了Python生成pdf文件的方法,是比较实用的功能,主要包含2个文件。具体实现方法如下:pdf.py文件如下:#!/usr/bin/pythonf
使用Python进行图片和pdf之间的相互转换使用到第三方库PyMuPDF在python环境下对PDF文件的操作。PDF转为图片需新建文件夹pdf2pngimp
问题:python3如何转换html到pdf描述:我的电脑是windows764位,python3.4我想用python转换html到pdf.我尝试了html2
Python提供了众多的PDF支持库,本文是在Python3环境下,试用了两个库来完成PDF的生成的功能。PyPDF对于读取PDF支持较好,但是没找到生成多层P