摘要:在日常的學(xué)習(xí)生活工作中,我們有時(shí)會遇到需要合并文件的需求。模塊的相關(guān)參考文檔網(wǎng)址為本文將介紹如何利用來完成文件的合并。
??在日常的學(xué)習(xí)生活工作中,我們有時(shí)會遇到需要合并PDF文件的需求。這時(shí),我們可以利用相關(guān)的PDF軟件(如Adobe Acrobat Reader DC)來完成這個(gè)任務(wù),幸運(yùn)的是,Python也為我們提供了這方面的處理模塊PyPDF2, 借用它,我們可以利用Python代碼來很好地完成這項(xiàng)任務(wù)。
??PyPDF2模塊的相關(guān)參考文檔網(wǎng)址為:https://pythonhosted.org/PyPDF2/ . 本文將介紹如何利用PyPDF2來完成PDF文件的合并。
??首先我們在E盤的Cheats文件夾下有如下的PDF文件:
??我們的Python代碼完整如下:
# -*- coding:utf-8*- # 利用PyPDF2模塊合并同一文件夾下的所有PDF文件 # 只需修改存放PDF文件的文件夾變量:file_dir 和 輸出文件名變量: outfile import os from PyPDF2 import PdfFileReader, PdfFileWriter import time # 使用os模塊的walk函數(shù),搜索出指定目錄下的全部PDF文件 # 獲取同一目錄下的所有PDF文件的絕對路徑 def getFileName(filedir): file_list = [os.path.join(root, filespath) for root, dirs, files in os.walk(filedir) for filespath in files if str(filespath).endswith("pdf") ] return file_list if file_list else [] # 合并同一目錄下的所有PDF文件 def MergePDF(filepath, outfile): output = PdfFileWriter() outputPages = 0 pdf_fileName = getFileName(filepath) if pdf_fileName: for pdf_file in pdf_fileName: print("路徑:%s"%pdf_file) # 讀取源PDF文件 input = PdfFileReader(open(pdf_file, "rb")) # 獲得源PDF文件中頁面總數(shù) pageCount = input.getNumPages() outputPages += pageCount print("頁數(shù):%d"%pageCount) # 分別將page添加到輸出output中 for iPage in range(pageCount): output.addPage(input.getPage(iPage)) print("合并后的總頁數(shù):%d."%outputPages) # 寫入到目標(biāo)PDF文件 outputStream = open(os.path.join(filepath, outfile), "wb") output.write(outputStream) outputStream.close() print("PDF文件合并完成!") else: print("沒有可以合并的PDF文件!") # 主函數(shù) def main(): time1 = time.time() file_dir = r"E:Cheats" # 存放PDF的原文件夾 outfile = "Cheat_Sheets.pdf" # 輸出的PDF文件的名稱 MergePDF(file_dir, outfile) time2 = time.time() print("總共耗時(shí):%s s." %(time2 - time1)) main()
??運(yùn)行上述Python代碼,則會在同一目錄下生成Cheat_Sheets.pdf文件,如下:
??本次分享到此結(jié)束,歡迎代價(jià)交流~~
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41745.html
摘要:本文將展示如何利用的模塊從文件中爬取表格數(shù)據(jù)。但如何從文件中提取其中的表格,這卻是一個(gè)大難題。我們以輸出文件為例從文件中提取表格將表格數(shù)據(jù)轉(zhuǎn)化為文件得到的文件如下例在例中,我們將提取頁面中的某一區(qū)域的表格的數(shù)據(jù)。 簡介 ??本文將展示一個(gè)稍微不一樣點(diǎn)的爬蟲。??以往我們的爬蟲都是從網(wǎng)絡(luò)上爬取數(shù)據(jù),因?yàn)榫W(wǎng)頁一般用HTML,CSS,JavaScript代碼寫成,因此,有大量成熟的技術(shù)來爬取...
小編寫這篇文章的主要目的,主要是給大家介紹一下關(guān)于python代碼實(shí)現(xiàn)pdf編輯免費(fèi)pdf工具相關(guān)知識的解答。 PDF是在日常生活中使用范圍還是比較的廣泛的,很多的文檔都是PDF格式。格式穩(wěn)定是他的一個(gè)優(yōu)勢,使得我們在打印、分享、傳輸過程中能夠最優(yōu)的保持原有色彩和格式。 PDF各種各樣的的版本是比較的多的,它在格式的穩(wěn)定性方面雖然具有很大優(yōu)勢。但是,在可編輯性方面卻為使用者引入了另外一個(gè)困...
閱讀 4032·2021-11-22 13:53
閱讀 1733·2021-09-23 11:52
閱讀 2451·2021-09-06 15:02
閱讀 969·2019-08-30 15:54
閱讀 913·2019-08-30 14:15
閱讀 2395·2019-08-29 18:39
閱讀 667·2019-08-29 16:07
閱讀 430·2019-08-29 13:13