本文主要是給大家介紹了Python辦公系統(tǒng)從Excel中測(cè)算整理資料并載入Word實(shí)例詳細(xì)說(shuō)明,感興趣的小伙伴值得借鑒參考一下,希望可以有一定的幫助,祝愿大家多多的發(fā)展,盡早漲薪
序言
在前面幾個(gè)月的文中大家介紹了怎樣從Word表格中獲取特定數(shù)據(jù)信息并依據(jù)文件格式儲(chǔ)存到Excel中,今日我們將要再度以一名閱讀者所提出的實(shí)際需求來(lái)介紹怎么使用Python從Excel中測(cè)算、整理資料并載入Word中,并不難,主要還是下列二步:
openpyxl讀取Excel獲得具體內(nèi)容
docx讀寫(xiě)Word文件
那我們開(kāi)始吧!
需求確認(rèn)
首先來(lái)看下我們需要處理的Excel部分?jǐn)?shù)據(jù),因涉及隱私已經(jīng)將數(shù)據(jù)皮卡丘化
可以看到數(shù)據(jù)非常多,并且還存在重復(fù)數(shù)據(jù)。而我們要做的就是對(duì)每一列的數(shù)據(jù)按照一定的規(guī)則進(jìn)行計(jì)算、整理并使用Python自動(dòng)填入到Word中,大致的要求如下
上面僅是部分要求,真實(shí)需要填入word中的數(shù)據(jù)要更多!
除了對(duì)按照格式進(jìn)行處理并存入Word中指定位置之外,還有一個(gè)需求:最終輸出的word文件名還需要按照一定規(guī)則生成:
OK,需求分析完畢,接下來(lái)看Python如何解決!
Python實(shí)現(xiàn)
首先我們使用Python對(duì)該Excel進(jìn)行解析
from openpyxl import load_workbook import os #獲取桌面的路徑 def GetDesktopPath(): return os.path.join(os.path.expanduser("~"),'Desktop') path=GetDesktopPath()+'/資料/'#形成文件夾的路徑便后續(xù)重復(fù)使用 workbook=load_workbook(filename=path+'數(shù)據(jù).xlsx') sheet=workbook.active#獲取當(dāng)前頁(yè) #可以用代碼獲取數(shù)據(jù)范圍,如果要批處理循環(huán)迭代也方便 #獲取有數(shù)據(jù)范圍 print(sheet.dimensions) #A1:W10 利用openpyxl讀取單元格有以下幾種用法 cells=sheet['A1:A4']#返回A1-A4的4個(gè)單元格 cells=sheet['A']#獲取A列 cells=sheet['A:C']#獲取A-C列 cells=sheet[5]#獲取第5行 #注意如果是上述用cells獲取返回的是嵌套元祖 for cell in cells: print(cell[0].value)#遍歷cells依然需要取出元祖中元素才可以獲取值 #獲取一個(gè)范圍的所有cell #也可以用iter_col返回列 for row in sheet.iter_rows(min_row=1,max_row=3,min_col=2,max_col=4): for cell in row: print(cell.value) 明白了原理我們就可以解析獲取Excel中的數(shù)據(jù)了 #SQE SQE=sheet['Q2'].value #供應(yīng)商&制造商 supplier=sheet['G2'].value #采購(gòu)單號(hào) C2_10=sheet['C2:C10']#返回cell.tuple對(duì)象 #利用列表推導(dǎo)式后面同理 vC2_10=[str(cell[0].value)for cell in C2_10] #用set簡(jiǎn)易去重后用,連接,填word表用 order_num=','.join(set(vC2_10)) #用set簡(jiǎn)易去重后用&連接,word文件名命名使用 order_num_title='&'.join(set(vC2_10)) #產(chǎn)品型號(hào) T2_10=sheet['T2:T10'] vT2_10=[str(cell[0].value)for cell in T2_10] ptype=','.join(set(vT2_10)) #產(chǎn)品描述 P2_10=sheet['P2:P10'] vP2_10=[str(cell[0].value)for cell in P2_10] info=','.join(set(vP2_10)) info_title='&'.join(set(vP2_10)) #日期 #用datetime庫(kù)獲取今日時(shí)間以及相應(yīng)格式化 import datetime today=datetime.datetime.today() time=today.strftime('%Y年%m月%d日') #驗(yàn)貨數(shù)量 V2_10=sheet['V2:V10'] vV2_10=[int(cell[0].value)for cell in V2_10] total_num=sum(vV2_10)#計(jì)算總數(shù)量 #驗(yàn)貨箱數(shù) W2_10=sheet['W2:W10'] vW2_10=[int(cell[0].value)for cell in W2_10] box_num=sum(vW2_10) #生成最終需要的word文件名 title=f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-驗(yàn)貨報(bào)告' print(title)
通過(guò)上面的代碼,我們就成功的從Excel中提取出來(lái)數(shù)據(jù),這樣Excel部分就結(jié)束了,接下來(lái)進(jìn)行word的填表啦,由于這里我們默認(rèn)讀取的word是.docx格式的,實(shí)際上讀者的需求是.doc格式文件,所以windows用戶(hù)可以用如下代碼批量轉(zhuǎn)化doc,前提是安裝好win32com
#pip install pypiwin32 from win32com import client docx_path=path+'模板.docx' #doc轉(zhuǎn)docx的函數(shù) def doc2docx(doc_path,docx_path): word=client.Dispatch("Word.Application") doc=word.Documents.Open(doc_path) doc.SaveAs(docx_path,16) doc.Close() word.Quit() print('n doc文件已轉(zhuǎn)換為docxn') if not os.path.exists(docx_path): doc2docx(docx_path[:-1],docx_path) 不過(guò)在Mac下暫時(shí)沒(méi)有好的解決策略,如果有思路歡迎交流,好了有docx格式文件后我們繼續(xù)操作Word部分 docx_path=path+'模板.docx' from docx import Document #實(shí)例化 document=Document(docx_path) #讀取word中的所有表格 tables=document.tables #print(len(tables)) #15 確定好每個(gè)表格數(shù)后即可進(jìn)行相應(yīng)的填報(bào)操作,table的用法和openpyxl中非常類(lèi)似,注意索引和原生python一樣都是從0開(kāi)始 tables[0].cell(1,1).text=SQE tables[1].cell(1,1).text=supplier tables[1].cell(2,1).text=supplier tables[1].cell(3,1).text=ptype tables[1].cell(4,1).text=info tables[1].cell(5,1).text=order_num tables[1].cell(7,1).text=time
上面代碼完成Word中這一部分表格
我們繼續(xù)用Python填寫(xiě)下一個(gè)表格
for i in range(2,11): tables[6].cell(i,0).text=str(sheet[f'T{i}'].value) tables[6].cell(i,1).text=str(sheet[f'P{i}'].value) tables[6].cell(i,2).text=str(sheet[f'C{i}'].value) tables[6].cell(i,4).text=str(sheet[f'V{i}'].value) tables[6].cell(i,5).text=str(sheet[f'V{i}'].value) tables[6].cell(i,6).text='0' tables[6].cell(i,7).text=str(sheet[f'W{i}'].value) tables[6].cell(i,8).text='0' tables[6].cell(12,4).text=str(total_num) tables[6].cell(12,5).text=str(total_num) tables[6].cell(12,7).text=str(box_num) 這里需要注意兩個(gè)細(xì)節(jié): word寫(xiě)入的數(shù)據(jù)需是字符串,所以從Excel獲取的數(shù)據(jù)需要用str格式化 表格可能存在合并等其他情況,因此你看到的行數(shù)和列數(shù)可能不是真實(shí)的,需要用代碼不斷測(cè)試。 按照上面的辦法,將之前從Excel中取出來(lái)的數(shù)據(jù)一一填充到Word中對(duì)應(yīng)位置就大功告成!最后保存一下即可。 document.save(path+f'{title}.docx') print('n文件已生成')
結(jié)束語(yǔ)
回顧上面的過(guò)程,其實(shí)從需求和文件格式上看,這次文件的讀寫(xiě)解析任務(wù)較復(fù)雜,碼代碼和思考時(shí)間會(huì)較久,所以當(dāng)我們?cè)诳紤]使用Python進(jìn)行辦公自動(dòng)化之前需要想清楚這個(gè)問(wèn)題:這次需要完成的任務(wù)是否工作量很多,或者以后長(zhǎng)期需要進(jìn)行,用Python是否可以解放雙手?如果不是,實(shí)際上手動(dòng)就可以完成,那么就失去了自動(dòng)化辦公的意義!
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/128703.html
摘要:主要用來(lái)調(diào)用命令行,因?yàn)槟K無(wú)法解析的文件,所以在解析前將的文件轉(zhuǎn)換成文件。主要用于遍歷文件夾獲取文件??偨Y(jié)利用還是減少了一定的重復(fù)勞動(dòng),但面對(duì)一些不標(biāo)準(zhǔn)的東東貌似還沒(méi)有很好的方式。 目前我的文件夾中有500多份簡(jiǎn)歷,如果我想知道一些信息,比如學(xué)校,學(xué)歷之類(lèi)的,我需要打開(kāi)每一份word去查看,太耗時(shí)間了。這個(gè)時(shí)候python需要出馬了。 目標(biāo) 目前類(lèi)似截圖中的word有600+,想簡(jiǎn)單...
此篇文章主要是給大家介紹了Python辦公系統(tǒng)Word轉(zhuǎn)Excel文件批量編輯實(shí)例詳細(xì)說(shuō)明,感興趣的小伙伴可以參考借鑒一下,希望可以有一定的幫助,祝愿大家多多的發(fā)展,盡早漲薪?! ⌒蜓浴 ⌒』锇閭兒茫袢沼袀€(gè)公務(wù)員的小伙伴們授權(quán)委托我給他幫幫忙,應(yīng)該是有一份Word(因?yàn)樯婕暗轿臋n私秘因此原文中具體內(nèi)容已經(jīng)做了改動(dòng)) 一共有近2600條類(lèi)似格式的表格細(xì)欄,每個(gè)欄目包括的信息有: 日期 發(fā)...
摘要:特別注意當(dāng)用模式載入時(shí),跟都是對(duì)象??梢允褂幂d入已經(jīng)存在的表。我們的目的是從源表中提取信息并批量復(fù)制到目標(biāo)表中,所以我們首先定義一些變量。最后保存目標(biāo)就可以了。 現(xiàn)代生活中,我們很難不與excel表打交道,excel表有著易學(xué)易用的優(yōu)點(diǎn),只是當(dāng)表中數(shù)據(jù)量很大,我們又需要從其他表冊(cè)中復(fù)制粘貼一些數(shù)據(jù)(比如身份證號(hào))的時(shí)候,我們會(huì)越來(lái)越倦怠,畢竟我們不是機(jī)器,沒(méi)法長(zhǎng)時(shí)間做某種重復(fù)性的枯燥操...
摘要:意味著字符串必須以結(jié)束。匹配不在方括號(hào)內(nèi)的任意字符中轉(zhuǎn)義字符使用倒斜杠。你需要輸入轉(zhuǎn)義字符,才能打印出一個(gè)倒斜杠。但是,通過(guò)在字符串的第一個(gè)引號(hào)之前加上,可以將該字符串標(biāo)記為原始字符串,它不包括轉(zhuǎn)義字符。 每個(gè)英語(yǔ)學(xué)渣(好吧,其實(shí)這個(gè)說(shuō)的就是學(xué)渣本渣了♀)都有這樣一個(gè)夢(mèng)想: 能夠一邊輕松愉快地看著美劇,一邊自己的英語(yǔ)聽(tīng)力水平還能蹭蹭地往上漲 。知乎上也有很多人分享了自己通過(guò)美劇練習(xí)聽(tīng)力...
摘要:對(duì)于數(shù)據(jù)科學(xué)的研究可以說(shuō)已經(jīng)是本文我將介紹如何以文檔定義應(yīng)用的方式成為數(shù)據(jù)科學(xué)中的標(biāo)準(zhǔn)交付。參考前文解密的數(shù)據(jù)科學(xué)部門(mén)如果構(gòu)建知識(shí)倉(cāng)庫(kù),作為一個(gè)謝大大的死忠,我很自然選擇了作為我文檔輸出的首選工具。 showImg(https://segmentfault.com/img/remote/1460000006760433?w=423&h=426); 概述 隨著近年來(lái),Rstudio 通過(guò)...
閱讀 1068·2023-01-14 11:38
閱讀 1064·2023-01-14 11:04
閱讀 905·2023-01-14 10:48
閱讀 2380·2023-01-14 10:34
閱讀 1148·2023-01-14 10:24
閱讀 1027·2023-01-14 10:18
閱讀 656·2023-01-14 10:09
閱讀 734·2023-01-14 10:02