文章詳情頁(yè)

Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫(xiě)入excel文檔的操作

瀏覽：100日期：2022-07-05 18:38:14

我就廢話不多說(shuō)了，大家還是直接看代碼吧~

#!/usr/bin/python# -*- coding: utf-8 -*-import xlwtimport redef host_regex(dataline): host_regex = r'<host>(.*?)</host>' host = re.findall(host_regex, dataline) if host: return host[0]def ip_regex(dataline): ip_regex = r'<ip>(.*?)</ip>' ip = re.findall(ip_regex, dataline) if ip: return ip[0]with open('zbx_export_hosts.xml', 'r', encoding='utf8') as f: lines = f.readlines() alldatas = [] hostlist = [] iplist = [] for line in lines: host = host_regex(line) ip = ip_regex(line) if host is not None: hostlist.append(host) if ip is not None: iplist.append(ip) hosts_ip = [] # 構(gòu)造數(shù)據(jù)結(jié)構(gòu),形如：[[a,b],[c,d],...] multi_list = map(list, zip(hostlist, iplist)) for multi in multi_list: hosts_ip.append(multi) workbook = xlwt.Workbook() worksheet = workbook.add_sheet(’test’) # 關(guān)鍵代碼 for hi in enumerate(hosts_ip): for num in range(len(hi[1])): # 行、列、值 worksheet.write(hi[0], num, hi[1][num]) workbook.save(’excelwrite.xls’)

PS：其實(shí)有兩行代碼冗余，就不刪了！

補(bǔ)充知識(shí)：通過(guò)python寫(xiě)入xlsx大量數(shù)據(jù)問(wèn)題簡(jiǎn)述

以前批處理生成數(shù)據(jù)文件都是通過(guò)c程序直接按照逗號(hào)分隔方式寫(xiě)文本文件以csv保存的。但是由于有些處理的數(shù)據(jù)表直接給業(yè)務(wù)人員看，業(yè)務(wù)人員習(xí)慣使用xls，因此提了些需求改造，對(duì)于一些小于100w的數(shù)據(jù)均要求改為xlsx文件格式的報(bào)表。

考慮報(bào)表文件數(shù)據(jù)處理便捷，因此決定用python實(shí)現(xiàn)，最初使用了openpyxl庫(kù)，這個(gè)python庫(kù)擁有非常強(qiáng)大的xlsx的讀寫(xiě)api，能夠很方便的實(shí)現(xiàn)讀寫(xiě)。但是在實(shí)際使用中發(fā)現(xiàn)在處理較大行數(shù)的xlsx時(shí)，占用內(nèi)存非常嚴(yán)重，8個(gè)字段50w行數(shù)據(jù)在運(yùn)行中內(nèi)存高達(dá)10G，這不是我們應(yīng)用服務(wù)器能夠接受的范圍。

因此尋求改善，在網(wǎng)上了解后，發(fā)現(xiàn)創(chuàng)建xlsx表時(shí)，指定write_only參數(shù)是openpyxl提供的大數(shù)據(jù)寫(xiě)入解決方案，以下摘自官網(wǎng)范例，在選擇了此參數(shù)后，無(wú)法通過(guò)ws.cell(row=i, column=j).value = ？的方式復(fù)制，只能通過(guò)append的方式追加行。關(guān)于設(shè)置只寫(xiě)cell設(shè)置樣式，可以直接查看官網(wǎng)

>>> from openpyxl import Workbook>>> wb = Workbook(write_only=True)>>> ws = wb.create_sheet()>>>>>> # now we’ll fill it with 100 rows x 200 columns>>>>>> for irow in range(100):... ws.append([’%d’ % i for i in range(200)]) #可以先將一行的數(shù)據(jù)寫(xiě)在一個(gè)list中，直接ws.append(list)>>> # save the file>>> wb.save(’new_big_file.xlsx’) # doctest: +SKIP

不過(guò)僅僅按上述范例修改write_only跑數(shù)時(shí)發(fā)現(xiàn)內(nèi)存占用并沒(méi)有緩解，再仔細(xì)閱讀官網(wǎng)說(shuō)明時(shí)才發(fā)現(xiàn)這么一句話“When you want to dump large amounts of data make sure you have lxml installed.”原來(lái)在openpyxl安裝時(shí)，并沒(méi)有把lxml作為強(qiáng)依賴，只是一個(gè)可選包，然后查實(shí)發(fā)現(xiàn)確實(shí)服務(wù)器上并沒(méi)有安裝lxml包。

于是與為了解決這個(gè)問(wèn)題先在測(cè)試環(huán)境上安裝lxml，安裝過(guò)程也不是很順利。

首先先要裝libxml2以及l(fā)ibxslt，因?yàn)闆](méi)有root權(quán)限，均為源碼安裝，且只能安裝在用戶目錄。需要注意的是libxml2在安裝時(shí)需要--with-python=’python安裝目錄’，libxslt安裝的時(shí)候需要指定libxml2安裝目錄。

尤其最后的lxml安裝也是坑挺多的，主要是指定libxml2和libxslt，安裝lxml時(shí)先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ，再python3 setup.py install。

全部安裝完之后，確實(shí)openpyxl寫(xiě)xlsx不再增加內(nèi)存，先在tmp目錄一個(gè)臨時(shí)文件中寫(xiě)，待調(diào)用save方法時(shí)，保存到正式文件。

此外在這個(gè)問(wèn)題解決中，還了解到writexlsx庫(kù)也可以處理大文件xlsx的寫(xiě)入，并且安裝沒(méi)有這么多的依賴，其實(shí)還是非常推薦，也很簡(jiǎn)介，官網(wǎng)有介紹。

操作大文件時(shí)指定{’constant_memory’: True}即可。

filename = ’test.xlsx’wb = xlsxwriter.Workbook(filename, {’constant_memory’: True})ws = wb.add_worksheet(’大文件’)i = 0data= []data.append(’中文’)data.append(1323)data.append(’abc’)ws.write_row(i, 0, data)i = i + 1wb.close() #直接關(guān)閉即可，不需要額外save

以上這篇Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫(xiě)入excel文檔的操作就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持好吧啦網(wǎng)。

python

上一條：python各種excel寫(xiě)入方式的速度對(duì)比下一條：Python調(diào)用飛書(shū)發(fā)送消息的示例

相關(guān)文章：

1. 詳解盒子端CSS動(dòng)畫(huà)性能提升2. 利用CSS制作3D動(dòng)畫(huà)3. 關(guān)于Ajax跨域問(wèn)題及解決方案詳析4. asp知識(shí)整理筆記4（問(wèn)答模式）5. jsp實(shí)現(xiàn)登錄驗(yàn)證的過(guò)濾器6. ASP腳本組件實(shí)現(xiàn)服務(wù)器重啟7. asp.net core項(xiàng)目授權(quán)流程詳解8. jsp網(wǎng)頁(yè)實(shí)現(xiàn)貪吃蛇小游戲9. XHTML 1.0：標(biāo)記新的開(kāi)端10. XML入門(mén)的常見(jiàn)問(wèn)題(一)

排行榜

					
					利用CSS制作3D動(dòng)畫(huà)
爬取今日頭條Ajax請(qǐng)求
IntelliJ IDEA導(dǎo)入項(xiàng)目的方法
IntelliJ IDEA設(shè)置條件斷點(diǎn)的方法步驟
Docker開(kāi)啟遠(yuǎn)程安全訪問(wèn)的圖文教程詳解
notepad++運(yùn)行python腳本的操作方法
Eclipse新建項(xiàng)目不可選擇Java Project問(wèn)題解決方案
docker容器調(diào)用yum報(bào)錯(cuò)的解決辦法
asp.net core項(xiàng)目授權(quán)流程詳解
PHP對(duì)文本數(shù)據(jù)庫(kù)的基本操作方法
解決AJAX返回狀態(tài)200沒(méi)有調(diào)用success的問(wèn)題
				

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫(xiě)入excel文檔的操作