国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python3.x - 求助python下高效且支持大數(shù)據(jù)量的database2excel方案

瀏覽:111日期:2022-09-02 14:05:47

問(wèn)題描述

大家好。小弟目前需要一個(gè)速度較好,且支持大數(shù)據(jù)量的數(shù)據(jù)庫(kù)導(dǎo)出至excel(xlsx)的方案小弟的機(jī)器配置不高,4核的CPU,可用內(nèi)存在8G左右(不過(guò)是虛擬機(jī),可能性能實(shí)際還要低一點(diǎn))小弟之前嘗試過(guò)以下幾種方案openpyxl:大數(shù)據(jù)量情況下經(jīng)常會(huì)吃光內(nèi)存。實(shí)驗(yàn)生成100W條/每條6個(gè)字段的數(shù)據(jù),經(jīng)常會(huì)把小弟這8G內(nèi)存吃滿。生成excel時(shí)間大概在10分鐘~11分鐘左右pyexcel_xlsx:貌似這部分引用的還是openpyxl的東東…不過(guò)貌似有一定的優(yōu)化,生成生成100W條/每條6個(gè)字段的數(shù)據(jù),消耗內(nèi)存近3G,時(shí)間在8分半左右

這兩個(gè)方案效率都非常低,而且小弟目前都沒(méi)有找到中途將內(nèi)存寫入文件的方法…

請(qǐng)各位大大指點(diǎn),是否還有其他的方案,最好是能夠控制單次寫入條數(shù),例如每寫入5W條,進(jìn)行一次提交,將內(nèi)存的東東寫在文件中并釋放內(nèi)存,再繼續(xù)寫入這樣的。(這樣也許可以考慮配合多線程來(lái)進(jìn)行并行寫入,加快效率…)謝謝各位了

問(wèn)題解答

回答1:

pandas有分塊讀取的功能,關(guān)鍵詞chunksizedf = pd.read_csv('xxxx',chunksize=10000)可以去研究下文檔:http://pandas.pydata.org/pand...

標(biāo)簽: python
相關(guān)文章:
主站蜘蛛池模板: 勃利县| 克什克腾旗| 衡水市| 安徽省| 永寿县| 平潭县| 中阳县| 鹤山市| 六盘水市| 中方县| 饶平县| 临潭县| 客服| 会理县| 大埔区| 九寨沟县| 吉林省| 濮阳县| 阳城县| 嘉兴市| 甘孜县| 丰县| 新野县| 漾濞| 辉县市| 达孜县| 铁岭县| 长宁区| 台中市| 达日县| 乌兰县| 舞阳县| 梁山县| 呼图壁县| 普兰县| 永顺县| 杂多县| 新巴尔虎右旗| 新龙县| 突泉县| 怀化市|