文章詳情頁
python該種情形下應該使用pickle還是csv
瀏覽:139日期:2022-07-01 10:52:25
問題描述
我手頭有許多個上百M的csv存儲一些數(shù)據(jù),需要經(jīng)常使用pandas和matplotlib對這些數(shù)據(jù)讀取并進行繪圖。在繪圖之前,通常要進行預處理,切片等等清洗操作,因為要經(jīng)常對figure進行交互操作和作報告,所以我在jupyter notebook中使用%matplotlib notebook進行操作和交互,我是將這些由原始數(shù)據(jù)產(chǎn)生的中間數(shù)據(jù)由csv保存,以便下次展示時直接讀取csv獲得中間數(shù)據(jù),還是使用pickle保存,后續(xù)使用時讀取pickle更快?
問題解答
回答1:肯定是csv安全啊,pickle似乎換一個python版本都可能導致讀取失敗的,這個不是通用格式。幾百兆的話,csv其實讀取速度不慢。更何況還有hdf5,這些才是正經(jīng)的數(shù)據(jù)交換格式。
回答2:csv夠用了,如果你覺得還不夠快可以試試hdf5文件
相關文章:
1. 怎么在phpstudy中用phpexcel上傳數(shù)據(jù)到MYSQL?2. javascript - 百度搜索網(wǎng)站,如何讓搜索結(jié)果顯示一張圖片加上一段描述,如圖;求教3. phpadmin的數(shù)據(jù)庫,可以設置自動變化時間的變量嗎?就是不需要接收時間數(shù)據(jù),自動變化4. html5和Flash對抗是什么情況?5. 求救一下,用新版的phpstudy,數(shù)據(jù)庫過段時間會消失是什么情況?6. html - 爬蟲時出現(xiàn)“DNS lookup failed”,打開網(wǎng)頁卻沒問題,這是什么情況?7. mac里的docker如何命令行開啟呢?8. boot2docker無法啟動9. 這是什么情況???10. gosts內(nèi)容是空的
排行榜

熱門標簽