文章詳情頁

Python 遍歷文件夾，統計所有不同后綴的文件數量與比例

瀏覽：124日期：2022-08-21 15:31:08

問題描述

在Github上經常看到項目里不同語言的占比，突然想寫一個試試。

自己寫完一個殘缺的，感覺肯定不是最優解，所以來請教大家的寫法。謝謝。

!/usr/bin/env pythoncoding:utf-8

import os

if name == ’__main__’:

work_space = os.getcwd()pycount = 0javacount = 0jscount = 0wecount = 0othercount = 0total = 0print work_spaceprint ’正在計算比例，請稍候.....’.decode(’utf-8’)for path, dir, file_arr in os.walk(’./’): for file_name in file_arr:javasuffix = file_name[-5:]pysuffix = file_name[-3:]if cmp(pysuffix, ’.py’) == 0: pycount += 1elif cmp(pysuffix, ’.js’) == 0: jscount += 1elif cmp(javasuffix, ’.java’) == 0: javacount += 1elif cmp(pysuffix, ’.we’) == 0: wecount += 1else: othercount += 1total = pycount + jscount + javacount + wecount + othercounttotal = float(total)print ’計算完成：總文件數 : %d ’.decode(’utf-8’) % totalprint ’文件數 Java: %d js: %d py: %d we: %d others: %d ’.decode(’utf-8’) % ( javacount, jscount, pycount, wecount, othercount)print ’所占比例 Java: %.2f%% js:%.2f%% py:%.2f%% we:%.2f%% others:%.2f%%’.decode(’utf-8’) % ( javacount / total * 100, jscount / total * 100, pycount / total * 100, wecount / total * 100, othercount / total * 100)

問題解答

回答1：

#coding: utf-8import osfrom itertools import groupbyfile_lst = []for path, dir, files in os.walk(’./’): file_lst += filesfile_count = len(file_lst) * 1.0for key, lst in groupby(file_lst, key=lambda x: os.path.splitext(x)[1]): print key, round(len(list(lst))/file_count, 2)

看第二種：

#coding: utf-8import osfrom collections import defaultdictfile_count = 1.0res = defaultdict()for path, dir, files in os.walk(’./’): file_count += len(files) for file in files:suf = os.path.splitext(file)[1]res[suf] = res.setdefault(suf, 0) + 1for k, v in res.iteritems(): print k, round(v/file_count, 4) * 100回答2：

改進后的

# coding: utf-8import osfrom itertools import groupbydef getpercent(num): return str(round(num / file_count * 100, 2))def getresult(): for key in language_dict:print ’%s count:%d percent:%s%%’ % (key, language_dict.get(key), getpercent(language_dict[key]))if __name__ == ’__main__’: file_lst = [] language_dict = {} for path, dirs, files in os.walk(’./’):file_lst += files file_count = len(file_lst) * 1.0 for key, lst in groupby(file_lst, key=lambda x: os.path.splitext(x)[1]):if key not in language_dict.keys(): language_dict[key] = len(list(lst))else: language_dict[key] = language_dict.get(key) + len(list(lst)) getresult()

Python 編程

上一條：python - pymysql操作數據庫成功，但為何檢查了數據庫那邊，數據沒有更新的？下一條：python - 為什么這段代碼沒有異常拋出？

排行榜

					
					javascript - nodejs log4js收集訪問者信息的問題
docker容器呢SSH為什么連不通呢？
docker images顯示的鏡像過多，狗眼被亮瞎了，怎么辦？
docker綁定了nginx端口 外部訪問不到
docker-compose 為何找不到配置文件？
mac里的docker如何命令行開啟呢？
html5 - 只用CSS如何實現input框的寬度隨框里輸入的內容長短自動適應？
html5 - Provisional headers are shown
python - uwsgi+django的搭建問題
javascript - 移動端上不能實現拖拽布局嗎？
html5 - H5 video 問題
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

Python 遍歷文件夾，統計所有不同后綴的文件數量與比例