Python3標(biāo)準(zhǔn)庫(kù)glob文件名模式匹配的問題
1. glob文件名模式匹配
盡管glob API很小,但這個(gè)模塊的功能卻很強(qiáng)大。只要程序需要查找文件系統(tǒng)中名字與某個(gè)模式匹配的一組文件,就可以使用這個(gè)模塊。要?jiǎng)?chuàng)建一個(gè)文件名列表,要求其中各個(gè)文件名都有某個(gè)特定的擴(kuò)展名、前綴或者中間都有某個(gè)共同的字符串,就可以使用glob而不用編寫定制代碼來掃描目錄內(nèi)容。
glob的模式規(guī)則與re模塊使用的正則表達(dá)式并不相同。實(shí)際上,glob的模式遵循標(biāo)準(zhǔn)UNIX路徑擴(kuò)展規(guī)則。只使用幾個(gè)特殊字符來實(shí)現(xiàn)兩個(gè)不同的通配符和字符區(qū)間。模式規(guī)則應(yīng)用于文件名中的段(在路徑分隔符/處截止)。
1.1 實(shí)例數(shù)據(jù)
本節(jié)中的示例假定當(dāng)前工作目錄中存在以下測(cè)試文件。
test_filestest_files/file.txttest_files/file1.txttest_files/file2.txttest_files/filea.txttest_files/fileb.txttest_files/subfilestest_files/subfiles/subfile.txt
如果這些文件不存在,請(qǐng)glob_maketestdata.py在運(yùn)行以下示例之前使用示例代碼創(chuàng)建它們。
1.2 通配符
星號(hào)(*)匹配一個(gè)文件名段中的0個(gè)或多個(gè)字符。例如,test_files/*。
import globfor name in sorted(glob.glob(’test_files/*’)): print(name)
這個(gè)模式會(huì)匹配目錄test_files中的所有路徑名(文件或目錄),但不會(huì)進(jìn)一步遞歸搜索到子目錄。glob()返回的數(shù)據(jù)不會(huì)排序,所以這里的實(shí)例會(huì)進(jìn)行排序以便研究結(jié)果。
要列出子目錄中的文件,必須把子目錄包含在模式中。
import globprint(’Named explicitly:’)for name in sorted(glob.glob(’test_files/subfiles/*’)): print(’ {}’.format(name))print(’Named with wildcard:’)for name in sorted(glob.glob(’test_files/*/*’)): print(’ {}’.format(name))
前面顯示的第一種情況顯式列出了子目錄名,第二種情況則依賴一個(gè)通配符來查找目錄。
在這里,兩種做法的結(jié)果是一樣的。如果還有另一個(gè)子目錄,則通配符會(huì)匹配這兩個(gè)子目錄,并且兩個(gè)子目錄中的文件名都會(huì)出現(xiàn)在結(jié)果中。
1.3 單字符通配符
問號(hào)(?)也是一個(gè)通配符。它會(huì)匹配文件名中該位置的單個(gè)字符。
import globfor name in sorted(glob.glob(’test_files/file?.txt’)): print(name)
前面的例子會(huì)匹配以file開頭,然后是另外一個(gè)任意字符,最后以.txt結(jié)尾的所有文件名。
1.4 字符區(qū)間
如果使用字符區(qū)間([a-z])而不是問號(hào),則可以匹配多個(gè)字符中的一個(gè)字符。下面這個(gè)例子會(huì)查找名字中擴(kuò)展名前有一個(gè)數(shù)字的所有文件。
import globfor name in sorted(glob.glob(’test_files/*[0-9].*’)): print(name)
字符區(qū)間[0-9]會(huì)匹配所有單個(gè)數(shù)字。區(qū)間根據(jù)各字母/數(shù)字的字符碼排序,短橫線指示連續(xù)字符組成的一個(gè)不間斷區(qū)間。這個(gè)區(qū)間值也可以寫為[0123456789]。
1.5 轉(zhuǎn)義元字符
有時(shí)有必要搜索名字中包含一些特殊元字符的文件,glob使用這些特殊元字符表示模式。escape()函數(shù)會(huì)建立一個(gè)適合的模式,其中的特殊字符會(huì)被“轉(zhuǎn)義”,使它們不會(huì)被glob擴(kuò)展或解釋為特殊字符。
import globspecials = ’?*[’for char in specials: pattern = ’test_files/*’ + glob.escape(char) + ’.txt’ print(’Searching for: {!r}’.format(pattern)) for name in sorted(glob.glob(pattern)): print(name) print()
可以通過構(gòu)建一個(gè)包含單個(gè)元素的字符區(qū)間來轉(zhuǎn)義各個(gè)特殊字符。
總結(jié)
到此這篇關(guān)于Python3標(biāo)準(zhǔn)庫(kù)glob文件名模式匹配的問題的文章就介紹到這了,更多相關(guān)python glob 文件名匹配內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. XML入門的常見問題(三)2. .NET Core 分布式任務(wù)調(diào)度ScheduleMaster詳解3. 不要在HTML中濫用div4. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)5. CSS清除浮動(dòng)方法匯總6. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說明(學(xué)習(xí))7. XML在語(yǔ)音合成中的應(yīng)用8. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)9. XML 非法字符(轉(zhuǎn)義字符)10. jscript與vbscript 操作XML元素屬性的代碼
