Python小技巧:3個處理文件路徑的簡單方法
原標題 |Python 3 Quick Tip: The easy way to deal with file paths on Windows, Mac and Linux
作者 |Adam Geitgey
譯者 | 林肯二百一十三(西安交通大學)、Dooria
幾乎所有計算機在文件夾名稱間使用的都是正斜杠,但微軟Windows使用的是卻反斜杠, 這不免造成了編程的一個小煩惱。
這是1980年代早期,計算機史上的一個意外。MS-DOS的第一個版本使用正斜杠來指定命令行選項。當微軟在MS-DOS2.0中增加對文件夾的支持時,因為正斜杠已經被使用了,所以使用反斜杠代替。三十五年後,這種不兼容仍舊困擾著我們。
如果希望你的Python代碼能夠同時在Windows和Mac/Linux上運行,你需要解決這類平台的特定問題。幸運的是,Python3的新模塊pathlib可以使文件操作變得更簡單。
以下是一些使用pathlib處理文件名的方法,它可以使命名操作變得簡單得多。
錯誤的方法:手工構建文件路徑
假設現在你有一個數據包,其中包含了你的Python項目里需要的文件。
下面是錯誤的代碼:
請注意,因為是在Mac平台上,我使用了Unix風格的正斜杠硬編碼路徑。這會讓Windows用戶非常頭疼。
從技術上講,這個代碼在Windows上也能運行,因為Python會在調用open()函數時識別出任何一種斜杠。即便如此,你也不應該依賴它。不是所有的python庫都可以在錯誤的操作系統上使用錯誤的斜杠,特別是當它們有外部程序或庫介面時。
並且,Python對混合斜杠類型的支持僅限Windows,它無法反向工作。也就是說,代碼中的反斜杠將在Mac上完全失效。
出於上述原因以及其他更多的原因,使用硬編碼的路徑字元串編寫代碼會被其他程序員diss的,應該盡量避免。
老方法:Python的os.path模塊
Python的os.path模塊提供了很多有用的工具以幫助我們處理這些面向特定操作系統的文件系統問題。
上面的代碼在Windows和Mac都能有效工作——但問題就是用起來很讓人頭大。每次調用os.path.join()把路徑中的每一部分作為一個獨立的字元串參數傳進去的辦法實在太麻煩了。
新方法:Python 3 的 pathlib!
Python 3.4 引入了一個用於處理文件和路徑的新標準庫——pathlib,而且很好用!
要用pathlib,只要新建一個Path()對象並傳入使用正斜杠的路徑或文件名,剩下的pathlib都幫你搞定:
請注意兩點:
在pathlib中請直接用正斜杠(「/」)。Path對象可以將正斜杠轉換成當前操作系統應該使用的正確斜杠。Nice!
如果想在某個Path對象後添加內容,只要在代碼里使用「/」操作符(也就是除號!?)。跟一遍又一遍地敲os.path.join(a, b)的日子說拜拜吧!
如果這就是pathlib做的事情,那它可真是Python的一個不錯的補充——但它做的其實更多呢~
比如,我們可以不用調用open()或者close()之類的函數,而直接讀文件的內容:
註:上上部分的例子是有bug的,因為讀取的文件沒有關閉。但這裡的語句則完全避免了這個問題!
pathlib還把最標準的文件操作變得簡單易用:
你甚至可以用pathlib來將一個Unix系統的路徑轉換成Windows格式的路徑:
如果你非 得 用反斜杠還想不出問題呢?好吧……你可以把你的路徑聲明成Windows格式的,這樣pathlib在其他操作系統中依然能把它轉換成合適的形式:
如果你還想再6一點?你甚至可以用pathlib來解析文件的相關路徑,解析網路共享路徑或者生成"file://"格式的URL。下邊的例子用四行代碼(其中兩行還是import)做到了用你的Web瀏覽器打開一個本地文件:
而這也不過是pathlib的一個小功能而已。pathlib足以替代散落在Python各種模塊中的文件相關功能。看看文檔,試一下吧~
感謝您的閱讀!如果您對機器學習感興趣(或者只是想理解它究竟是個什麼),請查看我的有趣的機器學習系列,或在Twitter關注我@ageitgey以及在LinkedIn找到我。
本文編輯:Pita
英語原文:https://medium.com/@ageitgey/python-3-quick-tip-the-easy-way-to-deal-with-file-paths-on-windows-mac-and-linux-11a072b58d5f


※2019 年中 AI 大勢盤點
※2019 世界人工智慧大會倒計時 30 天合作夥伴發布暨志願者授旗儀式在滬舉辦
TAG:AI研習社 |