當前位置:
首頁 > 知識 > 改善 Python 程序的 91 個建議

改善 Python 程序的 91 個建議

(點擊

上方公眾號

,可快速關注)




來源:

笑虎(Python愛好者,關注爬蟲、數據分析、數據挖掘、數據可視化等)


zhuanlan.zhihu.com/p/32817459


自己寫Python也有四五年了,一直是用自己的「強迫症」在維持自己代碼的質量,除了Google的Python代碼規範外,從來沒有讀過類似的書籍。偶然的機會看到這麼一本書,讀完之後覺得還不錯,所以做個簡單的筆記。有想學習類似知識的朋友,又懶得去讀完整本書籍,可以參考一下。


1:引論


建議1、理解Pythonic概念—-詳見Python中的《Python之禪》


建議2、編寫Pythonic代碼


(1)避免不規範代碼,比如只用大小寫區分變數、使用容易混淆的變數名、害怕過長變數名等。有時候長的變數名會使代碼更加具有可讀性。


(2)深入學習Python相關知識,比如語言特性、庫特性等,比如Python演變過程等。深入學習一兩個業內公認的Pythonic的代碼庫,比如Flask等。

建議3:理解Python與C的不同之處,比如縮進與{},單引號雙引號,三元操作符?,Switch-Case語句等。


建議4:在代碼中適當添加註釋


建議5:適當添加空行使代碼布局更加合理


建議6:編寫函數的4個原則


(1)函數設計要盡量短小,嵌套層次不宜過深

(2)函數聲明應該做到合理、簡單、易用


(3)函數參數設計應該考慮向下兼容


(4)一個函數只做一件事,盡量保證函數粒度的一致性


建議7:將常量集中在一個文件,且常量名盡量使用全大寫字母


2:編程慣用法


建議8:利用assert語句來發現問題,但要注意,斷言assert會影響效率


建議9:數據交換值時不推薦使用臨時變數,而是直接a, b = b, a


建議10:充分利用惰性計算(Lazy evaluation)的特性,從而避免不必要的計算


建議11:理解枚舉替代實現的缺陷(最新版Python中已經加入了枚舉特性)

建議12:不推薦使用type來進行類型檢查,因為有些時候type的結果並不一定可靠。如果有需求,建議使用isinstance函數來代替


建議13:盡量將變數轉化為浮點類型後再做除法(Python3以後不用考慮)


建議14:警惕eval()函數的安全漏洞,有點類似於SQL注入


建議15:使用enumerate()同時獲取序列迭代的索引和值


建議16:分清==和is的適用場景,特別是在比較字元串等不可變類型變數時(詳見評論)

建議17:盡量使用Unicode。在Python2中編碼是很讓人頭痛的一件事,但Python3就不用過多考慮了


建議18:構建合理的包層次來管理Module


3:基礎用法


建議19:有節制的使用from…import語句,防止污染命名空間


建議20:優先使用absolute import來導入模塊(Python3中已經移除了relative import)


建議21:i+=1不等於++i,在Python中,++i前邊的加號僅表示正,不表示操作


建議22:習慣使用with自動關閉資源,特別是在文件讀寫中


建議23:使用else子句簡化循環(異常處理)


建議24:遵循異常處理的幾點基本原則


(1)注意異常的粒度,try塊中盡量少寫代碼


(2)謹慎使用單獨的except語句,或except Exception語句,而是定位到具體異常


(3)注意異常捕獲的順序,在合適的層次處理異常


(4)使用更加友好的異常信息,遵守異常參數的規範


建議25:避免finally中可能發生的陷阱


建議26:深入理解None,正確判斷對象是否為空。Python中下列數據會判斷為空:



建議27:連接字元串應優先使用join函數,而不是+操作


建議28:格式化字元串時盡量使用.format函數,而不是%形式


建議29:區別對待可變對象和不可變對象,特別是作為函數參數時


建議30:[], {}和():一致的容器初始化形式。使用列表解析可以使代碼更清晰,同時效率更高


建議31:函數傳參數,既不是傳值也不是傳引用,而是傳對象或者說對象的引用


建議32:警惕默認參數潛在的問題,特別是當默認參數為可變對象時


建議33:函數中慎用變長參數args和*kargs


(1)這種使用太靈活,從而使得函數簽名不夠清晰,可讀性較差


(2)如果因為函數參數過多而是用變長參數簡化函數定義,那麼一般該函數可以重構


建議34:深入理解str()和repr()的區別


(1)兩者之間的目標不同:str主要面向客戶,其目的是可讀性,返回形式為用戶友好性和可讀性都比較高的字元串形式;而repr是面向Python解釋器或者說Python開發人員,其目的是準確性,其返回值表示Python解釋器內部的定義


(2)在解釋器中直接輸入變數,默認調用repr函數,而print(var)默認調用str函數


(3)repr函數的返回值一般可以用eval函數來還原對象


(4)兩者分別調用對象的內建函數

str__()和__repr

()


建議35:分清靜態方法staticmethod和類方法classmethod的使用場景


4:庫


建議36:掌握字元串的基本用法


建議37:按需選擇sort()和sorted()函數


》sort()是列表在就地進行排序,所以不能排序元組等不可變類型。


》sorted()可以排序任意的可迭代類型,同時不改變原變數本身。


建議38:使用copy模塊深拷貝對象,區分淺拷貝(shallow copy)和深拷貝(deep copy)


建議39:使用Counter進行計數統計,Counter是字典類的子類,在collections模塊中


建議40:深入掌握ConfigParser


建議41:使用argparse模塊處理命令行參數


建議42:使用pandas處理大型CSV文件


》Python本身提供一個CSV文件處理模塊,並提供reader、writer等函數。


》Pandas可提供分塊、合併處理等,適用於數據量大的情況,且對二維數據操作更方便。


建議43:使用ElementTree解析XML


建議44:理解模塊pickle的優劣


》優勢:介面簡單、各平台通用、支持的數據類型廣泛、擴展性強


》劣勢:不保證數據操作的原子性、存在安全問題、不同語言之間不兼容


建議45:序列化的另一個選擇JSON模塊:load和dump操作


建議46:使用traceback獲取棧信息


建議47:使用logging記錄日誌信息


建議48:使用threading模塊編寫多線程程序


建議49:使用Queue模塊使多線程編程更安全


5:設計模式


建議50:利用模塊實現單例模式


建議51:用mixin模式讓程序更加靈活


建議52:用發布-訂閱模式實現松耦合


建議53:用狀態模式美化代碼


6:內部機制


建議54:理解build-in對象


建議55:

init__()不是構造方法,理解__new

()與它之間的區別


建議56:理解變數的查找機制,即作用域


》局部作用域


》全局作用域


》嵌套作用域


》內置作用域


建議57:為什麼需要self參數


建議58:理解MRO(方法解析順序)與多繼承


建議59:理解描述符機制


建議60:區別

getattr__()與__getattribute

()方法之間的區別


建議61:使用更安全的property


建議62:掌握元類metaclass


建議63:熟悉Python對象協議



建議64:利用操作符重載實現中綴語法


建議65:熟悉Python的迭代器協議


建議66:熟悉Python的生成器


建議67:基於生成器的協程和greenlet,理解協程、多線程、多進程之間的區別


建議68:理解GIL的局限性


建議69:對象的管理和垃圾回收


7:使用工具輔助項目開發


建議70:從PyPI安裝第三方包


建議71:使用pip和yolk安裝、管理包


建議72:做paster創建包


建議73:理解單元測試的概念


建議74:為包編寫單元測試


建議75:利用測試驅動開發(TDD)提高代碼的可測性


建議76:使用Pylint檢查代碼風格


》代碼風格審查


》代碼錯誤檢查


》發現重複以及不合理的代碼,方便重構


》高度的可配置化和可定製化


》支持各種IDE和編輯器的集成


》能夠基於Python代碼生成UML圖


》能夠與Jenkins等持續集成工具相結合,支持自動代碼審查


建議77:進行高效的代碼審查


建議78:將包發布到PyPI


8:性能剖析與優化


建議79:了解代碼優化的基本原則


建議80:藉助性能優化工具


建議81:利用cProfile定位性能瓶頸


建議82:使用memory_profiler和objgraph剖析內存使用


建議83:努力降低演算法複雜度


建議84:掌握循環優化的基本技巧


》減少循環內部的計算


》將顯式循環改為隱式循環,當然這會犧牲代碼的可讀性


》在循環中盡量引用局部變數


》關注內層嵌套循環


建議85:使用生成器提高效率


建議86:使用不同的數據結構優化性能


建議87:充分利用set的優勢


建議88:使用multiprocessing模塊克服GIL缺陷


建議89:使用線程池提高效率


建議90:使用C/C++模塊擴展提高性能


建議91:使用Cythonb編寫擴展模塊




【關於投稿】




如果大家有原創好文投稿,請直接給公號發送留言。




① 留言格式:


【投稿】+《 文章標題》+ 文章鏈接

② 示例:


【投稿】《不要自稱是程序員,我十多年的 IT 職場總結》:


http://blog.jobbole.com/94148/

③ 最後請附上您的個人簡介哈~






看完本文有收穫?請轉

發分享給更多人


關注「P

ython開發者」,提升Python技能



喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Python開發者 的精彩文章:

面向對象:晚點遇見你,餘生都是你
使用 VS Code 進行 Python 編程

TAG:Python開發者 |