當前位置:
首頁 > 知識 > Python的51 個秘密曝光,Github獲2 萬星

Python的51 個秘密曝光,Github獲2 萬星

推薦 | 編程派公眾號(ID:codingpy)

Python,是一個設計優美的解釋型高級語言,它提供了很多能讓程序員感到舒適的功能特性。

但有的時候,Python一些特性導致的輸出結果,對於初學者就很難理解了。

一個解析51項堪稱是"秘密"的Python特性項目,在GitHub上徹底火了。

英文原版已經拿到了近15000星,中文翻譯版也獲得了7500 星。

項目中的部分內容,也許你聽說過,但依然可能會透露一些你所不知道的Python有趣特性。

我覺得這是學習編程語言內部原理的好機會,而且我相信你也會從中獲得樂趣!

如果你是一位經驗比較豐富的Python程序員,你可以試試能否一次就找到正確答案。

也許你對其中的一些例子比較熟悉,那這些案例能喚起你當年踩坑時的甜蜜回憶。

這個項目的中文版全文大約2萬字,乾貨多的快要溢出來了,大家可以先看一下目錄。

示例結構

所有示例的結構都如下所示:

我個人建議,最好依次閱讀下面的示例,並仔細閱讀設置例子最開始的代碼。

閱讀輸出結果

示例

微妙的字元串

1.

2.

3.

說明:

這些行為是由於 Cpython 在編譯優化時,某些情況下會嘗試使用已經存在的不可變對象,而不是每次都創建一個新對象。(這種行為被稱作字元串的駐留[string interning])

發生駐留之後,許多變數可能指向內存中的相同字元串對象。(從而節省內存)

在上面的代碼中,字元串是隱式駐留的。何時發生隱式駐留則取決於具體的實現。這裡有一些方法可以用來猜測字元串是否會被駐留:

所有長度為 0 和長度為 1 的字元串都被駐留。

字元串在編譯時被實現。("wtf" 將被駐留, 但是 "".join(["w", "t", "f"] 將不會被駐留)

字元串中只包含字母,數字或下劃線時將會駐留。所以 "wtf!" 由於包含!而未被駐留。可以在這裡找CPython對此規則的實現。

當在同一行將 a 和 b 的值設置為 "wtf!" 的時候, Python 解釋器會創建一個新對象, 然後同時引用第二個變數。

如果你在不同的行上進行賦值操作, 它就不會"知道"已經有一個 wtf!對象 (因為 "wtf!" 不是按照上面提到的方式被隱式駐留的)。

它是一種編譯器優化,特別適用於互動式環境。

常量摺疊(constant folding) 是 Python 中的一種窺孔優化(peephole optimization) 技術。

這意味著在編譯時表達式 "a"*20 會被替換為 "aaaaaaaaaaaaaaaaaaaa" 以減少運行時的時鐘周期。

只有長度小於 20 的字元串才會發生常量摺疊。(為啥? 想像一下由於表達式"a"10*10 而生成的 .pyc 文件的大小)相關的源碼:

https://github.com/python/cpython/blob/3.6/Python/peephole.c#L288

是時候來點蛋糕了!

1.

說明:

Python 字典通過檢查鍵值是否相等和比較哈希值來確定兩個鍵是否相同。

具有相同值的不可變對象在Python中始終具有相同的哈希值。

注意: 具有不同值的對象也可能具有相同的哈希值(哈希衝突)。

當執行 somedict5 = "Python" 語句時, 因為Python將 5 和 5.0 識別為 somedict 的同一個鍵, 所以已有值 "JavaScript" 就被 "Python" 覆蓋了。

到處返回!

說明:

當在 "try...finally" 語句的 try 中執行 return, break 或 continue 後, finally 子句依然會執行。

函數的返回值由最後執行的 return 語句決定。

由於 finally 子句一定會執行, 所以 finally 子句中的 return 將始終是最後執行的語句。

本質上,我們都一樣

說明:

當調用 id 函數時, Python 創建了一個 WTF 類的對象並傳給 id 函數。

然後 id 函數獲取其id值 (也就是內存地址), 然後丟棄該對象. 該對象就被銷毀了。

當我們連續兩次進行這個操作時, Python會將相同的內存地址分配給第二個對象。因為 (在CPython中) id 函數使用對象的內存地址作為對象的id值, 所以兩個對象的id值是相同的。

綜上, 對象的id值僅僅在對象的生命周期內唯一。在對象被銷毀之後, 或被創建之前, 其他對象可以具有相同的id值。

那為什麼 is 操作的結果為 False 呢? 讓我們看看這段代碼:

正如你所看到的, 對象銷毀的順序是造成所有不同之處的原因。

為什麼?

說明:

Python 語法 中對 for 的定義是:

其中 exprlist 指分配目標. 這意味著對可迭代對象中的每一項都會執行類似 = 的操作。

一個有趣的例子說明了這一點:

你可曾覺得這個循環只會運行一次?

說明:

由於循環在Python中工作方式, 賦值語句 i = 10 並不會影響迭代循環, 在每次迭代開始之前, 迭代器(這裡指 range(4)) 生成的下一個元素就被解包並賦值給目標列表的變數(這裡指 i)了。

在每次迭代中, enumerate(somestring) 函數就生成一個新值 i (計數器增加) 並從 somestring 中獲取一個字元。

然後將字典 some_dict 鍵 i (剛剛分配的) 的值設為該字元。本例中循環的展開可以簡化為:

執行時機差異

1.

2.

說明:

在生成器表達式中, in 子句在聲明時執行, 而條件子句則是在運行時執行。

所以在運行前, array 已經被重新賦值為 [2, 8, 22], 因此對於之前的 1, 8 和 15, 只有 count(8) 的結果是大於 0 的, 所以生成器只會生成 8。

第二部分中 g1 和 g2 的輸出差異則是由於變數 array1 和 array2 被重新賦值的方式導致的。

在第一種情況下, array_1 被綁定到新對象 [1,2,3,4,5], 因為 in 子句是在聲明時被執行的,所以它仍然引用舊對象 1,2,3,4。

在第二種情況下, 對 array_2 的切片賦值將相同的舊對象 [1,2,3,4] 原地更新為 [1,2,3,4,5]。

因此 g2 和 array_2 仍然引用同一個對象(這個對象現在已經更新為 [1,2,3,4,5])。

本文內容來自中文版項目,項目全文2萬多字,以及海量代碼。

因為篇幅原因,小七就只為大家展示這6個案例了,更多案例大家可以在項目中查看。

項目作者:Satwik Kansal

英文版項目名稱:wtfpython

中文版作者:慕晨

中文項目名稱:wtfpython-cn

因為平台規定,無法放鏈接。大家可以自行搜索。

回復下方「關鍵詞」,獲取優質資源

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 編程派 的精彩文章:

程序員寫作必備神器
程序員的日常,竟是這樣的!

TAG:編程派 |