程序員必知的 Python 陷阱與缺陷列表

知識 08-04

（點擊

上方藍字

，快速關注我們）

來源：xybaby

www.cnblogs.com/xybaby/p/7183854.html

如有好文章投稿，請點擊 → 這裡了解詳情

我個人對陷阱的定義是這樣的：代碼看起來可以工作，但不是以你「想當然「」的方式。如果一段代碼直接出錯，拋出了異常，我不認為這是陷阱。比如，Python程序員應該都遇到過的「UnboundLocalError」, 示例：

>>>

def

func

()

...

>>>

func

()

Traceback

(

most recent call

last

)

File

"<stdin>"

line

module

File

"<stdin>"

line

func

UnboundLocalError

local

variable

"a"

referenced before

assignment

對於「UnboundLocalError」,還有更高級的版本：

import

random

def

func

(

)

random

()

else

import

random

randint

(

)

return

func

(

True

)

# UnboundLocalError: local variable "random" referenced before assignment

可能對於很多python新手來說，這個Error讓人摸不著頭腦。但我認為這不算陷阱，因為這段代碼一定會報錯，而不是默默的以錯誤的方式運行。不怕真小人，就怕偽君子。我認為缺陷就好比偽君子。

那麼Python中哪些真正算得上陷阱呢？

第一：以mutable對象作為默認參數

這個估計是最廣為人知的了，Python和其他很多語言一樣，提供了默認參數，默認參數確實是個好東西，可以讓函數調用者忽略一些細節（比如GUI編程，Tkinter，QT），對於lambda表達式也非常有用。但是如果使用了可變對象作為默認參數，那麼事情就不那麼愉快了。

>>>

def

(

lst

[])

...

lst

append

(

)

...

return

lst

...

>>>

()

[

]

>>>

()

[

]

驚喜不驚喜？！究其原因，python中一切都是對象，函數也不列外，默認參數只是函數的一個屬性。而默認參數在函數定義的時候已經求值了。

　　Default parameter values are evaluated when the function definition is executed.

stackoverflow上有一個更適當的例子來說明默認參數是在定義的時候求值，而不是調用的時候。　

>>>

import

time

>>>

def

report

(

when

time

())

...

return

when

...

>>>

report

()

1500113234.487932

>>>

report

()

1500113234.487932

python docoment 給出了標準的解決辦法：

　　A way around this is to use None as the default, and explicitly test for it in the body of the function

>>>

def

report

(

when

None

)

...

when

None

...

when

time

()

...

return

when

...

>>>

report

()

1500113446.746997

>>>

report

()

1500113448.552873

第二: x += y vs x = x + y

一般來說，二者是等價的，至少看起來是等價的（這也是陷阱的定義 — 看起來都OK，但不一定正確）。

>>>

;

>>>

;

>>>

[

];

[

];

[

]

>>>

[

];

[

];

[

]

呃，被光速打臉了？

>>>

[

];

(

);

[

];

(

)

4357132800

4357132728

>>>

[

];

(

);

[

];

(

)

4357132800

前者x指向一個新的對象，後者x在原來的對象是修改，當然，那種效果是正確的取決於應用場景。至少，得知道，二者有時候並不一樣

第三，神奇的小括弧–()

小括弧（parenthese）在各種編程語言中都有廣泛的應用，python中，小括弧還能表示元組（tuple）這一數據類型, 元組是immutable的序列。

>>>

(

)

>>>

type

(

)

type

"tuple"

>>>

type

(())

type

"tuple"

但如果只有一個元素呢

>>>

(

)

>>>

type

(

)

type

"int"

神奇不神奇，如果要表示只有一個元素的元組，正確的姿勢是:

>>>

(

>>>

type

(

)

type

"tuple"

第四：生成一個元素是列表的列表

這個有點像二維數組，當然生成一個元素是字典的列表也是可以的，

更通俗的說，生成一個元素是可變對象的序列

很簡單嘛：

>>>

[[]]

>>>

[[],

[],

[]]

>>>

[

append

(

)

>>>

[

]

[

]

看起來很不錯，簡單明了，but

>>>

[

]

[

]

>>>

[[

[

]]

我猜，這應該不是你預期的結果吧，究其原因，還是因為python中list是可變對象，上述的寫法大家都指向的同一個可變對象，正確的姿勢

>>>

[[]

for

xrange

(

)]

>>>

[

append

(

)

>>>

[[

[],

[]]

第五，在訪問列表的時候，修改列表

列表（list）在python中使用非常廣泛，當然經常會在訪問列表的時候增加或者刪除一些元素。比如，下面這個函數，試圖刪掉列表中為3的倍數的元素：

>>>

def

modify_lst

(

lst

)

...

for

idx

elem

enumerate

(

lst

)

...

elem

...

del

lst

[

idx

]

測試一下，

>>>

lst

[

]

>>>

modify_lst

(

lst

)

>>>

lst

[

]

好像沒什麼錯，不過這只是運氣好

>>>

lst

[

]

>>>

modify_lst

(

lst

)

>>>

lst

[

]

上面的例子中，6這個元素就沒有被刪除。如果在modify_lst函數中print idx， item就可以發現端倪：lst在變短，但idx是遞增的，所以在上面出錯的例子中，當3被刪除之後，6變成了lst的第2個元素（從0開始）。在C++中，如果遍歷容器的時候用迭代器刪除元素，也會有同樣的問題。

如果邏輯比較簡單，使用list comprehension是不錯的注意

第六，閉包與lambda

這個也是老生長談的例子，在其他語言也有類似的情況。先看一個例子:

>>>

def

create_multipliers

()

...

return

[

lambda

for

range

(

)]

...

>>>

for

multiplier

create_multipliers

()

...

multiplier

(

)

...

create_multipliers函數的返回值時一個列表，列表的每一個元素都是一個函數－－將輸入參數x乘以一個倍數i的函數。預期的結果時0，2，4，6，8. 但結果是5個8，意外不意外。

由於出現這個陷阱的時候經常使用了lambda，所以可能會認為是lambda的問題，但lambda表示不願意背這個鍋。問題的本質在與python中的屬性查找規則，LEGB（local，enclousing，global，bulitin），在上面的例子中，i就是在閉包作用域（enclousing），而Python的閉包是遲綁定，這意味著閉包中用到的變數的值，是在內部函數被調用時查詢得到的。

解決辦法也很簡單，那就是變閉包作用域為局部作用域。

>>>

def

create_multipliers

()

...

return

[

lambda

for

range

(

)]

...

第七，定義__del__

大多數計算機專業的同學可能都是先學的C、C++，構造、析構函數的概念應該都非常熟。於是，當切換到python的時候，自然也想知道有沒有相應的函數。比如，在C++中非常有名的RAII，即通過構造、析構來管理資源（如內存、文件描述符）的聲明周期。那在python中要達到同樣的效果怎麼做呢，即需要找到一個對象在銷毀的時候一定會調用的函數，於是發現了__init__, __del__函數，可能簡單寫了兩個例子發現確實也能工作。但事實上可能掉進了一個陷阱，在python documnet是有描述的：

　　Circular references which are garbage are detected when the option cycle detector is enabled (it』s on by default), but can only be cleaned up if there are no Python-level __del__() methods involved.

簡單來說，如果在循環引用中的對象定義了__del__,那麼python gc不能進行回收，因此，存在內存泄漏的風險

第八，不同的姿勢import同一個module

示例在stackoverflow的例子上稍作修改，假設現在有一個package叫mypackage，裡面包含三個python文件：mymodule.py, main.py, __init__.py。mymodule.py代碼如下：

[]

class

(

object

)

pass

main.py代碼如下：

def

add

(

)

from

mypackage

import

mymodule

append

(

)

"updated list"

mymodule

(

mymodule

)

def

get

()

import

mymodule

"module in get"

(

mymodule

)

return

mymodule

__name__

"__main__"

import

sys

path

append

(

"../"

)

add

(

)

ret

get

()

"lets check"

ret

運行python main.py，結果如下：

updated list [1] 4406700752

module in get 4406700920

lets check []

從運行結果可以看到，在add 和 get函數中import的mymodule不是同一個module，ID不同。當然，在python2.7.10中，需要main.py的第13行才能出現這樣的效果。你可能會問，誰會寫出第13行這樣的代碼呢？事實上，在很多項目中，為了import的時候方便，會往sys.path加入一堆路徑。那麼在項目中，大家同意一種import方式就非常有必要了

第九，python升級

python3.x並不向後兼容，所以如果從2.x升級到3.x的時候得小心了，下面列舉兩點：

在python2.7中，range的返回值是一個列表；而在python3.x中，返回的是一個range對象。

map()、filter()、 dict.items()在python2.7返回列表，而在3.x中返回迭代器。當然迭代器大多數都是比較好的選擇，更加pythonic，但是也有缺點，就是只能遍歷一次。在instagram的分享中，也提到因為這個導致的一個坑爹的bug。

第十，gil

以GIL結尾，因為gil是Python中大家公認的缺陷！

從其他語言過來的同學可能看到python用threading模塊，拿過來就用，結果發現效果不對啊，然後就會噴，什麼鬼。

總結：

毫無疑問的說，python是非常容易上手，也非常強大的一門語言。python非常靈活，可定製化很強。同時，也存在一些陷阱，搞清楚這些陷阱能夠更好的掌握、使用這麼語言。本文列舉了一些python中的一些缺陷，這是一份不完全列表，歡迎大家補充。

看完本文有收穫？請轉

發分享給更多人

關注「P