Python 源碼閱讀：dict

知識 10-12

（點擊

上方藍字

，快速關注我們）

來源：伯樂在線 - wklken

如有好文章投稿，請點擊 → 這裡了解詳情

源碼位置 Include/dictobject.h | Objects/dictobject.c

PyDictObject的存儲策略

使用散列表進行存儲

使用開放定址法處理衝突

2.1

插入

發生衝突

通過二次探測演算法

尋找下一個位置

直到找到可用位置

放入

(

形成一條衝突探測鏈

)

2.2

查找

需要遍歷衝突探測鏈

2.3

刪除

如果對象在探測鏈上

不能直接刪除

否則會破壞整個結構

(

所以不是真的刪

)

關於 hash表的 wiki

基本鍵值PyDictEntry

typedef

struct

{

Py_ssize_t

me_hash

;

PyObject *

me_key

;

PyObject *

me_value

;

}

PyDictEntry

;

說明

PyDictEntry

用於存儲鍵值對信息

Py_ssize_t

hash

存儲了

key計算得到的

hash

值

不重複計算

結構

PyDictEntry的三個狀態(圖片引自-Python源碼剖析)

PyDictObject定義

定義

typedef

struct

_dictobject

PyDictObject

;

struct

_dictobject

{

PyObject_HEAD

Py_ssize_t

ma_fill

;

Py_ssize_t

ma_used

;

Py_ssize_t

ma_mask

;

PyDictEntry *

ma_table

;

PyDictEntry *

(

ma_lookup

)(

PyDictObject *

PyObject *

key

long

hash

);

PyDictEntry

ma_smalltable

[

PyDict_MINSIZE

];

};

說明

PyObject

HEAD

反而聲明為定長對象

因為

size在這裡用不上

使用

fill和

used計數

Py_ssize_t

ma_fill

;

Py_ssize_t

ma_used

;

ma_fill

# Active + # Dummy

ma_used

# Active

Py_ssize_t

ma_mask

;

散列表

entry

容量

ma_mask

初始值

ma_mask

PyDict_MINSIZE

ma_mask

# Unused + # Active + # Dummy

PyDictEntry *

ma_table

;

指向散列表內存

如果是小的

dict

(

entry

數量

結構

結論

PyDictObject

在生命周期內

需要維護

ma_fill

ma_used

mask

三個計數值

初始化創建是

ma_smalltable

超過大小後

會使用外部分配的空間

構造過程

定義

PyObject *

PyDict_New

(

void

)

{

;

// 初始化dummy

(

dummy

NULL

)

{

dummy

PyString_FromString

(

);

(

dummy

NULL

)

return

NULL

;

// 暫時忽略

#ifdef SHOW_CONVERSION_COUNTS

Py_AtExit

(

show_counts

);

#endif

#ifdef SHOW_ALLOC_COUNT

Py_AtExit

(

show_alloc

);

#endif

#ifdef SHOW_TRACK_COUNT

Py_AtExit

(

show_track

);

#endif

}

// 如果PyDictObject緩衝池可用

(

numfree

)

{

// 取緩衝池最後一個可用對象

free_list

[

numfree

];

assert

(

NULL

);

assert

(

Py_TYPE

(

)

== &

PyDict_Type

);

_Py_NewReference

((

PyObject *

)

);

// 初始化

(

ma_fill

)

{

// 1. 清空 ma_smalltable

// 2. ma_used = ma_fill = 0

// 3. ma_table -> ma_smalltable

// 4. ma_mask = PyDict_MINSIZE - 1 = 7

EMPTY_TO_MINSIZE

(

);

}

else

{

// 1. ma_table -> ma_smalltable

// 2. ma_mask = PyDict_MINSIZE - 1 = 7

INIT_NONZERO_DICT_SLOTS

(

);

}

assert

(

ma_used

);

assert

(

ma_table

ma_smalltable

);

assert

(

ma_mask

PyDict_MINSIZE

);

#ifdef SHOW_ALLOC_COUNT

count_reuse

;

#endif

}

else

{

// 創建一個

PyObject_GC_New

(

PyDictObject

PyDict_Type

);

(

NULL

)

return

NULL

;

// 初始化 1/2/3/4

EMPTY_TO_MINSIZE

(

);

#ifdef SHOW_ALLOC_COUNT

count_alloc

;

#endif

}

// 搜索方法, 關注這個

ma_lookup

lookdict_string

;

#ifdef SHOW_TRACK_COUNT

count_untracked

;

#endif

#ifdef SHOW_CONVERSION_COUNTS

created

;

#endif

// 返回

return

(

PyObject *

)

;

}

簡化步驟

如果

PyDictObject

對象緩衝池有

從裡面直接取

初始化

否則

創建一個

初始化

關聯搜索方法

lookdict

string

結論

關注對象緩衝池

關注

lookdict_string

銷毀過程

方法定義

static

void

dict_dealloc

(

)

{

;

Py_ssize_t

fill

ma_fill

;

PyObject_GC_UnTrack

(

);

Py_TRASHCAN_SAFE_BEGIN

(

)

// 遍歷銷毀ma_table中元素 (ma_table可能指向small_table 或外部)

for

(

ma_table

;

fill

;

)

{

(

me_key

)

{

fill

;

Py_DECREF

(

me_key

);

Py_XDECREF

(

me_value

);

}

// 如果指向外部, 銷毀整個(上面一步只銷毀內部元素)

(

ma_table

ma_smalltable

)

PyMem_DEL

(

ma_table

);

// 如果對象緩衝池未滿且是PyDict_Type, 放入

(

numfree tp_free

((

PyObject *

)

);

Py_TRASHCAN_SAFE_END

(

)

}

PyDictObject對象緩衝池

定義

#ifndef PyDict_MAXFREELIST

#define PyDict_MAXFREELIST 80

#endif

static

PyDictObject *

free_list

[

PyDict_MAXFREELIST

];

static

int

numfree

;

對象緩衝池的結構(跟PyListObject對象緩衝池結構基本一樣)

結論

最多會緩存

個對象

只緩存

PyDictObject

本身

其

PyDictEntry

全部會被回收

緩存對象進去

舊有的值沒有變化

取出來用的時候初始化時才改變

本系列

《Python 源碼閱讀：類型》

《Python 源碼閱讀：對象》

《Python 源碼閱讀：String》

《Python 源碼閱讀：int》

《Python 源碼閱讀：list》

《Python 源碼閱讀：tuple》

看完本文有收穫？請轉

發分享給更多人

關注「P

ython開發者」，提升Python技能

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Python開發者 的精彩文章:

※Python 源碼閱讀：tuple
※Flask 中模塊化應用的實現
※編程零基礎，如何變身年薪百萬的機器學習工程師？
※讓你的 Python 代碼優雅又地道，15篇 Python 技術熱文

TAG:Python開發者 |