Tensorflow 2.0的這些新設計,你適應好了嗎?
新智元報道
來源:論智
作者:Bot
【新智元導讀】幾天前,Tensorflow剛度過自己的3歲生日,作為當前最受歡迎的機器學習框架,Tensorflow在這個寶座上已經盤踞了近三年。無論是成熟的Keras,還是風頭正盛的pytorch,它的地位似乎總是無法被撼動。而就在即將到來的2019年,Tensorflow 2.0將正式入場,給暗流涌動的框架之爭再燃一把火。
如果說兩代Tensorflow有什麼根本不同,那應該就是Tensorflow 2.0更注重使用的低門檻,旨在讓每個人都能應用機器學習技術。考慮到它可能會成為機器學習框架的又一個重要里程碑,本文會介紹1.x和2.x版本之間的所有(已知)差異,重點關注它們之間的思維模式變化和利弊關係。
通過閱讀這篇文章,熟悉Tensorflow的老用戶可以儘早轉變思維,適應新版本的變化。而新手也可以直接以Tensorflow 2.0的方式思考,至少目前沒有必要急著去學習別的框架。
Tensorflow 2.0:為什麼?何時?
Tensorflow 2.0的開發初衷是製作一個更簡單易用的Tensorflow。
第一個向公眾透露項目具體開發內容的人是Google Brain的工程師Martin Wicke,我們可以在他的公告郵件列表裡找到Tensorflow 2.0的蛛絲馬跡。在這裡,我們對它做一些簡單提要:
Tensorflow 2.0的核心功能是動態圖機制Eager execution。它允許用戶像正常程序一樣去編寫、調試模型,使TensorFlow更易於學習和應用。
支持更多平台、更多語言,通過標準化API的交換格式和提供準線改善這些組件之間的兼容性。
刪除已棄用的API並減少重複的API數,避免給用戶造成混淆。
2.0版的設計對公眾開放:社區可以和Tensorflow開發人員一起工作,共同探討新功能。
兼容性和連續性:Tensorflow 2.0會提供Tensorflow 1.x的兼容性模塊,也就是它會內置所有Tensorflow 1.x API的模塊。
硬碟兼容性:只需修改一些變數名稱,Tensorflow 1.x中導出的模型(checkpoints和模型freeze)就能和Tensorflow 2.0兼容。
退出歷史舞台。其中有維護價值的模塊會被移動到別的地方,剩餘的都將被刪除。
換言之,如果你在這之前從沒接觸過Tensorflow,你是幸運的。但是,如果你和我們一樣是從0.x版本用起的,那麼你就可能得重寫所有代碼庫——雖然官方說會發布轉換工具方便老用戶,但這種工具肯定有很多bug,需要一定的手動干預。
而且,你也必須開始轉變思維模式。這做起來不容易,但真的猛士不就應該喜歡挑戰嗎?
所以為了應對挑戰,我們先來適應第一個巨大差異:移除,,,強制轉型到基於Keras的方法,也就是用。
關於Tensorflow 2.0的發布日期,官方並沒有給出明確時間。但根據開發小組成員透露的消息,我們可以確定它的預覽版會在今年年底發布,官方正式版可能會在2019年春季發布。
所以留給老用戶的時間已經不多了。
Keras(OOP)vs Tensorflow 1.x
在GitHub上,RFC:TensorFlow 2.0中的變數這份意見稿已經被官方接受,它可能是對現有代碼庫影響最大的RFC,值得參考。
我們都知道,在Tensorflow里,每個變數在計算圖中都有一個唯一的名稱,我們也已經習慣按照這種模式設計計算圖:
哪些操作連接我的變數節點:把計算圖定義為連接的多個子圖,並用在內部定義每個子圖,以便定義不同計算圖的變數,並在Tensorboard中獲得清晰的圖形表示。
需要在執行同一步驟時多次使用子圖:一定要用里的參數,不然Tensorflow會生成一個前綴為的新計算圖。
定義計算圖:定義參數初始化節點(你調用過幾次?)。
把計算圖載入到Session,運行。
下面,我們就以在Tensorflow中實現簡單的GAN為例,更生動地展現上述步驟。
Tensorflow 1.x的GAN
要定義GAN的判別器D,我們一定會用到里的參數。因為首先我們會把真實圖像輸入判別器,之後把生成的假樣本再輸進去,在且僅在最後計算D的梯度。相反地,生成器G里的參數不會在一次迭代中被用到兩次,所以沒有擔心的必要。
當這兩個函數被調用時,Tensorflow會默認在計算圖內部定義兩個不同的子圖,每個子圖都有自己的scope(生成器/判別器)。請注意,這個函數返回的是定義好的子圖的張量,而不是子圖本身。
為了共享D這個子圖,我們需要定義兩個輸入(真實圖像/生成樣本),並定義訓練G和D所需的損失函數。
最後要做的是分別定義訓練D和G所需的2個損失函數和2個優化器。
定義損失函數不難,對抗訓練的一個特點是把真實圖像和由G生成的圖像輸入判別器D,由後者輸出評估結果,並把結果饋送給生成器G做參考。這意味著對抗訓練其實是分兩步走,G和D同在一個計算圖內,但在訓練D時,我們不希望更新G中的參數;同理,訓練G時,我們也不希望更新D里的參數。
因此,由於我們在默認計算圖中定義了每個變數,而且它們都是全局變數,我們必須在2個不同的列表中收集正確的變數並正確定義優化器,從而計算梯度,對正確的子圖進行更新。
到這裡,我們已經完成了上面提到的「第3步:定義計算圖」,最後是定義參數初始化節點:
優/缺點
只要正確定義了計算圖,且在訓練循環內和session內使用,上述GAN就能正常訓練了。但是,從軟體工程角度看,它有一些值得注意的點:
用修改由定義的(完整)變數名稱:這其實是對不同scope的變數重新用了一次,導致的結果是定義了新scope下的一組新變數。
布爾標誌可以完全改變調用後的所有行為(定義/reuse)。
每個變數都是全局變數:調用(也就是在下面調用)定義的變數可以隨處訪問。
定義子圖很麻煩:你沒法通過調用獲得一個新的、完全獨立的判別器,這有點違背常理。
子圖定義的輸出值(調用/)只是它的輸出張量,而不是內部所有圖的信息(儘管可以回溯輸出,但這麼做很麻煩)。
定義參數初始化節點很麻煩(不過這個可以用和規避)。
以上6點都可能是用Tensorflow構建GAN的缺點。
Tensorflow 2.x的GAN
前面提到了,Tensorflow 2.x移除了,,,強制轉型到了基於Keras的方法。明年,如果我們想用它構建GAN,我們就必須用定義生成器G和判別器的:這其實意味著我們憑空多了一個可以用來定義D的共享變數函數。
註:明年就沒有了,所以你最好從現在就開始適應用來定義自己的模型,這是過渡到2.x版本的必要準備。
看到和Tensorflow的不同了嗎?在這裡,和都返回了一個,而不僅僅是輸出張量。
在Keras里,變數共享可以通過多次調用同樣的Keras層或模型來實現,而不用像TensorFlow那樣需要考慮變數的scope。所以我們在這裡只需定義一個判別器D,然後調用它兩次。
再重申一遍,這裡我們不需要像原來那樣定義,在定義計算圖時也不用提前擔心變數共享。
之後就是定義G和D的損失函數:
最後,我們要做的是定義分別優化D和G的2個優化器。由於用的是,所以我們不用手動創建要更新的變數列表,的對象本身就是我們要的東西。
截至目前,因為我們用的還是靜態圖,所以還要定義變數初始化節點:
優/缺點
從到過渡:Keras里有所有的對應操作。
幫我們完全省去了變數共享和計算圖重新定義的煩惱。
不是一個張量,而是一個自帶變數的完整模型。
定義變數初始化節點還是很麻煩,但之前也提到了,我們可以用規避。
以上是Tensorflow 1.x和2.x版本的第一個巨大差異,在下文中,我們再來看看第二個差異——Eager模式。
Eager Execution
Eager Execution(動態圖機制)是TensorFlow的一個命令式編程環境,它無需構建計算圖,可以直接評估你的操作:直接返回具體值,而不是構建完計算圖後再返回。它的優點主要有以下幾點:
直觀的界面。更自然地構建代碼和使用Python數據結構,可完成小型模型和小型數據集的快速迭代。
更容易調試。直接調用ops來檢查運行模型和測試更改,用標準Python調試工具獲取即時錯誤報告。
更自然的流程式控制制。直接用Python流程式控制制而不是用計算圖。
簡而言之,有了Eager Execution,我們不再需要事先定義計算圖,然後再在session里評估它。它允許用python語句控制模型的結構。
這裡我們舉個典型例子:Eager Execution獨有的。在計算圖模式下,如果我們要計算某個函數的梯度,首先我們得定義一個計算圖,從中知道各個節點是怎麼連接的,然後從輸出回溯到計算圖的輸入,層層計算並得到最終結果。
但在Eager Execution下,用自動微分計算函數梯度的唯一方法是構建圖。我們得先用根據可觀察元素(如變數)構建操作圖,然後再計算梯度。下面是文檔中的一個原因和示例:
此外,用python語句(如if語句和循環語句)進行流程式控制制區別於靜態圖的,,。
之前官方發布了一個名為Autograph的工具,它的作用是把普通Python代碼轉換成複雜的計算圖代碼,也就是允許用戶用Python直接編寫計算圖。但它指的Python事實上並不是真正意義上的Python(比如必須定義一個函數,讓它返回一個具有指定Tensorflow數據類型的元素列表),也沒法發揮編程語言的強大功能。
就個人而言,我不太喜歡Eager Execution,因為我已經習慣靜態圖了,而這個新改變有點像是對PyTorch的拙劣模仿。至於其他變化,我會在下面以問答方式做簡單介紹。
一問一答
下面是我認為從TensorFlow過渡到TensorFlow 2.0會出現的一些常見問題。
問:如果我的項目要用到tf.contrib怎麼辦?
你可以用pip安裝一個新的Python包,或者把重命名為。
問:如果在Tensorflow 1.x里能正常工作的東西到2.x沒法運行了怎麼辦?
不應該存在這種錯誤,建議你仔細檢查一下代碼轉換得對不對,閱讀GitHub上的錯誤報告。
問:我的項目在靜態圖上好好的,一放到Eager Execution上就不行了怎麼辦?
我也遇到了這個問題,而且目前還不知道具體原因。所以建議先不要用Eager Execution。
問:我發現Tensorflow 2.x里好像沒有某個tf.函數怎麼辦?
這個函數很有可能只被移到別的地方去了。在Tensorflow 1.x中,很多函數會有重複、有別名,Tensorflow 2.x對這些函數做了統一刪減整理,也移動了部分函數的位置。你可以在RFC:TensorFlow命名空間里找到將要新增、刪除、移動的所有函數。官方即將發布的工具也能幫你適應這個更新。
小結
看了這麼多,相信讀者現在已經對Tensorflow 2.x有了大致了解,也有了心理準備。總的來說,正如大部分產品都要經歷更新迭代,我認為Tensorflow 2.x相比Tensorflow 1.x會是有明顯改進的一個版本。最後,我們再來看一下Tensorflow的發展時間軸,回憶過去三年來它帶給我們的記憶和知識。
原文地址:pgaleone.eu/tensorflow/gan/2018/11/04/tensorflow-2-models-migration-and-new-design/
(本文授權轉載自「論智」,ID:jqr_AI)
【加入社群】
新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號:aiera2015_2入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。


※最高231萬美元!谷歌、FB、亞馬遜、微軟等巨頭程序員薪資曝光
※實習申請寶典!2019年度AI名企實習機會匯總
TAG:新智元 |